Por: Diego Garagorry
La inteligencia artificial generativa (genAI, por su sigla en inglés) fue ganando espacio rápidamente en las agendas corporativas. Su presencia ya se observa en aplicaciones que van desde chatbots para atención al cliente hasta herramientas de generación de contenido y apoyo a la toma de decisiones. Sin embargo, detrás de este entusiasmo creciente, es posible identificar un patrón de errores que se repite entre las empresas que adoptan la tecnología sin la preparación estratégica adecuada.
En lugar de preguntarse “¿qué puede hacer esta tecnología para mi empresa?”, muchas compañías parten de la herramienta en sí, ignorando el problema que deberían resolver. El resultado son soluciones desconectadas del negocio, con alto costo, bajo retorno y poca adopción interna. Por lo tanto, implementar no es suficiente: es la integración lo que garantiza impacto.
En este proceso, entre los errores más comunes se encuentran la ausencia de una prueba de concepto, la elección apresurada de modelos personalizados y la falta de indicadores claros para medir el éxito. Al mismo tiempo, muchas organizaciones subestiman los desafíos relacionados con la gobernanza de datos, la privacidad y la seguridad. Los modelos generativos sólo son eficaces cuando tienen acceso a datos organizados, relevantes y protegidos; y eso requiere tiempo, estructura y estrategia.
Las llamadas alucinaciones, por ejemplo, siguen siendo un desafío importante. Se producen cuando el modelo genera información que parece correcta pero es falsa, inventada o no está respaldada por fuentes o evidencias verídicas. Esta limitación se ha ido mitigando con las actualizaciones más recientes, que incluyen modelos que consultan bases de conocimiento utilizando técnicas como RAG.
Según un artículo publicado por ACM en mayo de 2024, la tabla de clasificación mantenida por Vectara indicaba tasas de alucinación entre el 2,5 % y el 8,5 % en los principales modelos de la época. Actualmente, estas cifras cayeron por debajo del 2% entre los grandes proveedores de LLM. En particular, los nuevos modelos GPT-5, de OpenAI, y Gemini 2.5 Pro, de Google, obtuvieron resultados menores a 1,5% de alucinaciones. Si bien los resultados son positivos, aún se requieren mecanismos de mitigación cuando se trata de aplicaciones críticas.
Desde Nearsure, una compañía de Nortal, publicamos este año un white paper sobre aplicaciones de genAI en el que se abordan los principales obstáculos que podrían evitarse a la hora de adoptar genAI. El primero es comenzar sin haber identificado un problema empresarial que se quiera resolver, lo que conduce a soluciones genéricas y desconectadas de resultados tangibles. En segundo lugar, muchas empresas prescinden de la prueba de concepto (PoC), omitiendo la validación de requerimientos y arquitecturas antes de escalar. El tercero es no preestablecer métricas claras de éxito, lo que dificulta medir el impacto en productividad, costos o calidad. Para lograr una adopción exitosa, se deben definir métricas y umbrales de decisión por etapa (PoC, MVP, producción, escalado) y una gobernanza que aporte trazabilidad de extremo a extremo y visibilidad operativa. Con ello, se mantendrá un ciclo de retroalimentación (feedback loop) que facilite aprender, corregir y avanzar con evidencia…