Esta semana debuta LatamGPT, el primer modelo de lenguaje creado en Chile para la región
Esta semana debuta LatamGPT, el primer modelo de lenguaje creado en Chile para la región DF DIARIO FINANCIERO® DF LAB INNOVACIÓN, STARTUPS & TECH POR RENATO OLMOS Era febrero de 2025 cuando, en medio de la Cumbre para la Acción sobre la IA en París, Francia, la entonces ministra de Ciencia, Tecnología, Conocimiento e Innovación, Aisén Etcheverry, y el gerente del Centro Nacional de Inteligencia Artificial (Cenia), Rodrigo Durán, revelaban a DF que desde Chile se estaba construyendo el primer modelo de lenguaje con foco regional: LatamGPT.
A un año de ese anuncio, este martes el Cenia presentará y lanzará oficialmente el modelo, que estuvo en desarrollo tres años, en una ceremonia a la que se espera que asista el Presidente Gabriel Boric. El proyecto apunta a ofrecer un modelo de inteligencia artificial (IA) público, abierto y entrenado con datos latinoamericanos, en contraste con los grandes modelos comerciales que hoy dominan el mercado global.
Según el director del Cenia, Álvaro Soto, la decisión de desarrollar un modelo de lenguaje propio responde a una convicción estratégica. "Quedarnos afuera de una tecnología de este nivel es una opción pobre", sostuvo, subrayando que hoy la mayoría de los modelos se desarrollan en el hemisferio norte.
A eso sumó un segundo factor: los modelos actuales están entrenados mayoritariamente con datos ajenos a la región. "Los propios modelos reconocen que solo entre 2% y 3% de su información proviene de Latinoamérica, pese a que la región representa cerca del 8% de la población mundial", explicó. Con LatamGPT, dijo, se busca invertir esa lógica, entrenando el modelo casi exclusivamente con datos latinoamericanos para comprender mejor el idioma, la cultura, la historia y los problemas locales. Con el avance del proyecto apareció además una tercera motivación, la colaboración regional.
A diferencia de los desarrollos cerrados de grandes empresas, LatamGPT se concibió como una iniciativa colectiva, con participación de unas 70 organizaciones de distintos países, muchas de ellas aportando datos de manera directa -bibliotecas, archivos históricos y colecciones académicasen Álvaro Soto, director del Cenia. lugar de recurrir al scraping masivo de la web. Tres años de trabajo y pocos recursos El proyecto estaba en los planes del Cenia desde su creación hace cuatro años. El punto de inflexión llegó en 2022, tras la irrupción de ChatGPT, y ahí fue cuando el equipo decidió acelerar una iniciativa que hasta entonces avanzaba lentamente. El desarrollo estuvo marcado por fuertes restricciones presupuestarias. Mientras proyectos similares han costado millones de dólares, CVPRAUM LatamGPT se construyó con apenas US$ 550 mil en financiamiento directo, provenientes principalmente de la CAF y recursos propios. "La colaboración fue clave. Sin eso, este proyecto no existiría", reconoció Soto. Desde el punto de vista técnico, señaló que LatamGPT es un modelo de lenguaje de texto y no un chatbot. Cuenta con cerca de 70 mil millones de parámetros, un tamaño relevante, pero muy inferior al de los modelos de frontera desarrollados por las grandes tecnológicas y startups. Soto fue explícito al mencionar que no se busca competir en razonamiento complejo con sistemas como ChatGPT, Claude o Gemini. "Si le haces una pregunta muy sofisticada, otros modelos probablemente lo harán mejor", admitió. La primera versión tampoco está pensada para un uso masivo por millones de personas. Debido a limitaciones de infraestructura, no se lanzará como un chat abierto, sino como un modelo base para que terceros desarrollen aplicaciones. El entrenamiento inicial se realizó en la nube de Amazon Web Services, gracias a créditos otorgados a través del Data Observatory. Las próximas versiones, en tanto, se entrenarán en infraestructura local.
En ese ámbito, la Universidad de Tarapacá invirtió cerca de US$ 5 millones en un clúster de GPU de Nvidia H200 -que ahora tiene que ser montado-, mientras que un proyecto Corfo por $ 7.000 millones permitirá habilitar un centro de inferencia en la Universidad de Chile. En cuanto al acceso, LatamGPT será 100% gratuito y de código abierto. El modelo, los datos y la documentación técnica estarán disponibles en repositorios públicos en las próximas semanas, con * restricciones solo para grandes empresas que busquen usarlo con fines comerciales a gran escala. Casos de uso Los primeros casos de uso que visualizan en el Cenia están en educación, academia e innovación.
El objetivo es permitir que investigadores puedan experimentar con modelos grandes -algo hoy limitado por costosy habilitar a emprendedores para desarrollar aplicaciones en áreas como salud, agricultura, servicios públicos y productividad con datos y contexto local. De cara al futuro, el lanzamiento de esta semana es solo un primer paso. El plan es avanzar hacia versiones especializadas y sumar nuevas capacidades a medida que exista mayor infraestructura.
Para Soto, el éxito de LatamGPT se medirá en dos dimensiones: la adopción -cuántas instituciones, investigadores y emprendedores lo usany si el proyecto logra cerrar parte de la brecha tecnológica y activar un ecosistema regional de IA. "No es el fin de una etapa, sino el inicio. Queremos que la posta la tomen otros y que el Cenia sea un actor más en un ecosistema muy complejo que tome forma en Latinoamérica", concluyó. 550 US$ MIL DEMANDÓ EL DESARROLLO DE LATAMGPT. TAMARA SILVA D.. Luego de tres años de desarrollo, este martes el Cenia presentará el modelo público, abierto y entrenado con datos latinoamericanos para usos en educación, academia e investigación.