Autor: ALEXIS IBARRA O.
El vertiginoso avance de la IA generativa a dos años de la creación de ChatGPT
El vertiginoso avance de la IA generativa a dos años de la creación de ChatGPT Fue el precursor, pero abrió las puertas a una revolución: hoy existen desde herramientas que crean pódcast en pocos minutos con dos voces virtuales hablando de un texto que se le entrega hasta la creación de avatares para videos. Y muchas veces no hace falta otro dispositivo que un celular. Se lanzó en noviembre de 2022:ChatGPT va a estar de cumpleaños.
Hace dos años, el 30 de noviembre de 2022, se dio a conocer este chatbot de inteligencia artificial que hacía cosas que hasta entonces parecían imposibles: crear ensayos a partir de unas pocas instrucciones, escribir correos laborales, crear código computacional sin necesidad de que el usuario supiera programar y hasta hacer poesías.
Esta revolución de la inteligencia artificial generativa (IA generativa, que puede crear contenido como texto o imágenes a partir de instrucciones) comenzó a masificarse, y ahora ya forma parte de la vida de muchas personas con distintas aplicaciones. Su crecimiento ha sido vertiginoso y lo que asombraba ayer deja paso a algo más asombroso a la semana siguiente. A Cuky Pérez, doctora en Economía y líder en Ciencia de Datos, le ha llamado la atención la sorprendente evolución de MidJourney, herramienta para crear imágenes a partir de un prompt o comando. “Hace un año y medio, MidJourney ya era sorprendente”, dice Pérez. Pero había ciertas dificultades para que los prompts o las instrucciones que se le entregaban tuvieran el resultado deseado, añade.
“Además, ciertas imágenes, como las de figuras humanas, eran creadas con errores”. Para ella, la actual versión (la 6.1) “ha mejorado significativamente e n l a c o m p r e n s i ó n d e e s t o s prompts”, es decir, entiende mejor las instrucciones del usuario para obtener el resultado deseado. Además, dice, se logran imágenes de alta calidad.
Coincide con esta opinión Domingo Mery, académico de la Facultad de Ingeniería UC e investigador del Centro Nacional de Inteligencia Artificial (Cenia). “En los últimos años ha mejorado tanto la calidad como la eficiencia de los modelos, y esto permite generar imágenes y videos con una alta fidelidad y con una muy buena resolución”. Para Pérez, otra herramienta asombrosa es NotebookLM, “que revoluciona la creación de pódcast. Permite transformar documentos en conversaciones de audio estilo pódcast en cosa de minutos”, añade.
NotebookLM fue creado porGoogle y genera pódcast (por ahora solo en inglés) donde dos hablantes virtuales dialogan de forma muy natural sobre un tema en cuestión, interrumpiéndose, bromeando y desarrollando un hilo de conversación a partir de lo que el usuario le ha entregado como insumo: una novela, un ensayo, un artículo periodístico o hasta un currículum. En estos dos años, un salto fundamental de la IA generativa es que ahora ya es multimodal, explica Rolando Martínez, especialista en IA y gerente ejecutivo de Esfera IA. “Además de texto, son capaces de describir lo que pasa en las imágenes y el video en for-ma automatizada”, dice.
Esta característica permite funcionar en ambos sentidos: ya entiende instrucciones por voz, así como lo que aparece en una imagen o un video, y al otro extremo del proceso puede generar no solo texto, sino que videos, sonidos y hasta canciones.
“Udio tiene la habilidad de generar composiciones musicales personalizadas, permitiendo a los usuarios describir la música que desean en términos de género, instrumentos y otros parámetros”, dice Jaime Caiceo, socio de Consultoría en IA y Datos de EY. Udio genera una canción con letra que rima, instrumentación yhasta con partes reconocibles como un coro o puente. Para Mery hay herramientas que tienen gran potencial. “Sintesia, por ejemplo, es un plataforma para crear videos. En ellos, avatares, o sea, personas que son artificiales, pueden hablar y actuar según un guion.
Uno escribe, por ejemplo, una presentación en PowerPoint, lo entrega como insumo y este avatar habla sobre el contenido de la presentación como si fuera un ser humano”. Más personalizaciónPara Pérez, otro avance significativo es la capacidad que tienenResguardos, regulación y desafíos“Uno de los principales desafíos que plantea la IA generativa es el uso ético de estas tecnologías, ya que pueden ser utilizadas para generar desinformación, contenido malicioso y deepfakes, que son audios, imágenes o videos falsos, pero increíblemente convincentes y realistas”, dice Caiceo.
Para él, también es “importante la transparencia en los algoritmos y en los procesos de toma de decisiones, lo que es esencial para evitar sesgos y posibles discriminaciones”. En tanto, Pérez cree que es esencial “la protección de la propiedad intelectual, especialmente en relación con los datos utilizados para entrenar estos modelos”. “También es crucial identificar y comprender los riesgos asociados con esta tecnología para establecer regulaciones que los mitiguen”, añade.
Y si bien, dice la especialista, algunas empresas tecnológicas critican regulaciones como la europea, diciendo que frenan la innovación, “considero que las consecuencias potenciales de esta tecnología son muy significativas, por lo que es esencial regular proactivamente”. los usuarios para personalizar la IA generativa para crear GPT propios.
Así, instituciones y personas pueden añadir su propia información para que la IA generativa haga cosas para ellos, como, por ejemplo, que un colegio pueda subir todos sus reglamentos y un apoderado, consultar al GPT personalizado para saber qué hacer si debe retirar a su hijo antes para ir al médico.
Martínez menciona como un avance el hecho de que se hayan creado modelos de IA más pequeños, “lo que ha permitido que las personas los puedan hacer funcionar en dispositivos como celulares, computadores personales y estaciones de trabajo, haciendo la mayoría de las tareas que necesitan”, agrega.
“Al principio, se hablaba de que alucinaba”, dice Fernando Sánchez, gerente general de Fundación País Digital, para referirse a que la IA generativa entregaba información que no era verdadera, ya que la inventaba o cruzaba datos. “Pero a medida que los modelos se han afinado y se han implementado resguardos, esas respuestas erróneas o inventadas son cada vez menos”, añade. “En mi opinión, el principal avance de la IA generativa ha sido el alto nivel de democratización alcanzado en su acceso. Esto ha permitido una adopción acelerada y masiva”, añade Caiceo. AIROPODARENEG. Esta imagen fue creada con inteligencia artificial generativ