Autor: Agencia AP
Los pioneros en la “enseñanza” a las inteligencias artificiales
Los pioneros en la “enseñanza” a las inteligencias artificiales 66Estos científicos tomaron prestadas ideas de la psicología y la neurociencia sobre la forma en que las neuronas buscan placer en su respuesta a recompensas o castigos”. asombrosas y maravillosas”, pero no son el “producto final” y podrían funcionar mejor, manifestó Sutton. “Es intrínsecamente parte de la empresa de la IA”, puntualizó Sutton. “Estamos tratando de entendernos a nosotros mismos y, por supuesto, de hacer cosas que puedan funcionar incluso mejor. Tal vez para convertirnos en tales cosas”, concluyó.
Omseñar a las máquinas E: forma parecida a los lentrenadores de animales que moldean el comportamiento de perros ocaballos ha sido un método importante para desarrolar la inteligencia artificial y uno que fue reconocido hace unos días con el máximo galardón en informática. Dos pioneros en el campo del aprendizaje por refuerzo, Andrew Barto y Richard Sutton, fueron los ganadores del Premio A.M. Turing de este año, el equivalente al Nobel en el mundo tecnológico. La investigación que Barto, de 76 años, y Sutton, de 67, comenzaron a finales de la década de 1970 allanó el camino para algunos de los avances en inteligencia artificial de la última década. Su trabajo giraba en torno a emplear máquinas denominadas “hedonistas” que podían adaptar continuamente su comportamiento en respuesta a señales positivas. El aprendizaje por refuerzo es lo que llevó aun programa informático de Google a vencer a los mejores jugadores humanos de go, un antiguo juego de mesa chino, en 2016 y 2017. También ha sido una técnica clave para mejorar herramientas de inteligencia artificial populares como ChatGPT, optimizar el coy ayudar mercio financiero a una mano robótica a resolver un cubo de Rubik. Pero Barto dijo que el campo “no estaba de moda” cuandoél y su estudiante de doctorado, Sutton, comenzaron a elaborar sus teorías y algoritmos en la Universidad de Massachusetts, Amherst. “Estábamos un poco en la oscuridad”, aclaró Barto en una entrevista con The Associated Press. “Por esoLOS CIENTÍFICOS DECIDIERON EMPLEAR EL APRENDIZAJE POR REFUERZO, SENTANDO UNA DE LAS BASES DEL DESARROLLO DE LA INTELIGENCIA ARTIFICIAL castigos.
En un artículo fundamental publicado a principios de la década de 1980, Barto y Sutton aplicaronsu nuevo enfoque auna tarea específica en un mundo simulado: equilibrar un palo en un carro en movimiento para evitar que se Caiga. Los dos científicos informáticos más tarde coescribieron un libro de texto muy utilizado sobre el aprendizaje por refuerzo.
“Las herramientas que desarrollaron siguen siendo un pilar central delauge dela inteligencia artificial y han generado avances importantes, atraído legiones dejóvenes investigadores y impulsado miles de millones de dólares en inversiones”, afirmó Jeff Dean, científico jefe de Google, en un comunicado escrito. En una entrevista conjunta Barto y con AP, Sutton no siempre coincidieron en su valoración de los riesgos delos agentes de IA que intentan mejorarse así mismos de forma constante.
También distinguieron sutrabajo dela rama de la tecnología de IA generativa que ahora es tendencia, representada en los grandes modelos de lenguaje detrás de los chatbots creados por OpenAl, Google y otros gigantes tecnológicos que imitan la escritura humana y otros medios.
“La gran elección es, ¿intentas aprender de los datos delas personas, ointentas aprender de la vida y la experiencia de un agente (1A)?”. dijo Sutton, Sutton ha desestimado lo que describe como preocupaciones exageradas sobre la amenaza de la IA para la humanidad, mientras que Barto no estuvo de acuerdo y dijo que “uno debe ser consciente de las posibles consecuencias inesperadas”. Barto, retirado desde hace 14 años, se describe a sí mismo como un ludita, mientras que Sutton recibe con los brazos abiertos un futuro que espera tenga seres de mayor inteligencia que los humanos actuales, una idea a veces conocida como poshumanismo. “Las personas son mámáquinas Son ANDREW BARTO, es tan gratificante recibir este premio, ver que esto se está reconociendo más como algo relevante e interesante. En los primeros días, nolo era”, acotó. Google patrocina el premio anual de un millón de dólares, que fue anunciado el miércoles por la Association for Computing Machinery. Barto, ahora retirado de la Universidad de Massachusetts, y Sutton, un profesorveterano enla Universidad de Alberta en Canadá, noson los primeros pioneros de la inteligencia artifiRICHARDS. SUTTON lleva el nombre del matemático británico, descifrador de códigos y estudioso temprano de la IA Alan Turing.
Pero su investigación ha buscado directamente responder al desafío de Turing en 1947 de crear una “pueda que máquina aprender de la experiencia”, lo que Sutton describe como “sin duda la idea esencial del aprendizaje por refuerzo”. En particular, tomaron prestadas ideas de la psicología y la neurociencia sobrela forma en quelas neuronas buscan placer en su respuesta a recompensas o cial en ganar el premio que quinas.. Andrew Barto y Richard Sutton, quien hace algunos días fueron reconocidos con el premio Turing, se plantearon entrenar a los agentes digitales de una forma parecida a la forma en que se adiestra a los animales. SHUTTERSTOCK