Autor: Por Agencias
Los pioneros en la “enseñanza” a las inteligencias artificiales
Los pioneros en la “enseñanza” a las inteligencias artificiales Ganaron este año el equivalente al Nobel en el mundo tecnológico Los pioneros en la "enseñanza" las inteligencias artificiales Andrew Barto y Richard Sutton, quien hace algunos días fueron reconocidos con el premio Turing, se plantearon entrenar a los agentes digitales de una forma parecida a la forma en que se adiestra a los animales.
Por Agencias nseñar a las máqui nas deforma parecida a los entrenadores de animales que moldean el comportamiento de perroso caballos ha sido un méto: do importante para desarrollar la inteligencia artificial y uno que fue reconocido hace unos días con el máximo galardón en informática. Dos pioneros en el campo del aprendizaje por refuerzo, An: drew Barto y Richard Sutton, fueron los ganadores del Pre mio A.M. Turing de este año, el equivalente al Nobel enel mundo tecnológico.
La investigación que Barto, de 76años, y Sutton, de 67, comen zaron a finales de la década de 1970 allanó el camino para al: gunos de los avances en inteli gencia artificial de la última década. Su trabajo giraba en torno aemplearmáquinas denominadas "hedonistas" que podían adaptar continuamente su comportamiento en respuestaa señales positivas. El aprendizaje por refuerzo es lo que llevó a un programa informático de Google a vencera los mejores jugadores humanos de go, un antiguo juego de mesa chino, en 2016 y 2017. También ha sido una técnica clave para mejorar herramientas de inteli gencia artificial populares como ChatGPT, optimizar el comercio financiero y ayudar a una mano robótica a resolver un cubo de Rubik.
Pero Barto dijo que el campo "no estaba de moda"cuando él y su estudiante de doctorado, Sutton, comenzaron a elaborar sus teorías y algoritmos en la Universidad de Massachusetts, Amherst. "Estábamos un poco en la os curidad", dijoBarto en una entre vista con The Associated Press. "Poresoestan gratificanterecibir este premio, ver que esto se está reconociendo más como algorelevante e interesante. En los pri meros días, no lo era. " Google patrocina el premio anual de un millón de dólares, que fue anunciado el miércoles por la Association for Compu: ting Machinery.
Barto, ahora retirado de la Uni versidad de Massachusetts, y Sutton, un profesor veterano en la Universidad de Alberta en Canadá, no son los primeros pioneros de lainteligencia artificialen ganarel premio que lleva elnombre del matemático británico, descifrador de códigos y estudio. so temprano de la IA Alan Turing.
Pero su investigación ha buscado directamente responder al desafío de Turing en 1947 de crear una máquina que "pueda aprender de la experiencia", lo que Sutton describe como "sin duda laidea esencial del aprendi zaje por refuerzo". En particular, tomaron prestadas ideas de la psicología y la neurociencia sobre la forma en que las neuronas buscan placer en su respuesta a recompensas 0 castigos.
En un artículo funda: mental publicado principios de la década de 1980, Barto y Sutton aplicaron su nuevo enfoque a una tarea específica en un mundo simulado: equilibrar un palo en un carroen movimiento para evitarquese caiga.
Losdos cientí ficos informáticos más tarde coescribieron un libro de texto muy utilizado sobre el aprendi: zaje porrefuerzo. "Las herramientas que desarrollaron siguen siendo un pilar central del auge de la inteligencia artificial y han generado avances importantes, atraído legionesdejóvenesinvestigadores y impulsado miles de millones y impulsado miles de millones Los científicos decidieron emplear el aprendizaje por refuerzo, sentando una de las bases del desarrollo de la inteligencia artificial. Andrew Barto. Andrew Barto. Richard S. Sutton. de dólares en inversiones", dijo Jeff Dean, científico jefe de Google, en un comunicado escrito. En una entrevista conjunta con AB Barto y Sutton no siem: pre coincidieron en su valoración de los riesgos de los agentes de IA que intentan mejorarse a sí mismos de forma constante.
También distinguieron su trabajo de la rama de la tecnología de IA generativa que ahora es tendencia, representa: da en los grandes modelos de lenguaje detrás de los chatbots creados por OpenAl, Google y otros gigantes tecnológicos que imitan la escritura humana y otros medios. "La gran elección es, ¿intentas aprender delos datos de las personas, o intentas aprender de la vida y la experiencia de unagente(1A)?" dijo Sutton.
Sutton ha desestimado lo que describe como preocupaciones exageradas sobre la amenaza de exageradas sobre la amenaza de la lA para la humanidad, mientras que Barto no estuvo de acuerdo y dijo que "uno debe ser consciente de las posibles consecuenciasinesperadas". Barto, retirado desde hace 14 años, se describe a símismo como un ludita, mientras que Sutton recibe con los brazos abiertos un futuro que espera tenga seres de mayor inteligencia que los humanos actuales, unaidea a veces conocida como poshumanismo. "Las personas son máquinas.
Son máquinas asombrosas y maravillosas", pero no son el "producto final" y podrían funcionar mejor, dijo Sutton. "Es intrínsecamente parte de laempresade la A", dijo Sutton. "Estamos tratando de entendernos nosotros mismos y, por supuesto, de hacer cosas que puedan funcionar incluso mejor. Tal vez para convertimos en talescosas". lescosas"..