Autor: Agencia AP
Los p!oneros en la “enseñanza” a las inteligencias artificiales
Los p! oneros en la “enseñanza” a las inteligencias artificiales Andrew Bario y Richard Sutton quien hace algunos días fuemn reconocidos con el premio Turing, se plantea ron entrenara las agentes digitales de una forma parecida a la forma en que se adiestro a los animales.
Agencia AP Enseñara Enseñara Las ináquinasde forma parecida a los entrenadores entrenadores de animales que moldean el comportamiento comportamiento de perrosocaballos ha sido un método importante pare pare desarroflar la intehgenciaartificial intehgenciaartificial y uno que fue reconocido reconocido hace unos días con el máximo máximo galardón en informática. DOS pioneros en el campo del aprendizaje por refuerzo, Anclrew Bailo y Richard Sutton, fueron los ganadores del PremioA.M. Turingdeeste año, el equivalenteal Nobelen el mundo tecnológico.
La investigación que Harto, de 76 años, y Sution, de 67, comenzaron comenzaron a finales de la década década de l970 allanó el camino pare pare algunos de los avances en inteligencia inteligencia artificial de la última década. Su trabajo giraba en torno a emplear máquinas denominadas denominadas “hedonistas” que podían adaptar continuasnente continuasnente su comportamiento en respuesta respuesta a señales positivas. Elaprendizajeporrefuerzo es lo que llevó a un programa infonmiticodeGoogleavencer a los mejores jugadores humanos humanos de ge, un antiguo juego de mesa chino, en 2016 y 2017.
También ha sido una técnica clave para mejorar herramientas herramientas de inteligencia artificial populares populares como ChatGPT, optimizar optimizar el comercio financiero y ayudar a una mano robótica a resolver un cubo de Rubik, Pero Bario dijo que el campo campo “no estaba de moda” cuando cuando él y su estudiante de doctorado, doctorado, Sutton. comenzaron a elaborar sus teorias y algoritmos algoritmos en la Universidad de Massachusetts, Amhersl. “Estábamos un poco en la oscundad”. dijo Barto en una entrevista con The Associated Posas. “Por eso es tan gratificante gratificante recibir este premio, ver que esto te está reconociendo más como algo relevante e interesante. interesante. En los primeros días, días, no lo era” Gocgle patrocinael premio;1] 4;0] r 1 Li ANDREW BARIO. 9 LOS CIENTÍFICOS DECIDIERON EMPLEAR El APRENDIZAJE POR REFUERZO.
SANTANDO UNA DE LAS BASAS DEL DESARROLLO DE LA INTELIGENCIA ARTIFICIAL Estos científicos tomaron prestadas ideas de la psicología y la neurociencia sobre la forma en que las neuronas buscan placer en su respuesta a recompensas o castigos. placer en su respuesta a recompensas recompensas o castigos.
En un articulo fundamental publicadosprincipíce publicadosprincipíce de la década de 1980, Bario y Sution aplicaron su nuevo enfoque a una tares especifica en un mundo simulado: simulado: equilibrar un palo en un carro en movimiento para cvitarquesecaiga. cvitarquesecaiga. Losdoscientificos Losdoscientificos informáticos más tarde roescribieron un libro de texto muy utilizado sobre elaprendiraje elaprendiraje por refuerzo.
“Lasherramientasquedezarrollaron “Lasherramientasquedezarrollaron siguen siendo un pilar central del auge de la inteligencia inteligencia artificial y han generado avaoresimportantes, atraidolegiotsisdejécenes avaoresimportantes, atraidolegiotsisdejécenes investigadores y impulsado miles de millones de dólares en invones”, dijo JeffDean, cientificojefe de Goo en un comunicado escrito. En una entrevista conjunta con AP, Harto y Sutton nosiempro nosiempro coincidieron en su valoración valoración de los riesgos de los agentes agentes de lA que intentan mejorarse mejorarse a sí mismos de fonnaconstanto. fonnaconstanto. También distinguieron su trabajo de la rama de la tecnología tecnología de lA generativa que ahora es tendencia, representada representada en los grandes modelos de lenguajedetrásde los chatbots creados por OpenAl.
Google y otros gigantes tecnológicos que imitan la escritura humanay humanay otros medios, “La gran elección es, ¿inlentas ¿ inlentas aprenderde los datos de las personas, o intentas aprender aprender de la vida y la experiencia de un agente (lA)?” dijo Sutto.
Sutton ha desestimado lo que describe como preocupacionesexcgeradassobrelaamenazadelalA preocupacionesexcgeradassobrelaamenazadelalA parala humanidad, mientras que Harto noestuvode acuerdo y dijo que “uno debe ser consciente de las posibles cotoecuendas iuesperadas”. Harto, retirado desde hace l4años. sedescribeasinsisnio como un ludita. mientras que Sutton recibe con los brazos abiertos un futuro que espera tenga seres de mayor inteligen cia que los humanos actuales, anual de un millón de dólares, que fue anunciadoel miercoles por la Association iór Computing Computing Machinery.
Bario, ahora retirado de la Universidad de Massachusetts, y Suttan. unprofmorveteranoen la Universidad deAlberta en Canada, Canada, no son los pnmemspionetos pnmemspionetos dela inteligencia artilicial en ganar el premio que lleva el combredel matemáticobritático, matemáticobritático, descifradorde códigos y estudioso temprano de la lA Alan TUrin Petosuinvessigaaónha buscado directamente responder responder al desafio de Tlsringen 1947 decrearunamáquinaque”puedaapivnderdela decrearunamáquinaque”puedaapivnderdela experiencia, lo que Sution describe como “sin duda la idea esencial del aprendizaje por refuer-zo”. En particular, tomaron prestadas ideas de la psicología y la neurociencia sobre la forma forma enque las neuronas buscan una idea a veces conocida como como poshumanismo. “Las personas son máqui itas Son máquinasasombrosas y maravillosas”, pero no son el “producto final” y podrían fundonar fundonar mejor, d9oSutton. “Es intrínsecamente parte de la empresa de la lA”. dijo Sutton. “Estamos tratando de entendernos a nosotros mismos mismos y. por supuesto, de hacer cosas que poedan funcionariocluso funcionariocluso mejor. Tal vez para convertirnos convertirnos en tales cosas”, C.