Autor: Agencia AP
Los pioneros en la "enseñanza" as inteligencias artificiales
Los pioneros en la "enseñanza" as inteligencias artificiales Andrew Barto y Richard Sutton, quien hace algunos días fueron reconocidos con el premio Turing, se plantearon entrenar a los agentes digitales de una forma parecida a la forma en que se adiestra a los animales. a los agentes digitales de una forma parecida a la forma en que se adiestra a los animales. é Agencia AP forma parecida a los entrenadores de animales que moldean el comportamiento de perros o caballos ha sido un método importante para desarrollar la inteligencia artificial y uno que fue reconocido hace unos días con el máximo galardón en informática. Dos pioneros en el campo del aprendizaje por refuerzo, Andrew Barto y Richard Sutton, fueron los ganadores del Premio A.M. Turing de este año, el equivalente al Nobel en el mundo tecnológico. Lainvestigación que Barto, de76años, y Sutton, de 67, co'menzaron a finales de la década de 1970 allanóelcamino paraalgunos delos avances eninteligencia artificial de la última década.
Su trabajo giraba en torno a emplear máquinas denominadas "hedonistas" que podían adaptar continuamen8 tesu comportamiento en res--LOS CIENTÍFICOS DECIDIERON EMPLEAR EL APRENDIZAJE POR REFUERZO, SENTANDO UNA DE LAS BASES DEL DESARROLLO DE LA INTELIGENCIA ARTIFICIAL puesta a señales positivas. Erin »or»»» »or»»» Elaprendizaje por refuerzo placer en su respuesta a re--tante. También distinguieron Estos científicos es lo que llevó a un programa compensas o castigos.
En un sutrabajo delarama dela tectomaron prestadas informático de Googlea vencer artículo fundamental publica--nología de IA generativa que ideas de la alos mejores jugadores humanos de go, un antiguo juego de mesa chino, en 2016 y 2017.
También ha sido una técnica clave para mejorar herramientas de inteligencia artificial podoaprincipiosdeladécadade ahora es tendencia, represen -¡ gi de ep Y su nuevo enfoque a una tarea lenguaje detrás delos chatbots específica en un mundo simu creados por OpenAI, Googley la forma en que las lado: equilibrar un palo enun otros gigantes tecnológicos NEUFONas buscan carro en movimiento paraevi--que imitanla escritura huma-placer en su que imitanla escritura huma-placer en su que imitanla escritura huma-placer en su pulares como Sacro optitarquese caiga.
Los doscientírespuesta a mizar el comercio financiero y ficos informáticos más tarde ayudar a una mano robótica a coescribieronun bro detexto tentasaprenderdelos datosde "COMPENSAS O resolver un cubo de Rubik. muy utilizado sobreelaprendi las personas, o intentas apren CASIgOS. Pero Barto dijo que elcamzaje por refuerzo. der dela vida y la experiencia po "no estaba de moda" cuan"Lasherramientas quedes» de un agente(1A)?" dijo Sutton. do él y suestudiante dedocto ANDREW BARTO. RICHARD S.
SUTTON rrollaronsiguensiendo un pilar Sutton ha desestimado lo unaidea a veces conocida corado, Sutton, comenzaron a central del auge dela inteligen-que describe como preocupa mo poshumanismo. elaborar sus teorías y algorit-anual de un millón de dólares, tudioso temprano delaJA Alan cia artificial y han generado cionesexageradassobrelaame"Las personas son máquimos en la Universidad de quefueanunciadoel miércoles Turing Perosuinvestigaciónha avancesimportantes, atraídole-nazadelalA parala humanidad, nas.
Son máquinas asombrosas Massachusetts, Amberst. porla Association for Compu-buscado directamenterespon glonesdejóvenes investigadores mientras que Bartonoestuvode y maravillosas", pero noson. el "Estábamos un poco enla tingMachinery. deral desafío de Turingen 1947 yimpulsado miles de millones acuerdo y dijo que "uno debe "producto final" y podrían funoscuridad", dijo Bartoenuna Barto, ahoraretirado dela decrearunamáquina que"pue dedólares eninversiones", dijo. ser consciente de las posibles cionar mejor, dijo Sutton. entrevista con The Associated Universidad de Massachusetis, y daaprender dela experiencia", JeffDean, cientficojefe de Goo-consecuencias inesperadas". "Es intrínsecamente parte Press. "Por eso estan gratifi-Sutton, un profesorveteranoen lo que Sutton describe como gle, enun comunicado escrito.
Barto, retirado desde hace de la empresa de la 1A", dijo cante recibir este premio, ver laUniversidad de AlbertaenCa "sin duda la idea esencial del Enunaentrevista conjunta 14años, se describe asímismo Sutton. "Estamos tratando de queesto se está reconociendo nadá, nosonlos primeros pione-aprendizaje por refuerzo". con AP, Barto y Sutton no siem como un ludita, mientras que entendernos a nosotros mismás como algo relevante ein-rosdelainteligenciaartificialen En particular, tomaron precoincidieron ensu valora Sutton recibe con los brazos mos y, por supuesto, de hacer teresante.
En los primeros dí-ganar el premio que lleva el prestadasideas dela psicología ción delos riesgos delos agen abiertos un futuro que espera cosas que puedan funcionarinas, nolo era" nombredel matemáticobritáni-y la neurociencia sobre la for tesdelA queintentan mejorar tengaseres demayorinteligen cluso mejor. Tal vez para conGoogle patrocinaelpremio co, descifrador de códigos yes maenquelas neuronas buscan sea sí mismos de forma cons cia que los humanos actuales, vertimosen tales cosas". 03.