Autor: Agencia AP
Los pioneros en la “enseñanza” a las inteligencias artificiales
Los pioneros en la “enseñanza” a las inteligencias artificiales Andrew Barto y Richard Sutton, quien hace algunos días fueron reconocidos con el premio Turing, se plantearon entrenar a los agentes digitales de una forma parecida a la forma en que se adiestra a los animales. de una forma parecida a la forma en que se adiestra a los animales. 4 Agencia AP nseñara las máquinas de forma parecida alos en trenadores de animales que moldean el comportamiento de perroso caballos ha sido un método importante para desarrollarla inteligenciaartificial y uno que fuereconocido hace unos días con el máximo galardón en informática. Dos pioneros en el campo del aprendizaje por refuerzo, Andrew Barto y Richard Sutton, fueron los ganadores del PremioA.M. Turing de este año, el equivalenteal Nobelen elmundo tecnológico. La investigación que Barto, de76años, y Sutton, de 67, comenzaron a finales de la década de1970allanóelcamino paraalgunos delos avances enin. teligenciaartiicial delaúltima, década.
Su trabajo giraba en 8 torno a emplear máquinas denominadas "hedonistas" que podían adaptar continuamen, te su comportamiento en resLOS CIENTÍFICOS DECIDIERON EMPLEAR EL APRENDIZAJE POR REFUERZO, SENTANDO UNA DE LAS BASES DEL DESARROLLO DE LA INTELIGENCIA ARTIFICIAL puesta a señales positivas. Elaprendizaje porrefuerzo slo que llevó a un programa informático de Googlea vencer alos mejores jugadores humanos de go, unantiguo juego de mesa chino, en 2016 y 2017. También ha sido una técnica clave para mejorarherramientas de inteligencia artificial potas de inteligencia artificial pooros oros placer en su respuesta a re tante, También distinguieron Estos científicos compensas o castigos.
En un sutrabajo delarama de la tectomaron prestadas artículo fundamental publica nología de IA generativa que ideas de la doaprincipios deladécadade ahora es tendencia, represenA á: 1980, Barto y Sutton aplicaron tada enlos grandes modelos de ao pb su nuevo enfoque a una tarea lenguajedetrás delos chatbots específica en un mundo simu creados por OpenAI, Googley la forma en que las lado: equilibrar un palo enun otros gigantes tecnológicos Neuronas buscan carro en movimiento paraevi queimitanla escriturahuma placer en su carro en movimiento paraevi queimitanla escriturahuma placer en su pulares como Chace", optitarquese caiga.
Los doscientí-na y otrosmedios. respuesta a mizar el comercio financiero y ficos informáticos más tarde "La gran elección es, ¿inayudar a una mano robótica a coescribieronun! ibro detexto tentasaprenderdelos datosde "COMPENSAS O resolver un cubo de Rubik. muy utilizado sobreelaprendi las personas, o intentas apren CASÉIBOS. Pero Barto dijo que elcamzaje por refuerzo. der dela vida y la experiencia po "no estaba de moda" cuan"Las herramientas quedes» de un agente(1A)?" dijo Sutton. do él y suestudiante dedocto ANDREW BARTO. RICHARD S.
SUTTON rrollaronsiguensiendo un pilar Sutton ha desestimado lo unaidea a veces conocida corado, Sutton, comenzaron a central del auge della inteligen-que describe como preocupa mo poshumanismo. elaborar sus teorías y algorit-anual de un millón de dólares, tudioso temprano delaJA Alan cia artificial y han generado cionesexageradassobrelaame"Las personas son máquimos en la Universidad de quefueanunciadoel miércoles Turing. Perosuinvestigaciónha avancesimportantes, atraídole nazadelalA parala humanidad, nas.
Son máquinas asombrosas Massachusetts, Amberst. porla Association for Compu-buscado directamenterespon glonesdejóvenes investigadores mientras que Bartonoestuvode y maravillosas", pero noson. el "Estábamos unpocoenla tingMachinery. deraldesafío de Turingen 1947 yimpulsado miles de millones acuerdo y dijo que "uno debe "productofinal" y podrían funoscuridad", dijo Bartoenuna Barto, ahoraretirado dela decrearunamáquina que"pue dedólares eninversiones", dijo ser consciente de las posibles cionar mejor, dijo Sutton. entrevista con The Associated Universidad de Massachusetts, y da aprender dela experiencia", Jeff Dean, científicojefe de Gooconsecuencias inesperadas". "Es intrínsecamente parte Press. "Por eso estan gratifi-Sutton, un profesorveteranoen lo que Sutton describe como gle, enun comunicado escrito.
Barto, retirado desdehace de la empresa de la 1A", dijo cante recibir este premio, ver laUniversidad de AlbertaenCa "sin duda la idea esencial del Enunaentrevistaconjunta 14años, se describe asímismo Sutton. "Estamos tratando de queesto se está reconociendo nadá, nosonlos primeros pione-aprendizaje porrefuerzo". con AP, Barto y Suttonno siemcomo un ludita, mientras que entendernos a nosotros mismás como algo relevante ein rosdelainteligenciaartificialen En particular, tomaron precoincidieronensuvalora Sutton recibe con los brazos mos y, por supuesto, de hacer teresante.
En los primeros dí-ganar el premio que lleva el prestadasideas dela psicología ción delosriesgos delosagen abiertos un futuro que espera cosas que puedan funcionarinas, nolo era" nombredel matemáticobritáni-y la neurociencia sobre la for tesdelA queintentan mejorar tengaseres demayorinteligen cluso mejor.
Tal vez para conGoogle patrocinaelpremio co, descifrador de códigos yes maenquelas neuronas buscan sea sí mismos de forma cons cia que los humanos actuales, vertimosen tales cosas". (3 de códigos yes maenquelas neuronas buscan sea sí mismos de forma cons cia que los humanos actuales, vertimosen tales cosas". (3.