¿Qué representa DeepSeek para el futuro de la IA?
¿ Qué representa DeepSeek para el futuro de la IA? Mundo tecnológico: ¿ Qué representa DeepSeek para el futuro de la lA? Kevin Roose/ The New York Times Lavance en inteligencia artificial (1A) que está generando conmoción en los mercados bursátiles, asustando a los gigantes de Silicon Valley y desatando apasionados comentarios sobre el fin del dominio tecnológico de Estados Unidos llegó con un título sencillo y absurdo: "Incentivando la capacidad de razonamiento en modelos de lenguaje de gran tamaño mediante el aprendizaje por refuerzo". El artículo de 22 páginas, publicado la semana pasada por una empresa china de inteligencia artificial llamada DeepSeek, no alarmó a nadie de inmediato. Los investigadores tardaron unos días en digerir lo que el documento afirmaba y las impli caciones de lo que describía.
La empresa creó un nuevo modelo de IA llamado DeepSeek-RI, diseñado por un equipo de in vestigadores que aseguraban haber utilizado una pequeña cantidad de chips de lA de calidad inferior para igualar el rendimiento de los principales modelos de IA estadounidenses a una fracción del costo. La primera reacción de algunos observadores del sector ante el avance de DeepSeek fue de incredulidad. Pensaron que, sin duda, DeepSeek había hecho trampa para conseguir los resultados de RI, o había falseado sus cifras para que su modelo pareciera más impresionante de lo que era. Quizá el gobierno chino estaba promoviendo propaganda para socavar la narrativa del dominio estadounidense en el campo de la 1A.
Tal vez DeepSeek ocultaba una reserva de chips Nvidia H100 ilítaba una reserva de chips Nvidia H100 ilítaba una reserva de chips Nvidia H100 ilítaba una reserva de chips Nvidia H100 ilítaba una reserva de chips Nvidia H100 ilítaba una reserva de chips Nvidia H100 ilítaba una reserva de chips Nvidia H100 ilítaba una reserva de chips Nvidia H100 ilítaba una reserva de chips Nvidia H100 ilítaba una reserva de chips Nvidia H100 ilíUn nuevo modelo de inteligencia artificial ha alterado suposiciones fundamentales: La primera es que, para crear modelos de lA de vanguardia, es necesario gastar enormes cantidades de dinero. citos, prohibidos por los controles de exportación estadounidenses, y estaba mintiendo.
Tal vez el RI no era más que un rediseño ingenioso de los modelos de IA estadounidenses, y no representaba un gran avance real Poco a poco, a medida que más gente examinaba a fondo los detalles de DeepSeek-RI --que, a diferencia de la mayoría delos principales modelos delA, se publicó como software de código abierto, lo que permitió que cualquiera examinara su funcionamiento interno más de cerca--, el escepticismo se transformó en preocupación.
Tengo reservas sobre los comentarios más dramáticos que he visto en los últimos días, como la afirmación, hecha por un inversionista de Silicon Valley, de que DeepSeek es un elaborado complot del gobierno chino para destruir la industri tecnológica estadounidense. Sí creo que el avance de DeepSeek con su RI fue real.
Luego de conversar con personas de la inde la inde la inde la inde la inde la industria, y tras una semana de expertos que han investigado y probado las conelusiones del artículo, parece que se está poniendo en duda varias suposiciones importantes que la industria tecnológica estadounidense ha estado haciendo. La primera es la suposición de que, para crear modelos de IA de vanguardia, es necesario gastar enormes cantidades de dinero en potentes chips y centros de datos. Es difícil exagerar lo fundamental que se ha convertido este dogma.
Empresas como Microsoft, Meta y Google ya han invertido decenas de miles de millones de dólares en construir la infraestructura que creían necesaria para crear y ejecutar modelos de IA de próxima generación DeepSeek parece haber gastado una pequeña fracción de esa cantidad en construir Rl. No sabemos cuál fue el costo exacto, y hay que tener muchas reservas sobre las cifras que han publicado hasta ahora. Casi con certeza es superior a 5,5 millones de dólares, la cifra que la empresa afirma haber gastado en entrenar un modelo anterior.
Pero aunque el entrenamiento del RI costara 10 veces más de lo que afirma DeepSeek, e incluso si se toman en cuenta otros costos que podrían haber excluido, como los salarios de los ingenieros o los costos de la investigación básica, seguiría siendo sumamente inferior a lo que l; empresas estadounidenses de IA están gastando para desarrollar sus modelos más competentes.
Pero el gran logro de DeepSeek en téren téren téren téren téren téren téren téren téren téren téren téren téren téren téren términos de costos pone en tela de juicio la narrativa de "más grande es mejor" que ha impulsado la carrera armamentística de la IA en años recientes, al demostrar que los modelos relativamente pequeños, cuando se entrenan de manera adecuada, pueden igualar o superar el rendimiento de modelos mucho más grandes. Eso, a su vez, significa que las empresas de IA podrían lograr capacidades muy potentes con una inversión mucho menor delo quese creía. Y hace pensar que pronto podríamos ver una avalancha de inversiones en pequeñas empresas emergentes dela, y mucha más competencia para los gigantes de Silicon Valley. Aunque los precios de las acciones de los gigantes tecnológicos estadounidenses se recuperen en los próximos días, el éxito de DeepSeck plantea interrogantes importantes sobre sus estrategias de IA a largo plazo.
Si una empresa china puede construir modelos de código abierto bara. tos que igualan el rendimiento de los costosos modelos estadounidenses, ¿por qué alguien pagaría por los nuestros? alguien pagaría por los nuestros? alguien pagaría por los nuestros? alguien pagaría por los nuestros? alguien pagaría por los nuestros? El avance de DeepSeek también soc va algunas de las suposiciones geopolíticas que muchos expertos estadounidenses habían hecho sobre la posición de China en la carrera de la IA. En primer lugar, cuestiona la narrativa de que China está significativamente rezagada en la frontera de la construcción de modelos poderosos de IA. Durante años, muchos expertos en lA (y los legisladores que los escuchan) han dado por sentado que Estados Unidos tenía una ventaja de al menos varios años.
Los resultados también plantean interrogantes sobre si las medidas que el gobierno estadounidense ha estado tomando para limitar la propagación de poderosos sistemas de Al en el caso de nuestros adversarios --específicamente, los controles de exportación utilizados para impedir que chips delA avanzados caigan en manos de Chinaestán funcionando según lo previsto.
Y, por supuesto, hay preocupaciones en torno a lo que significaría para la privacidad y la censura que China tomara la delantera en la creación de potentes sistemas de lA utilizados por millones de esta. dounidenses.
Los usuarios de los modelos de DeepSeek han observado que se niegan sistemáticamente a responder a preguntas sobre temas delicados dentro de China, como la masacre de la plaza de Tiananmén y los campos de detención uigures. Pero parece buena idea tomarse en serio la posibilidad de que nos encontramos en una nueva era: la del juego de poder de la IA. Una era en la que es posible que las empresas tecnológicas estadounidenses más grandes y ricas no ganen por defecto.
Como mínimo, DeepSeek ha demostrado que la carrera armamentística de la IA sin duda está en marcha, y que, tras varios años de vertiginosos avances, aún nos aguardan más sorpresas aún nos aguardan más sorpresas aún nos aguardan más sorpresas aún nos aguardan más sorpresas aún nos aguardan más sorpresas aún nos aguardan más sorpresas aún nos aguardan más sorpresas aún nos aguardan más sorpresas aún nos aguardan más sorpresas aún nos aguardan más sorpresas aún nos aguardan más sorpresas aún nos aguardan más sorpresas aún nos aguardan más sorpresas aún nos aguardan más sorpresas.