Autor: RAFFAELE HUANG.
Silicon Valley está entusiasmado con un modelo de inteligencia artificial “hecho en China”
Silicon Valley está entusiasmado con un modelo de inteligencia artificial “hecho en China” WSJCONTENIDO LICENCIADO PORTHE WALL STREET JOURNALIcial de DeepSeek:Los modelos de inteligencia artifuncionar con chips menos avanzados. Una compañía china de inteli-gencia artificial tiene a SiliconValley maravillado por cómosus programadores casi igualana sus rivales estadounidenses, apesar de usar chips inferiores.
Los modelos de inteligencia arti-ficial de DeepSeck, la empresachina, han ascendido al top 10millones a US$ 1.000 millonescitados el año pasado por Dariomundial en rendimiento, segúnAmodei, director ejecutivo delun ranking popular, lo que su-desarrollador de IA Anthropic, giere que las restricciones a lascomo el costo de construir unexportaciones de Washingtonmodelo. están teniendo dificultades paraBarret Woodside, cofundadorbloquear los rápidos avances dede la empresa de hardware de in-China. teligencia artificial Positron deEl20 de enero, DeepSeek pre-San Francisco, dijo que él y sussentó R1, un modelo especializa-colegas han estado entusiasma-do diseñado para la resoluciónde problemas complejos. dos con DeepSeek.
“Es genial”, dijo Woodside, señalando los“DeepSeek RI es uno de losmodelos de código abierto deavances más sorprendentes eDeepSeek en los queel códigodeimpresionantes que he visto”, software detrás del modelo de in-dijo Marc Andreessen, el capita-teligencia artificial está disponi-lista de riesgo de Silicon Valleyble de forma gratuitaque ha estado asesorando al Pre-Los usuarios del último mo-sidente Trump, en una publica-delo estrella de DeepSeek, lla-ción en X el viernLos avances de DeepSeek pro-mado V3 y lanzado en diciem-se niega abre, han notado quevocaron una ola de ventas lide-responder preguntas políticasrada por las acciones de chips eldelicadas sobre China y su líderlunes por la mañana, ante lasXi Jinping.
En algunos casos, elpreocupaciones sobre si el enor-producto ofrece respuestasenme gasto de los gigantes tecno-nea con la propaganda oficial delógicos estadounidenses en se-Beijing en lugar de incluir la'miconductores de vanguardia yperspectiva de los críticos delotras infraestructuras de inteli-gencia artificial estaba justifica-gobierno, como lo haceChatGPT. do.
Los futuros vinculados al“El único problema es unaNasdag-100, centrado en la tec-censura poco elaborada por lanología, cayeron un 4%, y Nvi-República Popular China”, dijodia descendió más del 10% antesWoodside, pero agregó que estode la apertura del mercado. podría eliminarse porque otros:l desarrollo de DecpSeck es-desarrolladores pueden modifi-tuvo a cargo de un gestor de fon-car libremente el código. dos de cobertura chino, LiangDeepSeek dijo que tanto R1Wenfeng, que se ha convertidocomo V3 tuvieron un desempe-enel rostro del impulso de la in-ño mejor o cercanoteligencia artificiala los principalesen el país. El 20 deOPORTUNIDAD modelosoccidenta-enero, Liangsereu-nió con el primer Expertos destacan que les.
Hasta el sába-ministro de Chinay lasrestricciones do, losdosmodelosdebatió sobre cómo estadounidenses dejan estaban clasifica= dosentrelos10 prientreverunalecciónlas empresas loca-les podrían reducirmeros en Chatbotlas más amplia:Arena, una plata-limitaciones de recursosla brecha con Esta-forma organizadaa menudo impulsan lados Unidos. por investigadorescreatividad. especialistasLosafirman que la tecmes dle la Universidadnología de DeepSe-de California, BeKeley, que califica el desempeñoek aún está por detrás de la dede los chatbots.
Un modelo deOpenAl y Google, pero es un ri-Google Gemini estaba en el pri-val cercano a pesar de utilizarmenos chips y menos avanza-mer lugar, mientras que Deep-Seek superó a Claude de Ant-dos, y enalgunoscasos saltándo-hropic y a Grok de xAl de Elonse pasos que los desarrolladoresMusk. estadounidenses considerabanunidadesenciales, de investigación de IA de High-DeepSeek dijo que estrenarFlyer, un administrador de fon-uno de sus últimos modelos cos-dos de cobertura con US$ 8 mil16 US$ 5,6 millones, en compa-millones en activos que es cono-ración con el rango de US$ 100DeepSeek surgió de laSolo un puñado de empresasen China tenían una infraestruc-tura informática lo suficientemente potente como para desa-rrollar tales modelos a fines de2022, cuando OpenAl lanzóChatGPT. DeepSeek afirmó en un infor-me técnico que utilizó un con-junto de másde 2.000 chips¡ Nvidia para entrenar su modeloV3, en comparación con las de-cenas de miles de chips que seutilizan para entrenar modelosde tamaño similar.
Algunos es-pecialistas estadounidenses eninteligencia artificial han cues-tionado recientemente si High-Flyer y DeepSeek están acce-diendo a una potencia de cálcu-lo superior a la anunciadaAlgunos investigadores ex-ternos dijeron que el modelo De-epScek carece de ciertas capaci-dades de sus rivales entrenadoscon mayor coste, por ejemplo, para rastrear el contexto de con-versaciones largas.
Para su último modelo de ra-zonamiento publicado el 20 deenero, DeepSeek se saltó un pro-ceso conocido como ajuste finosupervisado, en el que los pro-gramadores incorporan el cono-cimiento de expertos humanospara darle al modelo una ventajainicial, DeepSeek dijo que sumodelo, diseñado para resolverproblemas matemáticos com-plejos y desafíos similares, eracomparable al modelo de razo-namiento ol de OpenAl, aunqueomitió el ajuste fino supervisa-do y se centró en el aprendizajede refuerzo, es decir, en el ensa-yo y error dirigidos. Jim Fan, un científico investi-gador de alto nivel de Nvidia, elogió como un gran avance elartículo de DeepSeek que infor-ma sobre los resultados.
Dijo enX que le recordaba a programasde inteligencia artificial pione-ros anteriores que dominabanjuegos de mesa como el ajedrezimitar primero adesde cero, singrandes maestros”. Zack Kass, exejecutivo deOpenAL, dijo que los avances deDeepSeck, a pesar de las restric-ciones estadounidenses, “subra-yan una lección más amplia: laslimitaciones de recursos a me-nudo impulsan la creatividad”. Este artículo fue actualizadoel lunes por la mañana. Se publi-có originalmente el 25 de enero. Traducido del inglés por"El MercurioHi, l'm DeepSeek. Los especialistas afirman que la tecnología de DeepSeek aún está por detrás de la de OpenAl y Google, pero es uncido por aprovechar la IA paracomercializar. “Cuando los humanos tomandecisiones de inversión, es un ar-te y lo hacen a su aire. Cuando losprogramas informáticos tomanesas decisiones, es una ciencia ytienen la solución óptima”, dijoLiang en un discurso de 2019. Liang nació en 1985 y crecióde Guangdong, en la provinciaen el sureste de China. Asila prestigiosa Univer:Zhejiang y se especializó en visión artificial. Unos años des-pués de graduarse, Liang fundó. High-Flyer con dos amigos de launiversidad en 2015. Según personas cercanas a él, Liang prefiere que lo considereningeniero en lugar de comercian-te. Su High-Flyer fue pionero enChina en la aplicación del apren-dizaje profundo al comercio com-putarizado. La técnica, basada enel cerebro humano, permite a lascomputadoras analizar tipos dedatos más diversos. Unejemplo sería una empresaque desea aprovechar la tecnolo-gía para dar respuestas de inteli-gencia artificial a las consultasde los clientes. A principios del año pasado, DeepSeek redujo los precios deservicio a una fracción de loesteque cobraban otros proveedores, lo que llevó a la industria en Chi-naa iniciar una batalla de precios. Anthony Poo, cofundador deuna startup con sede en SiliconValley que utiliza inteligenciaartificial generativa para prede-cir los retornos financieros, dijoquesu compañíapasó del mode-lo Claude de Anthropic a Deep-Seek en septiembre. Las pruebasmostraron que DeepSeek tuvoun rendimiento similar poraproximadamente una cuartaparte del costo. “El modelo de OpenAl es elmejor en rendimiento, pero tam-poco queremos pagar por capa-cidades que no necesitamos”, afirmó Poo.
En su reunión del 20 de enero, Liang, de DeepSeck, le dijo al pri-mer ministro chino, Li Qiang, quesi bien las compañías chinas esta-ban trabajando para ponerse aldía, las restricciones estadouni-denses a la exportación de chipsavanzados a China todavía eranun cuello de botella, según perso-nas familiarizadas con la reunión. En 2019, High-Flyer comenzóa construir un conjunto de chipspara la investigación de la IA, enparte con fondos generados porsu negocio de finanzas. La em-presa ha dicho que más tardeconstruyó un conjunto másgrande de alrededor de 10.000 unidades de procesamiento grá-fico de Nvidia que se puedenutilizar para entrenar modelosde lenguaje de gran tamaño. Icial de DeepSeek:. DeepSeek es calificado como “asombroso e impresionante” a pesar de funcionar con chips menos avanzados. rival cercano, a pesar de utilizar menos chips y menos avanzados.