Autor: The Wall Street Journal
No mire ahora, pero la IA de China se está poniendo al día rápidamente
No mire ahora, pero la IA de China se está poniendo al día rápidamente Más rápido de lo que las empresas esperaban:Las empresas emergentes utilizan soluciones alternativas para desafiar a OpenAIen algunas áreas a pesar de la falta de chips de vanguardia. sobre los chips. Tencent afirmó que su modeloMoE, que se lanzó en noviem-bre, tenía un desempeño compa-rable a un modelo Llama 3.1 quefue introducido en julio por Me-ta Platforms, el dueño de Face-book. Los investigadores que re-visaron los artículos que publi-caron ambas compañías dijeronque el modelo de Tencent proba-blemente fue capacitado conuna décima parte aproximada-mente de la potencia computa-cional que utilizó Meta. DeepSeek empezó como launidad de investigación de IAde High-Flyer, una administra-dora de fondos de coberturacuantitativos con US$ 8 mil mi-llones en activos que es conoci-da por aprovechar la IA paraoperar. En 2021, DeepSeek co-nectó alrededor de 10 mil de loschips A100 de Nvidia para for-mar un grupo destinado a la ca-pacitación de IA, al que llamóFire-Flyer 2.
E n u n a r t í c u l oque se publicó enagosto pasado, De-epSeek decía que Fi-re-Flyer 2 alcanzabaun rendimiento cer-cano al de un siste-ma de Nvidia quecontenía chips simi-lares, pero el sistema chino cos-taba menos y consumía menosenergía. El artículo de mayo deDeepSeek sobre su modeloMoE, el que incorporaba unatécnica para procesar datos enforma más eficiente, se mencio-nó ampliamente en la industria.
“Una forma en que Chinaevadirá los controles de expor-tación es creando una gran can-tidad de entrenamiento de sof-tware y hardware extremada-mente bueno empleando el har-d w a r e a l q u e p u e d a t e n e racceso”, escribió en su blog JackClark, cofundador del empren-dimiento de IA, Anthropic, alreferirse al grupo que formóDeepSeek. “Made in China se-rá algo habitual para los mode-los de IA, como sucede con losautos eléctricos, los drones yotras tecnologías”, escribió. Muchos creadores chinos deIA han encontrado formas deacceder a los chips restringidosde Nvidia, por ejemplo, a tra-vés de operaciones con inter-mediarios y centros de datos enel extranjero. Sin embargo, la falta de chipsPAEFEde vanguardia es penosa para lasempresas emergentes chinas, se-gún ejecutivos chinos, y la bre-cha al parecer se va a ampliar.
Los clientes de Nvidia se estánpreparando para desplegar suchip más reciente de IA paracentros de datos, llamado Blac-kwell, a una escala significativa. xAI de Elon Musk ha construi-do un centro de datos con 100mil chips de Nvidia y hace pocoreunió US$ 5 mil millones parahacer más. Amazon Web Servi-ces planea construir un enormesupercomputador de IA concientos de miles de sus chips fa-bricados en casa. DeepSeek, el cual se enfoca enmodelos de código abierto, poneénfasis en las matemáticas y enla codificación. Moonshot ha ga-nado popularidad entre los con-sumidores chinos con su chatbotKimi, similar a ChatGPT, y es co-nocido por su capacidad paramanejar textos largos. Los emprendimientos de IAchinos se valoran actualmenteen una fracción del valor de lascompañías estadounidenses co-mo OpenAI la quefue valorada recien-temente en US$ 157mil millones, por-que los financistasno están seguros desu capacidad paramonetizar sus avan-ces. La feroz compe-tencia ha llevado auna guerra de precios entre losproveedores de modelos de IA.
Zhipu AI, con sede en Bei-jing, que fue valorada en alre-dedor de US$ 3 mil millones ensu ronda de captación de fon-dos más reciente este mes, echóatrás sus planes de salir a la bol-sa ya en la segunda mitad de2025 después de que los ban-queros de inversiones le dijerona la compañía que era poco pro-bable que obtuviera la valora-ción que quería, según perso-nas al tanto del tema. Zhipu ex-hibió su agente de IA a fines denoviembre y lanzó un modelode generación de videos similara Sora de OpenAI en julio. Howard Huang, exejecutivode infraestructura de IA de unaempresa de modelos de IA consede en Beijing, comparó la in-dustria china con personas quetratan de bailar mientras llevangrilletes. “El enfocarnos en loque hemos sido buenos, es laúnica oportunidad de sobrevi-vir y, probablemente, de ga-nar”, manifestó. Traducido del inglés por “El Mercurio”RÁPIDAMENTElas empresasemergentes chinasdemuestran estarponiéndose al día conla IA. modelo preliminar o1 de Ope-nAI llegó a las respuestas másrápido que DeepSeek, Moons-hot y el modelo experimental deAlibaba. En un acertijo de pala-bras que involucraba estrategiaen un juego hipotético de dos ju-gadores, el programa de Ope-nAI dio la respuesta en 10 segun-dos mientras que DeepSeek de-moró más de dos minutos. Obtener la respuesta correctaen el primer intento es aún unahazaña, porque los problemasde palabras a menudo descon-ciertan a los programas de IA. Aquellos que se dedican a de-sarrollar la IA en China se hanenfrentado a restricciones deEE. UU. para tener acceso a loschips de IA más avanzados delmundo, lo que incluye los deNvidia, el líder en este campo, desde 2022. En diciembre, el go-bierno de Biden nuevamenteajustó las normas de control deexportaciones. Sin embargo, los expertos chi-nos han encontrado solucionesalternativas.
En Moonshot, la empresaemergente que cuenta con el res-paldo de Alibaba y Tencent, elfundador Yang Zhilin ha indica-do que la compañía se está enfo-cando en el aprendizaje de re-fuerzo, el que imita el método deprueba y error de los humanos. El enfoque podría utilizar po-tencia computacional en formamenos intensiva para mejorar elrendimiento.
Desde fines del año pasado, los creadores de IA han estadoutilizando cada vez más una téc-nica llamada “mezcla de exper-tos”, o MoE, en la que un meca-nismo de guía inicial dirige elproblema a un modelo expertoespecializado, como un chefprincipal que dirige una ordende espaguetis al cocinero italia-no de la cocina.
Este procesotambién modera las demandasCONTENIDO LICENCIADO PORTHE WALL STREET JOURNALRAFFAELE HUANG Y TRACY QUemergentes chinas muestran se-ñas de estar poniéndose al díacon los principales modelos deinteligencia artificial de EE.UU. en forma más rápida que lo quemuchos en la industria habíanesperado, a pesar de las restric-ciones que enfrenta China paracomprar chips avanzados. DeepSeek, un emprendimien-to financiado por una de las ad-ministradoras de fondos de co-bertura más exitosas de China, lanzó una versión preliminar desu modelo grande de lenguajemás reciente en noviembre. Afirmó que las capacidades delprograma se comparaban favo-rablemente con el modelo de ra-zonamiento de OpenAI llamadoo1, el que salió en forma prelimi-nar en septiembre. Otras compañías chinas hanhecho anuncios similares en lasúltimas semanas.
Moonshot AI, una nueva em-presa que cuenta con el respaldode los gigantes de internet chi-nos Alibaba y Tencent, informóque desarrolló un modelo que seespecializa en matemáticas concapacidades cercanas a las de o1, mientras que Alibaba comunicóque uno de sus propios modelosde investigación experimenta-les superó la versión preliminardel modelo estadounidense enmatemáticas. Las compañías no han publi-cado artículos que describansus modelos, y evaluar las afir-maciones es difícil, porque nohay una prueba única acordadade las capacidades de un mode-lo de IA. Con todo, algunos es-pecialistas estadounidensesmanifestaron que estaban im-presionados. China “se está poniendo al díamás rápido”, aseguró AndrewCarr, exmiembro de OpenAI yactualmente emprendedor enIA.
Y agregó que los investiga-dores de DeepSeek que tratan deduplicar el modelo de razona-miento de OpenAI “lo descifra-ron dentro de unos meses y, deverdad, muchos de mis colegasestán sorprendidos por eso”. Una prueba que se utiliza co-mo comparación es AmericanInvitational Mathematics Exa-mination (AIME), la que está di-señada para desafiar a los estu-diantes de matemáticas más bri-llantes de secundaria. DeepSeek afirmó que su mo-delo superó al de OpenAI en elAIME. Un experimento que rea-lizó The Wall Street Journal en elque utilizó 15 problemas del AI-ME de este año descubrió que el. Más rápido de lo que las empresas esperaban: s se enfrentan a restricciones estadounidenses en el acceso a los chips más avanzados. como Alibaba y Tencent apoyan a Moonshot, empresa de IA creada en 2023.