PEKÍN.— DeepSeek busca consolidar su ventaja. La startup china desencadenó el mes pasado una liquidación de más de un billón de dólares en los mercados de valores globales con un modelo de razonamiento de IA de bajo costo que superó a muchos competidores occidentales. Ahora, la empresa con sede en Hangzhou está acelerando el lanzamiento del sucesor de su modelo R1, presentado en enero, según tres personas familiarizadas con la compañía.
DeepSeek tenía previsto lanzar el R2 a principios de mayo, pero ahora quiere que salga lo antes posible, según dos de esas fuentes, sin especificar fechas concretas. La empresa espera que el nuevo modelo tenga una mejor capacidad de codificación y pueda razonar en idiomas más allá del inglés. Los detalles sobre la aceleración del lanzamiento de R2 no se habían reportado previamente.
DeepSeek no respondió a una solicitud de comentarios para esta historia. Los rivales aún están asimilando las implicaciones del R1, que fue desarrollado con chips Nvidia menos potentes pero compite con modelos creados por gigantes tecnológicos de EE. UU. a un costo de cientos de miles de millones de dólares.
«El lanzamiento del modelo R2 de DeepSeek podría ser un momento decisivo en la industria de la IA», dijo Vijayasimha Alilughatta, director de operaciones de la empresa india de servicios tecnológicos Zensar. El éxito de DeepSeek en la creación de modelos de IA rentables «probablemente impulsará a empresas de todo el mundo a acelerar sus propios esfuerzos… rompiendo el dominio de unos pocos actores en el sector», añadió.
El R2 probablemente preocupará al gobierno de EE. UU., que ha identificado el liderazgo en IA como una prioridad nacional. Su lanzamiento podría impulsar aún más a las autoridades y empresas chinas, muchas de las cuales ya han comenzado a integrar los modelos de DeepSeek en sus productos.
Un camino diferente
Poco se sabe sobre DeepSeek y su fundador, Liang Wenfeng, quien se hizo multimillonario gracias a su fondo de cobertura cuantitativo High-Flyer. Liang, descrito por un antiguo empleador como «discreto e introvertido», no ha hablado con los medios desde julio de 2024.
Reuters entrevistó a una docena de exempleados, así como a profesionales de fondos cuantitativos con conocimiento de las operaciones de DeepSeek y su empresa matriz, High-Flyer. También revisó artículos de medios estatales, publicaciones en redes sociales de las empresas y trabajos de investigación desde 2019.
Las fuentes describen a DeepSeek como una compañía que opera más como un laboratorio de investigación que como una empresa con fines de lucro, sin las estructuras jerárquicas tradicionales de la industria tecnológica china. A pesar de ello, ha logrado avances que muchos inversores consideran innovadores en el campo de la IA.
Liang nació en 1985 en una aldea rural de la provincia de Guangdong y obtuvo un título en ingeniería de comunicaciones en la prestigiosa Universidad de Zhejiang. Uno de sus primeros trabajos fue dirigir un departamento de investigación en una empresa de imagen inteligente en Shanghái. Su exjefe, Zhou Chaoen, dijo a los medios estatales el 9 de febrero que Liang contrató a ingenieros de algoritmos galardonados y operó con un «estilo de gestión horizontal».
En DeepSeek y High-Flyer, Liang ha evitado las prácticas comunes de los gigantes tecnológicos chinos, como la gestión rígida, los bajos salarios para empleados jóvenes y el sistema de trabajo «996» (de 9 a. m. a 9 p. m., seis días a la semana).
Su oficina en Pekín está cerca de las universidades de Tsinghua y Pekín, las dos más prestigiosas del país. Según dos exempleados, Liang se involucra en los detalles técnicos y trabaja codo a codo con pasantes y recién graduados, quienes forman la mayor parte de su equipo. También describieron un ambiente de colaboración con jornadas de trabajo de ocho horas.
«Liang nos daba autonomía y nos trataba como expertos. Siempre hacía preguntas y aprendía junto a nosotros», dijo Benjamin Liu, un investigador de 26 años que dejó la empresa en septiembre. «En DeepSeek me permitieron asumir responsabilidades clave en la cadena de desarrollo, lo que fue muy emocionante.»
Mientras gigantes tecnológicos chinos como Baidu competían por lanzar versiones de ChatGPT en 2023 y capitalizar el auge global de la IA, Liang declaró al medio chino Waves que evitó gastar en exceso en el desarrollo de aplicaciones, priorizando la calidad de los modelos de IA.
DeepSeek y High-Flyer también son conocidos por sus generosos salarios, según tres fuentes cercanas a sus políticas de compensación. En High-Flyer, un científico de datos senior puede ganar 1.5 millones de yuanes anuales, mientras que en otras firmas rara vez superan los 800,000 yuanes, dijo un administrador de un fondo cuantitativo rival.
El fondo High-Flyer ha sido clave en la inversión en investigación y potencia informática. En 2020, uno de sus ejecutivos dijo que la empresa estaba apostando «todo a la IA», reinvirtiendo el 70% de sus ingresos en investigación del sector.