sábado, 8 de febrero de 2025

DeepSeek explicado: todo lo que necesitas saber

DeepSeek, una empresa china de inteligencia artificial, está revolucionando la industria con sus modelos de lenguaje de gran tamaño, de código abierto y de bajo costo, desafiando a los gigantes tecnológicos estadounidenses.

En el mundo de la IA, ha prevalecido la idea de que el desarrollo de modelos de lenguaje de gran tamaño de vanguardia requiere importantes recursos técnicos y financieros. Esa es una de las principales razones por las que el gobierno de Estados Unidos se comprometió a apoyar el Proyecto Stargate de 500 mil millones de dólares anunciado por el presidente Donald Trump.

Pero la empresa china de desarrollo de inteligencia artificial DeepSeek ha trastocado esa idea. El 20 de enero de 2025, DeepSeek lanzó su modelo R1 LLM a una fracción del coste que otros proveedores han tenido que asumir para desarrollarlo. DeepSeek también ofrece sus modelos R1 bajo una licencia de código abierto , lo que permite su uso gratuito.

A los pocos días de su lanzamiento, el asistente de inteligencia artificial DeepSeek (una aplicación móvil que proporciona una interfaz de chatbot para DeepSeek-R1) alcanzó la cima de la lista de la App Store de Apple, superando a la aplicación móvil ChatGPT de OpenAI . El meteórico ascenso de DeepSeek en términos de uso y popularidad desencadenó una liquidación en el mercado de valores el 27 de enero de 2025, ya que los inversores pusieron en duda el valor de los grandes proveedores de inteligencia artificial con sede en EE. UU., incluida Nvidia . Microsoft, Meta Platforms, Oracle, Broadcom y otros gigantes tecnológicos también sufrieron caídas significativas a medida que los inversores reevaluaban las valoraciones de la inteligencia artificial.

¿Qué es DeepSeek?

DeepSeek es una empresa de desarrollo de inteligencia artificial con sede en Hangzhou, China. La empresa fue fundada por Liang Wenfeng, un graduado de la Universidad de Zhejiang, en mayo de 2023. Wenfeng también cofundó High-Flyer, un fondo de cobertura cuantitativo con sede en China que posee DeepSeek. Actualmente, DeepSeek opera como un laboratorio de investigación de inteligencia artificial independiente bajo el paraguas de High-Flyer. El monto total de la financiación y la valoración de DeepSeek no se han revelado públicamente.

DeepSeek se centra en el desarrollo de LLM de código abierto. El primer modelo de la empresa se lanzó en noviembre de 2023. La empresa ha iterado varias veces su LLM principal y ha desarrollado varias variaciones diferentes. Sin embargo, no fue hasta enero de 2025, después del lanzamiento de su modelo de razonamiento R1, que la empresa se hizo famosa a nivel mundial.

La empresa ofrece múltiples servicios para sus modelos, incluida una interfaz web, una aplicación móvil y acceso API .

Comparación entre OpenAI y DeepSeek

DeepSeek representa el último desafío para OpenAI, que se estableció como líder de la industria con el debut de ChatGPT en 2022. OpenAI ha ayudado a impulsar la industria de la IA generativa con su familia de modelos GPT, así como su clase o1 de modelos de razonamiento.

Si bien ambas empresas están desarrollando LLM de IA generativa, tienen enfoques diferentes.