Nuevo gigante en el mercado: Hola, DeepSeek
Nuevo gigante en
el mercado: Hola, DeepSeek
Durante las últimas semanas seguro
hayas escuchado mencionar el término “Deepseek” por alguno de tus amigos,
profesores o incluso familiares, pero ¿a qué se refieren? O como muchas personas dicen al escuchar algo que no conocen ¿con
qué se come? Déjame iluminarte un poco. Deepseek es la nueva inteligencia
artificial china que está dando mucho de qué hablar en la industria.
El revuelo que está causando esta
nueva inteligencia artificial no es para menos, a pesar de su reciente
lanzamiento, esta
ya ha superado al “rey” de las inteligencias artificiales, ChatGPT, en
descargas dentro de las tiendas de aplicaciones móviles. Por si esto no era
suficiente para despertar aún más tu atención, el modelo R1 fue sometido a
pruebas de razonamiento y rendimiento en las cuales también ha igualado a
ChatGPT.
La empresa con el mismo nombre de
la IA ha despertado mucho la atención de la comunidad en los últimos meses. El
lanzamiento al mercado de DeepSeek fue tan solo la gota que derramó el vaso. La
atención que se le da a la empresa es causada por sus modelos, ya que estos
cuentan con la peculiar cualidad de ser de código abierto. Esto quiere decir que es
muchísimo más accesible para todos, demostrando también lo avanzada que se
encuentra China en el ámbito de la inteligencia artificial.
El chatbot utilizado para
trabajar con DeepSeek es un gran modelo lingüístico (LLM por sus siglas en
inglés). Esto se refiere a que es un tipo de inteligencia artificial que busca
procesar, entender y generar lenguaje humano. Esta IA fue creada principalmente
para apoyar a los usuarios con el desarrollo de software, la automatización
empresarial e incluso el procesamiento del lenguaje natural. Adentrándonos más
en la cualidad open source de DeepSeek, sorprende que la empresa haya decidido
hacerlo de esta manera, ya que le permite a los usuarios ver cómo su modelo
funciona internamente. Lo hace completamente transparente. Cualquier
persona, desarrollador, investigardor, etc., puede entrar a GitHub y descargarlo de manera
gratuita, por lo que es posible modificarlo al gusto para trabajar con el
en una amplia gama de escenarios.
Gracias a esta capacidad de
descarga, todas las personas pueden instalarlo en sus dispositivos y trabajar
con DeepSeek de manera local. Muchas veces se dice que, si algo es gratis, el
producto eres tú y que además pagarás por seguir siéndolo. Esto se debe a que brindas tu información personal al producto. Sin embargo, si
utilizas DeepSeek de manera local en tu dispositivo de preferencia, si bien
podría funcionar un poco más lento, la compañía china no tendrá acceso a tu
valiosa información. Este aspecto es un polo completamente opuesto a la poca
libertad que ofrecen otros modelos privados. Muchas personas tienen una idea
muy marcada en cuanto al código privado y el cómo esto garantiza la calidad de
un producto superior, pero DeepSeek es una prueba excelente la cual demuestra
que el código abierto puede igualar y, en este caso, incluso superar a empresas
que trabajan con código privado.
DeepSeek también tiene una
característica clave, en mi opinión la más importante, que le ha permitido
popularizarse y atraer más usuarios. Esta reside en que su chatbot de la web
oficial es completamente gratuito, no requieres de ningún tipo de suscripción
para hacer uso de él. Si bien al compararlo con ChatGPT, el generar
respuestas este nos puede resultar mucho más simple y directo. Con tan solo
pedirle que explique las cosas de manera más amplia o adaptadas para ti será
suficiente.
Dos modelos de inteligencia artificial son los responsables del auge de la compañía china: DeepSeek V3 y DeepSeek R1. La V3, siendo un modelo LLM, se ha demostrado superior a la mayoría de las otras inteligencias artificiales al realizársele pruebas como la de programación, en al cual superó a GPT-4o, Qwen 2.5 72B y Llama 2.1 405B, aunque estos posean menos parámetros. El verdadero boom de DeepSeek V3 ha sido el costo y tiempo de entrenamiento. Para V3 fueron necesarias 2,788 millones de horas de entrenamiento y se dice que solamente 5.5 millones de dólares, aunque la cifra real de la empresa china se desconozca. Esta estimación es significativamente menor al costo de los modelos de OpenAI, los cuales requirieron de alrededor de 80 millones de dólares. Además, el precio de uso de DeepSeek es menor al de OpenAI también, cobrando este 55 centavos de dólar por un millón de tokens, siento esto tan solamente el 3.6% del precio de la misma cantidad de tokens de OpenAI.
El otro gran modelo de Deepseek
es R1, especializado en razonamiento. Ha sido capaz de superar el rendimiento
de los modelos más avanzados de OpenAI en pruebas de matemáticas y programación.
Con este modelo, es la primera vez que un modelo chino de código open source
iguala a líderes occidentales en Silicon Valley. Por si eso no fuese poco,
también se hicieron pruebas matemáticas MATH-500, consiguiendo DeepSeek 97.3%
de aciertos y, nuevamente, superando el 96.4% de aciertos de OpenAI.
Claro, no todo puede ser color de
rosas, existe un punto polémico principal en DeepSeek, la censura. Como todas
las inteligencias artificiales, Gemini, ChatGPT, etc., DeepSeek está sujeto a
los valores del país donde esta fue desarrollada, China en este caso, por lo
que se adapta a sus regulaciones. Gracias a esto, el modelo en línea no
responde a preguntas controversiales o sensibles, como aspectos geopolíticos.
La buena noticia es que tales censuras no son a nivel modelo, lo que nos
permite que, al descargar DeepSeek y utilizarlo de manera local, no tendremos
dichas limitaciones. Claro que este pequeño detalle no opaca su gran variedad
de funciones, incluso existen jóvenes en china quienes deciden recibir
“terapia” por parte de DeepSeek antes de irse a dormir.
El desarrollo de DeepSeek se basa
en el aprendizaje por refuerzo puro sin datos etiquetados. Esto, aunque parezca
muy simple, es una hazaña técnica considerada imposible hasta hoy en día,
abriendo así nuevas puertas al entrenamiento de este tipo de sistemas. Este
tipo de aprendizaje permite al modelo aprender por si mismo como muchos lo
hicimos, a prueba y error. Si bien esta metodología al principio puede resultar
en respuestas erróneas, el modelo será capaz de descubrir y desarrollar
estrategias únicas de razonamiento para su continua mejora. Media vez se dominó
tal sistema de aprendizaje DeepSeek refinó el modelo con otros diferentes
entrenamientos bajo supervisión y dio vida a R1.
El funcionamiento de DeepSeek es
igual al del resto de modelos. Hay una pantalla con un campo de escritura para
redactar tu prompt, el modelo genera tu resultado en el chat y tienes un
historial de chats en el apartado izquierdo. Gracias a la forma en que se creó,
DeepSeek puede entender contextos muy complejos de largas y elaboradas
preguntas a la vez que mejora y aprende. Puedes hacerle preguntas, pedirle que
te expliqué temas complejos de forma sencilla, escribir y depurar código, etc.
Estoy seguro de que va a satisfacer todas las necesidades de inteligencia
artificial que necesites.
Considero que DeepSeek se merece
mucho más que una oportunidad, merece convertirse en tu IA de confianza, pero
de manera local, no quieres regalar tu información. Esta empresa es un claro
ejemplo de que no se necesitan cantidades (tan) exorbitantes de dinero o
recursos para desarrollar proyectos funcionales y que pueden posicionarse
fuertemente dentro de la competencia. Además, el hecho de ser open source lo
hace mucho más increíble.
No hay comentarios: