Monday, April 7 2025

Nuevo gigante en el mercado: Hola, DeepSeek

 

Nuevo gigante en el mercado: Hola, DeepSeek

Durante las últimas semanas seguro hayas escuchado mencionar el término “Deepseek” por alguno de tus amigos, profesores o incluso familiares, pero ¿a qué se refieren? O como muchas personas dicen al escuchar algo que no conocen ¿con qué se come? Déjame iluminarte un poco. Deepseek es la nueva inteligencia artificial china que está dando mucho de qué hablar en la industria.

International regulators probe how DeepSeek is using data. Is the app safe  to use? : NPR

El revuelo que está causando esta nueva inteligencia artificial no es para menos, a pesar de su reciente lanzamiento, esta ya ha superado al “rey” de las inteligencias artificiales, ChatGPT, en descargas dentro de las tiendas de aplicaciones móviles. Por si esto no era suficiente para despertar aún más tu atención, el modelo R1 fue sometido a pruebas de razonamiento y rendimiento en las cuales también ha igualado a ChatGPT.

ChatGPT vs. DeepSeek: A Detailed Comparison

La empresa con el mismo nombre de la IA ha despertado mucho la atención de la comunidad en los últimos meses. El lanzamiento al mercado de DeepSeek fue tan solo la gota que derramó el vaso. La atención que se le da a la empresa es causada por sus modelos, ya que estos cuentan con la peculiar cualidad de ser de código abierto. Esto quiere decir que es muchísimo más accesible para todos, demostrando también lo avanzada que se encuentra China en el ámbito de la inteligencia artificial.

China's free open-source AI DeepSeek is a serious threat to OpenAI's  ChatGPT and other AI models - NotebookCheck.net News

El chatbot utilizado para trabajar con DeepSeek es un gran modelo lingüístico (LLM por sus siglas en inglés). Esto se refiere a que es un tipo de inteligencia artificial que busca procesar, entender y generar lenguaje humano. Esta IA fue creada principalmente para apoyar a los usuarios con el desarrollo de software, la automatización empresarial e incluso el procesamiento del lenguaje natural. Adentrándonos más en la cualidad open source de DeepSeek, sorprende que la empresa haya decidido hacerlo de esta manera, ya que le permite a los usuarios ver cómo su modelo funciona internamente. Lo hace completamente transparente. Cualquier persona, desarrollador, investigardor, etc., puede entrar a GitHub y descargarlo de manera gratuita, por lo que es posible modificarlo al gusto para trabajar con el en una amplia gama de escenarios.

Gracias a esta capacidad de descarga, todas las personas pueden instalarlo en sus dispositivos y trabajar con DeepSeek de manera local. Muchas veces se dice que, si algo es gratis, el producto eres tú y que además pagarás por seguir siéndolo. Esto se debe a que brindas tu información personal al producto. Sin embargo, si utilizas DeepSeek de manera local en tu dispositivo de preferencia, si bien podría funcionar un poco más lento, la compañía china no tendrá acceso a tu valiosa información. Este aspecto es un polo completamente opuesto a la poca libertad que ofrecen otros modelos privados. Muchas personas tienen una idea muy marcada en cuanto al código privado y el cómo esto garantiza la calidad de un producto superior, pero DeepSeek es una prueba excelente la cual demuestra que el código abierto puede igualar y, en este caso, incluso superar a empresas que trabajan con código privado.

⚡Private vs ⚡👋Open Source Projects 🌏 - DEV Community

DeepSeek también tiene una característica clave, en mi opinión la más importante, que le ha permitido popularizarse y atraer más usuarios. Esta reside en que su chatbot de la web oficial es completamente gratuito, no requieres de ningún tipo de suscripción para hacer uso de él. Si bien al compararlo con ChatGPT, el generar respuestas este nos puede resultar mucho más simple y directo. Con tan solo pedirle que explique las cosas de manera más amplia o adaptadas para ti será suficiente.

Dos modelos de inteligencia artificial son los responsables del auge de la compañía china: DeepSeek V3 y DeepSeek R1. La V3, siendo un modelo LLM, se ha demostrado superior a la mayoría de las otras inteligencias artificiales al realizársele pruebas como la de programación, en al cual superó a GPT-4o, Qwen 2.5 72B  y Llama 2.1 405B, aunque estos posean menos parámetros. El verdadero boom de DeepSeek V3 ha sido el costo y tiempo de entrenamiento. Para V3 fueron necesarias 2,788 millones de horas de entrenamiento y se dice que solamente 5.5 millones de dólares, aunque la cifra real de la empresa china se desconozca. Esta estimación es significativamente menor al costo de los modelos de OpenAI, los cuales requirieron de alrededor de 80 millones de dólares. Además, el precio de uso de DeepSeek es menor al de OpenAI también, cobrando este 55 centavos de dólar por un millón de tokens, siento esto tan solamente el 3.6% del precio de la misma cantidad de tokens de OpenAI.

  Qué es DeepSeek y por qué está revolucionando la IA? - The New York Times

El otro gran modelo de Deepseek es R1, especializado en razonamiento. Ha sido capaz de superar el rendimiento de los modelos más avanzados de OpenAI en pruebas de matemáticas y programación. Con este modelo, es la primera vez que un modelo chino de código open source iguala a líderes occidentales en Silicon Valley. Por si eso no fuese poco, también se hicieron pruebas matemáticas MATH-500, consiguiendo DeepSeek 97.3% de aciertos y, nuevamente, superando el 96.4% de aciertos de OpenAI.

Claro, no todo puede ser color de rosas, existe un punto polémico principal en DeepSeek, la censura. Como todas las inteligencias artificiales, Gemini, ChatGPT, etc., DeepSeek está sujeto a los valores del país donde esta fue desarrollada, China en este caso, por lo que se adapta a sus regulaciones. Gracias a esto, el modelo en línea no responde a preguntas controversiales o sensibles, como aspectos geopolíticos. La buena noticia es que tales censuras no son a nivel modelo, lo que nos permite que, al descargar DeepSeek y utilizarlo de manera local, no tendremos dichas limitaciones. Claro que este pequeño detalle no opaca su gran variedad de funciones, incluso existen jóvenes en china quienes deciden recibir “terapia” por parte de DeepSeek antes de irse a dormir.

Reflexión sobre la «ética» en la ética de la IA – IDEES

El desarrollo de DeepSeek se basa en el aprendizaje por refuerzo puro sin datos etiquetados. Esto, aunque parezca muy simple, es una hazaña técnica considerada imposible hasta hoy en día, abriendo así nuevas puertas al entrenamiento de este tipo de sistemas. Este tipo de aprendizaje permite al modelo aprender por si mismo como muchos lo hicimos, a prueba y error. Si bien esta metodología al principio puede resultar en respuestas erróneas, el modelo será capaz de descubrir y desarrollar estrategias únicas de razonamiento para su continua mejora. Media vez se dominó tal sistema de aprendizaje DeepSeek refinó el modelo con otros diferentes entrenamientos bajo supervisión y dio vida a R1.

DeepSeek "unauthorized" for congressional use, House official says

El funcionamiento de DeepSeek es igual al del resto de modelos. Hay una pantalla con un campo de escritura para redactar tu prompt, el modelo genera tu resultado en el chat y tienes un historial de chats en el apartado izquierdo. Gracias a la forma en que se creó, DeepSeek puede entender contextos muy complejos de largas y elaboradas preguntas a la vez que mejora y aprende. Puedes hacerle preguntas, pedirle que te expliqué temas complejos de forma sencilla, escribir y depurar código, etc. Estoy seguro de que va a satisfacer todas las necesidades de inteligencia artificial que necesites.

Considero que DeepSeek se merece mucho más que una oportunidad, merece convertirse en tu IA de confianza, pero de manera local, no quieres regalar tu información. Esta empresa es un claro ejemplo de que no se necesitan cantidades (tan) exorbitantes de dinero o recursos para desarrollar proyectos funcionales y que pueden posicionarse fuertemente dentro de la competencia. Además, el hecho de ser open source lo hace mucho más increíble.

DeepSh*t: Exposing the Security Risks of DeepSeek-R1

Leave a Comment

No hay comentarios:

Con la tecnología de Blogger.