🧠Modelos de IAIntermedio

    DeepSeek Open Source: Análisis Completo del LLM que Sacudió a OpenAI

    DeepSeek-R1 llegó en enero de 2025, superó a o1 de OpenAI en razonamiento, y hundió el valor de NVIDIA un 17% en un día. Es open source, está en Hugging Face, y puedes descargarlo ahora mismo.

    12 min lectura

    ¿Qué es DeepSeek?

    DeepSeek es un laboratorio de inteligencia artificial chino fundado en 2023, subsidiaria de High-Flyer Capital Management (un hedge fund cuantitativo). Su primera incursión notable fue DeepSeek-V2 en 2024, pero el impacto real llegó con DeepSeek-R1 en enero de 2025.

    El 20 de enero de 2025, la acción de NVIDIA cayó un 17% en un día — la mayor pérdida de valor en la historia de la bolsa americana hasta ese momento.

    DeepSeek-R1: qué lo hace especial

    BenchmarkDeepSeek-R1o1 (OpenAI) AIME 2024 (matemáticas)79.8%79.2% MATH-50097.3%96.4% Codeforces (código)96.3 percentile96.6 percentile MMLU (conocimiento general)90.8%91.8%

    El costo de entrenamiento: DeepSeek afirmó entrenar su modelo de 671B parámetros por ~$6 millones. Las estimaciones para modelos comparables de OpenAI hablan de cientos de millones.

    Técnicas clave: Reinforcement Learning desde datos sintéticos (sin anotadores humanos), arquitectura Mixture of Experts (671B totales, ~37B activados por token), y destilación a modelos más pequeños.

    Los modelos disponibles (y sus pesos)

    DeepSeek-R1 completo: 671B parámetros. MIT License. Requiere múltiples GPUs.

    Modelos destilados (los que usarás tú):

    ModeloParámetrosHardware DeepSeek-R1-Distill-Qwen-1.5B1.5BCPU + 2GB RAM DeepSeek-R1-Distill-Qwen-7B7B8GB RAM o GPU 4GB DeepSeek-R1-Distill-Llama-8B8B8GB RAM o GPU 4GB DeepSeek-R1-Distill-Qwen-14B14B12GB RAM o GPU 8GB DeepSeek-R1-Distill-Qwen-32B32BGPU 16GB DeepSeek-R1-Distill-Llama-70B70BGPU 40GB+

    Cómo usar DeepSeek localmente

    Opción 1: Ollama (más simple)

    ollama pull deepseek-r1:7b
    ollama pull deepseek-r1:14b
    ollama run deepseek-r1:7b
    

    Opción 2: API de DeepSeek (cloud) — Compatible con formato OpenAI. Más barato que OpenAI/Anthropic por token.

    Opción 3: OpenClaw con DeepSeek vía Ollama

    {
      "agent": {
        "model": "ollama/deepseek-r1:14b",
        "endpoint": "http://localhost:11434"
      }
    }
    

    DeepSeek accesible desde WhatsApp o Telegram, sin API externa, sin coste por token.

    Las limitaciones reales (sin filtro)

    Verificación del costo: El dato de "$6 millones" no ha sido verificado independientemente.

    Benchmark vs. uso real: Superar a o1 en AIME no significa que sea mejor en todas las tareas.

    Preocupaciones de privacidad: La API de DeepSeek.com implica enviar datos a servidores chinos. Usa modelo local vía Ollama si te preocupa.

    Censura en ciertos temas: DeepSeek muestra evasión en ciertos temas políticos sensibles para el gobierno chino.

    El impacto en el ecosistema

    Para usuarios: Más opciones, más competencia, precios a la baja.

    Para semiconductores: Si puedes entrenar con menos hardware, la demanda proyectada de GPUs cambia.

    Para la comunidad open source: Un modelo de calidad GPT-4/o1 con licencia MIT es un recurso extraordinario. Hugging Face vio descargas récord.

    ¿Vale la pena usar DeepSeek en 2025?

    Para razonamiento matemático y científico: Sí, claramente.

    Como asistente general: Depende. Optimizado para razonamiento, puede sentirse menos natural en conversación casual.

    Para privacidad total: Usa el modelo local vía Ollama. MIT license, sin datos enviados a ningún servidor.

    Preguntas Frecuentes

    deepseekopen-sourcellmrazonamientochina-ia

    Artículos Relacionados

    🧠Modelos de IAPrincipiante

    Los 10 Mejores Modelos de IA Open Source en 2026

    Ranking honesto de los mejores modelos de IA open source en 2025, con análisis de fortalezas, licencias y casos de uso reales. Sin hype, con datos.

    15 min lectura
    🔓IA Open SourcePrincipiante

    IA de Código Abierto en 2026: La Guía Definitiva

    La IA open source creció un 900% en búsquedas. No es hype: hay modelos que compiten con GPT-4 y los puedes correr en tu laptop. Esta es la guía que necesitas para entender el ecosistema completo.

    18 min lectura
    🧠Modelos de IAPrincipiante

    ¿Es Llama Open Source? Todo lo que Necesitas Saber

    La respuesta corta: depende de cómo definas 'open source'. La respuesta larga: Llama tiene restricciones que lo hacen un caso especial. Te explico exactamente qué puedes y no puedes hacer con él.

    8 min lectura

    🦞 El briefing semanal de IA open source

    Cada lunes: un tutorial nuevo, las comparativas que importan y los trucos que solo compartimos por email. Ya somos +500 técnicos en la colonia.

    Usamos cookies analíticas para mejorar tu experiencia. Ni siquiera un crustáceo se escapa de las cookies 🦞🍪 Más info