🔓IA Open SourceIntermedio

    Ollama: Guía Completa para Instalar y Usar LLMs Locales

    Ollama es la forma más fácil de ejecutar LLMs en tu ordenador. Esta guía cubre todo: instalación, modelos, integración con agentes y optimización.

    14 min lectura

    Qué es Ollama y por qué es importante

    Ollama es una herramienta de línea de comandos que simplifica la descarga, gestión y ejecución de modelos de lenguaje en tu ordenador local. Piensa en él como un "Docker para LLMs": un solo comando para descargar y ejecutar cualquier modelo.

    ¿Por qué importa? Porque antes de Ollama, ejecutar un LLM local requería compilar código C++, configurar dependencias, descargar pesos manualmente y rezar para que todo funcionara. Con Ollama, es literalmente:

    ollama run llama3.3
    

    Eso es todo. Un comando. El modelo se descarga, se optimiza para tu hardware y empieza a funcionar.

    Instalación paso a paso: Mac, Linux y Windows

    Mac:

    # Descarga e instala desde la web
    curl -fsSL https://ollama.com/install.sh | sh
    
    # O con Homebrew
    brew install ollama
    

    Linux (Ubuntu/Debian):

    curl -fsSL https://ollama.com/install.sh | sh
    

    Windows:

    Descarga el instalador desde ollama.com/download. Ejecuta el .exe y sigue el asistente. Compatible con Windows 10 y 11.

    Verifica la instalación:

    ollama --version
    # Debería mostrar: ollama version 0.x.x
    

    Después de instalar, descarga tu primer modelo:

    ollama pull llama3.3
    ollama run llama3.3
    

    Modelos disponibles: cuál elegir según tu hardware

    ModeloTamañoRAM necesariaMejor paraPhi-3 Mini (3.8B)2.3 GB4 GBOrdenadores antiguos, tareas básicasLlama 3.2 7B4.7 GB8 GBUso general, buen equilibrioMistral 7B4.1 GB8 GBConversación, instruccionesCodeLlama 13B7.4 GB16 GBProgramaciónLlama 3.3 70B (Q4)40 GB48 GBMáxima calidadDeepSeek Coder V28.9 GB16 GBCódigo y razonamiento Recomendación: empieza con llama3.2 (7B). Es el mejor modelo general para 8 GB de RAM.

    Para listar todos los modelos disponibles:

    ollama list    # Modelos descargados
    ollama search  # Buscar en el registro
    

    Integración con agentes: OpenClaw, ZeroClaw y más

    Ollama expone una API REST compatible con OpenAI en localhost:11434. Esto significa que cualquier herramienta que soporte la API de OpenAI puede usarse con Ollama cambiando solo la URL base.

    Conectar con OpenClaw:

    # config.yaml
    model:
      provider: ollama
      name: llama3.3
      base_url: http://localhost:11434
      temperature: 0.7
    

    Conectar con cualquier cliente OpenAI:

    from openai import OpenAI
    
    client = OpenAI(
        base_url="http://localhost:11434/v1",
        api_key="not-needed"
    )
    
    response = client.chat.completions.create(
        model="llama3.3",
        messages=[{"role": "user", "content": "Hola"}]
    )
    

    Esta compatibilidad hace que migrar de OpenAI a Ollama sea trivial: cambias la URL base y listo.

    Tips de optimización para mejor rendimiento

    1. Usa cuantización adecuada: Los modelos vienen en diferentes niveles de cuantización (Q4, Q5, Q8, FP16). Q4 usa menos RAM y es más rápido, con una pérdida mínima de calidad.

    # Descargar versión Q4 (más ligera)
    ollama pull llama3.3:q4_0
    

    2. Configura GPU correctamente: Ollama detecta GPUs NVIDIA automáticamente. Para AMD, necesitas ROCm instalado. Para Apple Silicon, usa Metal (activado por defecto).

    3. Ajusta el contexto: Reducir la ventana de contexto reduce el uso de memoria:

    ollama run llama3.3 --ctx-size 4096
    

    4. Mantén el modelo en memoria: Ollama descarga el modelo de RAM tras 5 minutos de inactividad. Para mantenerlo cargado:

    OLLAMA_KEEP_ALIVE=-1 ollama serve
    

    5. Múltiples modelos simultáneos: Ollama soporta ejecutar varios modelos a la vez si tienes suficiente RAM. Perfecto para model routing local.

    Preguntas Frecuentes

    ollamallm-localtutorialinstalacionmodelos

    Artículos Relacionados

    🦞 El briefing semanal de IA open source

    Cada lunes: un tutorial nuevo, las comparativas que importan y los trucos que solo compartimos por email. Ya somos +500 técnicos en la colonia.

    Usamos cookies analíticas para mejorar tu experiencia. Ni siquiera un crustáceo se escapa de las cookies 🦞🍪 Más info