Saltar al contenido

Qué es Ollama, cómo se usa y qué hardware necesita tu laptop o PC

Laptop ejecutando Ollama con inteligencia artificial local

Ollama es una herramienta de código abierto que te permite descargar y ejecutar modelos de inteligencia artificial de lenguaje (LLM) directamente en tu computadora, sin conexión a internet y sin pagar suscripciones a servicios en la nube. En pocas palabras: pones la IA en tu propia laptop o PC y la usas desde ahí, con total privacidad.

Lanzada en 2023 y consolidada como estándar en 2026, Ollama permite correr modelos como Llama 3, Mistral, Gemma, Phi-3 y DeepSeek, entre docenas más, todo desde una terminal o desde una interfaz web. Es compatible con Windows, macOS y Linux.

Si todavía estás evaluando qué laptop comprar antes de instalar Ollama, te recomendamos revisar primero nuestra guía de las mejores laptops para inteligencia artificial en 2026, donde encontrarás opciones concretas por presupuesto y caso de uso.

¿Cómo funciona Ollama? Guía de inicio rápido

El flujo básico tiene tres pasos: instalar Ollama, descargar un modelo y comenzar a chatear. No necesitas ser programador para empezar.

Paso 1: Instalar Ollama

Ve a ollama.com, descarga el instalador para tu sistema operativo y ejecútalo. En Windows y macOS es un instalador gráfico estándar. En Linux se instala con un solo comando en la terminal. El proceso completo toma menos de dos minutos.

Paso 2: Descargar un modelo de IA

Abre la terminal (o el símbolo del sistema en Windows) y escribe, por ejemplo:

ollama run llama3.2

Ollama descarga el modelo automáticamente y abre el chat en cuestión de segundos. Puedes explorar todos los modelos disponibles en ollama.com/library. Cada modelo indica su tamaño en disco y los requisitos mínimos de memoria.

Paso 3: Usar la interfaz web (opcional pero recomendado)

Si prefieres una interfaz visual similar a ChatGPT, instala Open WebUI sobre Ollama. Obtendrás historial de conversaciones, carga de documentos PDF y gestión de múltiples modelos desde el navegador, todo procesado en local, sin que ningún dato salga de tu equipo.

Requisitos de hardware para usar Ollama en tu laptop o PC

Este es el punto crítico. Ollama puede correr en casi cualquier computadora moderna, pero el rendimiento depende directamente del hardware disponible. La regla de oro es simple: el modelo completo debe caber en la memoria disponible —RAM o VRAM— porque si no cabe, el sistema lo carga parcialmente en disco y la velocidad cae de forma drástica.

El tipo de procesador también importa. Si quieres entender en profundidad cómo influye el chip en el rendimiento con IA, revisa nuestra comparativa de los mejores procesadores para laptops en 2026.

¿RAM o VRAM? Entiende la diferencia antes de instalar Ollama

Ollama puede usar tres fuentes de memoria, en orden de velocidad:

  • VRAM de GPU dedicada — La opción más rápida. Si tienes una tarjeta NVIDIA o AMD con suficiente VRAM, Ollama la usará por defecto y automáticamente.
  • Memoria unificada (en chips Apple Silicon o AMD Ryzen AI) — Muy eficiente porque la CPU y la GPU comparten el mismo pool de memoria sin transferencias entre chips.
  • RAM del sistema en modo CPU — Funciona, pero la generación de texto es lenta. Espera entre 2 y 6 tokens por segundo en el mejor caso con modelos medianos.

Configuraciones de PC y laptop recomendadas para Ollama en 2026

A continuación encontrarás las configuraciones ordenadas de menor a mayor capacidad. Cada nivel corresponde a modelos de IA distintos y a experiencias de uso diferentes.

Nivel 1 — Configuración mínima (para experimentar y aprender)

  • RAM: 8 GB
  • GPU: Integrada (Intel UHD, AMD Radeon integrada)
  • Almacenamiento: SSD con al menos 20 GB libres
  • Modelos compatibles: Llama 3.2 (1B y 3B), Phi-3 Mini, Gemma 2B
  • Velocidad esperada: 3–8 tokens por segundo. Funcional para explorar, no para producción.

Nivel 2 — Configuración intermedia (uso diario productivo)

  • RAM: 16 GB
  • GPU: NVIDIA RTX 3060 (8 GB VRAM) o superior / Apple M2 con 16 GB de memoria unificada
  • Almacenamiento: SSD NVMe con 50 GB libres
  • Modelos compatibles: Llama 3.1 (8B), Mistral 7B, DeepSeek-R1 7B, Gemma 9B
  • Velocidad esperada: 20–50 tokens por segundo. Experiencia fluida, comparable a las versiones básicas de ChatGPT.

🛒 ¿Buscas una laptop para este nivel? Las opciones con RTX 4060 y 16 GB RAM ofrecen la mejor relación precio-rendimiento para correr modelos de 7B sin esfuerzo. Ver laptops con RTX en Amazon USA | Ver en Amazon España

Nivel 3 — Configuración avanzada (modelos grandes y multimodales)

  • RAM: 32 GB
  • GPU: NVIDIA RTX 4070 Ti / RTX 4080 (12–16 GB VRAM) / Apple M3 Pro o M4 con 36 GB de memoria unificada
  • Almacenamiento: SSD NVMe de 1 TB
  • Modelos compatibles: Llama 3.1 (70B cuantizado a Q4), DeepSeek-R1 32B, modelos de visión como LLaVA y Llama 3.2 Vision
  • Velocidad esperada: 30–80 tokens por segundo según el modelo. Experiencia premium comparable a GPT-4o en tareas de razonamiento.

Para este nivel, las laptops con NPU integrada de nueva generación como el Apple M4 Pro o los chips AMD Ryzen AI 9 ofrecen además una eficiencia energética que ninguna configuración de escritorio puede igualar en portabilidad.

💡 Laptops recomendadas para el nivel avanzado: El MacBook Pro M4 Pro con 24 GB y las opciones con RTX 4070 son en 2026 las más equilibradas para Ollama. Consultar precios en Amazon USA.

Nivel 4 — Workstation o PC de escritorio para uso profesional

  • RAM: 64 GB o más
  • GPU: NVIDIA RTX 4090 (24 GB VRAM) o múltiples GPUs en paralelo
  • Almacenamiento: SSD NVMe de 2 TB o más
  • Modelos compatibles: Llama 3.1 405B cuantizado, DeepSeek-Coder V2, modelos multimodales de alta resolución
  • Velocidad esperada: 60–120 tokens por segundo. Ideal para desarrolladores, investigadores y empresas que requieren privacidad total. Este perfil se superpone con el de las laptops para machine learning, donde encontrarás opciones portátiles de alta gama.

Tabla resumen: hardware vs modelos compatibles con Ollama

Usa esta tabla para identificar qué modelos puedes correr según el hardware que ya tienes o que planeas comprar:

ConfiguraciónRAM / VRAM disponibleModelos recomendadosVelocidad aprox.
Mínima (GPU integrada)8 GB RAMPhi-3 Mini, Llama 3.2 1B–3B3–8 t/s
Intermedia16 GB RAM + 8 GB VRAMMistral 7B, Llama 3.1 8B20–50 t/s
Avanzada32 GB + 12–16 GB VRAMDeepSeek-R1 32B, Llama 70B Q430–80 t/s
Profesional64 GB + 24 GB VRAMLlama 405B, modelos multimodales60–120 t/s

¿Qué sistema operativo es mejor para Ollama: Windows, Linux o Mac?

Los tres son compatibles, pero con diferencias importantes según el hardware que tengas:

  • macOS con Apple Silicon (M2, M3, M4): La mejor opción en portátiles. La arquitectura de memoria unificada elimina el cuello de botella entre CPU y GPU. Un MacBook Pro M4 con 24 GB equivale en la práctica a una laptop Windows con 8–10 GB de VRAM dedicada para Ollama, con un consumo energético radicalmente menor.
  • Windows con GPU NVIDIA: La opción más potente si priorizas rendimiento bruto. Ollama aprovecha CUDA de forma nativa. Las RTX 40xx y 50xx ofrecen el mayor throughput disponible en portátiles para correr modelos grandes.
  • Linux: Rendimiento idéntico a Windows con NVIDIA, con menor overhead del sistema. Compatible con ROCm para GPUs AMD. Preferido por desarrolladores que buscan máximo control sobre el entorno.

Preguntas frecuentes sobre Ollama y requisitos de hardware

¿Ollama funciona sin GPU?

Sí. Ollama puede correr completamente en CPU, pero la velocidad de generación de texto baja de forma significativa. Para modelos de 7B parámetros en modo CPU puro, puedes esperar entre 2 y 6 tokens por segundo en una laptop moderna. Es funcional para experimentar, no para uso intensivo.

¿Cuánto espacio en disco ocupa Ollama?

El instalador de Ollama pesa menos de 500 MB. El espacio real lo consumen los modelos: un modelo de 7B cuantizado en Q4 ocupa entre 4 y 5 GB. Un modelo de 70B cuantizado puede ocupar entre 40 y 45 GB. Se recomienda tener al menos 100 GB libres si planeas probar varios modelos simultáneamente.

¿Ollama es gratuito?

Sí, Ollama es completamente gratuito y de código abierto. No tiene planes de pago ni limitaciones de uso. Los modelos que descarga también son mayoritariamente gratuitos bajo licencias abiertas como Apache 2.0 o MIT.

¿Qué tan privado es Ollama?

Total. Todo el procesamiento ocurre en tu hardware local. Ninguna conversación, documento ni dato sale de tu computadora. Es una de las razones principales por las que empresas y profesionales eligen Ollama sobre servicios en la nube para tareas con información sensible.

¿Puedo usar Ollama con una laptop gaming?

Sí, y es una excelente opción. Las laptops gaming con GPUs NVIDIA RTX 4060 o superiores ofrecen una experiencia muy fluida con modelos de 7B a 13B parámetros. Si ya tienes una laptop orientada a trabajo técnico con buena GPU, tienes una base sólida para correr IA local sin inversión adicional.

¿Qué diferencia hay entre Ollama y usar ChatGPT?

ChatGPT procesa tus datos en servidores de OpenAI en la nube: requiere internet, tiene límites de uso y tus conversaciones pasan por sistemas externos. Ollama corre el modelo en tu propio equipo: sin internet, sin límites artificiales y con privacidad total. La contrapartida es que necesitas hardware suficiente y el modelo que uses puede tener menor capacidad que GPT-4o en tareas muy complejas.