Las mejores laptops para Ciencia de Datos

¿Eres un Científico de Datos y necesitas una buena laptop para tu trabajo? Veamos las mejores laptops para Ciencia de Datos, para los profesionales o estudiantes de las Ciencias de la Información, que harán el trabajo mucho más cómodo y productivo.

Como científico de datos, debes manejar una gran cantidad de datos, recopilarlos, analizarlos e interpretarlos de la manera que sea más beneficiosa para una empresa. Al manipular cantidades tan grandes, también necesitas una laptop que funcione eficientemente para facilitar el trabajo. El análisis estadístico necesita mucha potencia de cálculo, ya sea una laptop o una PC.

Ciencia de Datos y Machine Learning

La Ciencia de Datos y el Machine Learning están creciendo a un ritmo astronómico y las empresas ahora buscan profesionales que puedan examinar esa mina de oro que se encuentra en los datos y ayudarles a tomar decisiones comerciales rápidas de manera eficiente. La cantidad de puestos de trabajo para todos los profesionales de datos de EE. UU. ha aumentado en una cantidad impresionante.

¿Qué es la Ciencia de Datos?

La gente ha intentado definir la ciencia de datos durante más de una década,  Hugh Conway en 2010 ofreció una respuesta con un este diagrama de Venn que consta de tres círculos: matemáticas y estadísticas, experiencia en la materia (conocimiento sobre el dominio para abstraer y calcular) y habilidades de piratería. Básicamente, si puede hacer los tres, ya tiene un gran conocimiento en el campo de la ciencia de datos:

La ciencia de datos es un concepto que se utiliza para abordar los macrodatos e incluye la limpieza, preparación y análisis de datos. Un científico de datos recopila datos de múltiples fuentes y aplica el aprendizaje automático, el análisis predictivo y el análisis de sentimientos para extraer información crítica de los conjuntos de datos recopilados. Entienden los datos desde un punto de vista empresarial y pueden proporcionar predicciones y conocimientos precisos que se pueden utilizar para impulsar decisiones empresariales críticas.

Big data y ciencia de datos, el análisis de datos necesita potencia de cálculo

Como científico de datos, debes lidiar con una gran cantidad de datos, recopilarlos, analizarlos e interpretarlos, de la manera que sea más beneficiosa para una empresa. Cuando manejas cantidades tan grandes, también necesitas un ordenador portátil que funcione eficientemente, haciendo que el trabajo sea más fácil. El análisis estadístico necesita mucha potencia de cálculo, ya sea una laptop o una PC.

El software de análisis de datos, como el software de estadísticas de IBM SPSS o el Statistix, requiere un mínimo de memoria RAM para un funcionamiento sin problemas en una cantidad moderada de datos. Cuanto mayor sea el tamaño de los datos que manejes, mejor hardware necesitarás. Una buena laptop con el hardware adecuado de alta gama te ayudará a lidiar con mayores datos, sin colgarse ni dar tiempos de espera.

Qué debe tener la mejor laptop para Ciencia de Datos

El lema general para el análisis de datos es:

«Con mayores conjuntos de datos, se obtienen mayores conocimientos».


Lenovo Perú

Desafortunadamente, eso también se traduce en una mayor demanda de recursos de hardware. Entonces, ¿cuál es una buena configuración para comenzar para alguien que esté trabajando con la ciencia de datos?

Memoria RAM requerida

La RAM es lo más importante para la ciencia de datos porque es el cuello de botella principal con grandes conjuntos de datos. Las cosas se aceleran en un orden de magnitud cuando todo su procesamiento está en memoria o en RAM. Una RAM de 16 GB es ideal, pero esto no siempre está disponible en laptops menores a 600 dólares.

Un consejo: ¡No bajes de los 8GB!

Disco o unidades SSD

El segundo factor es el disco duro. Un SSD marcará una enorme diferencia, un SSD económico será 2-3 veces más rápido que un disco duro normal. Un buen SSD será de 4 a 5 veces más rápido.

CPU

La potencia de procesamiento siempre es buena, pero lo más probable es que la velocidad de almacenamiento o la RAM te atasquen.

No tiene sentido poder hacer un millón de cálculos por segundo si tu disco duro solo puede proporcionar hasta 1000 datos por segundo.

Después de maximizar estos, invierte el resto de tu presupuesto en una CPU «moderna», no necesariamente una «CPU» rápida, porque todas son rápidas hoy. Ten en cuenta que, a diferencia de la RAM y el almacenamiento, estos no se pueden actualizar, así que intenta obtener el más rápido que puedas pagar.

Tarjeta gráfica (GPU)

Si trabajas con una red neuronal profunda o simplemente NN (computación paralela), obtén la tarjeta gráfica con tantos núcleos/Shaders CUDA como puedas.

Teclado

No siempre es posible conseguir un teclado excelente con todas las ventajas informáticas mencionadas. Entonces, si va a escribir mucho, obtén un teclado externo y un mouse/trackball.

Mi recomendación es asegurarse de que sean ergonómicos: la RSI y la tendinitis son desagradables.

Monitor

Mínimo 14-15 pulgadas. Probablemente terminarás ingresando a máquinas más potentes en algún momento, por lo que la interfaz/pantalla de estado real también se vuelve muy importante.

Puertos

Otra ventaja es asegurarse de que tu laptop tenga un puerto Thunderbolt (USB tipo C) para que puedas transferir datos hacia/desde unidades externas a velocidades ultrarrápidas. La mayoría de las laptops actuales cuentan con uno.

SO

Mac frente a Windows frente a Linux: depende de la industria/empresa para la que trabajes o de tus preferencias personales. Pero recomendaría optar por una laptop que pueda admitir un sistema operativo con sabor a Linux aparentemente como una Lenovo/MacBook.

Un sistema operativo con sabor a Linux (Windows no se conecta bien y requiere muchos extras para adaptarse a un flujo de trabajo típico que terminará en la nube) puede convertirse en algún momento en tu sistema operativo predeterminado.

Resumen: La mejor regla general al elegir una laptop es obtener tantos núcleos de un procesador como sea posible y asegurarte de que tu laptop admita hasta 16 GB de RAM.

Nota: Las tarjetas gráficas no se pueden actualizar, así que obtén una con tantos núcleos CUDA como puedas pagar. Si sabes que los necesitarás, por supuesto.

Cuál es la mejor laptop para análisis de datos

No existe la mejor laptop para análisis de datos como tal. De hecho, cualquier laptop sería buena para fines de análisis si realiza toda la informática en la nube.

Por lo tanto, esta sección se centrará principalmente en aquellos que intentan hacer la mayor cantidad de computación posible en sus nuevos equipos y esto, a su vez, depende del tipo de software que utilicen y también del tipo de análisis de datos.

Comenzaré con lo básico para aquellos que recién se están iniciando en el campo, tal vez usando Lynda.com o aprendiendo las herramientas por sí mismos. Si no eres un principiante y planeas hacer todos tus análisis de datos en casa, simplemente pasa a la sección de hardware.

Haciendo análisis de datos

Hay dos formas de hacer análisis de datos:

  • usando la nube
  • usando tu plataforma.

A) Usando la Nube (recomendable empezar a hacerlo)

Usar la nube es otra forma de decir «alquilar un servicio informático» de grandes empresas como Amazon para hacer todos los cálculos a través de su enorme grupo de computadoras.

Un buen entorno de nube como Amazon Web Services te dará acceso a clústeres de múltiples máquinas EMR bajo demanda por hora. Incluye acceso a todos sus almacenes de datos como ElasticSearch y Redshift y más.

Para usarlo, todo lo que necesita es una computadora con 4-8 GB de RAM y una conexión a Internet. Esto no es solo ahorro de tiempo, sino también de dinero. La batería adicional siempre es algo bueno para que pueda verificar el progreso fuera de casa.

Todo lo que necesitas para esto es una computadora portátil con una terminal para conectarse.

B) Usando tu equipo en casa

Construir una plataforma para el «análisis de big data» puede llevar mucho tiempo y ser un desafío. Necesitarás varias máquinas con al menos:

  • Una CPU multinúcleo (las CPU AMD multinúcleo tienen mejores especificaciones/dinero)
  • 16 GB de RAM.
  • Unidades de estado sólido en configuraciones RAID.

Software y especificaciones

El simple hecho de decir análisis estadístico no te dice exactamente qué vas a necesitar en una laptop. Entonces, en esta sección, voy a repasar brevemente el software más utilizado en Análisis de datos y hablar sobre las especificaciones en las que deberías enfocarte.

1.- Para quienes están aprendiendo Ciencia de Datos

Si eres un estudiante, probablemente termines usando una combinación de los siguientes programas / idiomas:

  • R
  • Python
  • SAS
  • SPSS
  • Stata
  • Tableu
  • MatLab

La mayoría de estos son solo bibliotecas, cualquier laptop con al menos una CPU de doble núcleo con 2.5GHz y 8GB de RAM puede manejar estas bibliotecas e idiomas.

Seguro que no necesitarás hacer ningún procesamiento de big data. Si lo haces, las universidades tienen muchos servidores para eso.

Instalación de módulos/extensiones

Los módulos para la ciencia de datos disponibles en R y Python tardan un tiempo en instalarse, por lo que la única dificultad real aquí es tener el ecosistema listo para funcionar.

Si el proceso será difícil o no dependerá del sistema operativo con el que esté trabajando. Creo que es mucho más fácil instalarlo en sistemas Linux que en MacBooks y es mucho más fácil instalarlos en MacBooks que en máquinas con Windows.

Si no estás dispuesto a usar un sistema Linux. Recomiendo OSX como opción de respaldo. Si el precio es un problema, entonces probablemente quiera mirar modelos más antiguos, todos funcionarán bien ya que todavía tienen su sistema operativo actualizado regularmente.

2. Para quienes son Científicos de Datos

Usamos el mismo software con la adición de RStudio, Rapid Miner, Spotfire y, por supuesto, Hadoop (esto implica usar conjuntos de datos de GB).

Hay tres tipos de ciencia de datos según el problema: volumen, velocidad o variedad.

Para problemas de volumen y velocidad: siempre es mejor obtener una computadora/dispositivo portátil que te permita conectarte sin problemas a los servicios en la nube.

Para problemas de variedad: es mejor tener una plataforma en casa o una laptop completamente equipada para la ciencia de datos, que será el punto principal de esta publicación

Machine learning

Los buenos resultados de los algoritmos de aprendizaje automático dependen en gran medida del tamaño de los datos; cuanto más tengas, mejores serán los resultados. Esto se traduce en más memoria y potencia de CPU.

Si tu enfoque es el aprendizaje automático, entonces tu presupuesto debe gastarse en memoria RAM y núcleos de #CPU. Si usas R (paquete RevoScaleR) para esto, también puedes usar núcleos/sombreadores de GPU para acelerar el proceso.

R

Aprendizaje automático o no, trabajar con grandes conjuntos de datos a través de R es mucho más fácil con más núcleos.

Sin embargo, solo hasta cierto punto, ya que el cuello de botella principal sigue siendo la E/S del disco y la memoria. En otras palabras, te quedarás sin «espacio de almacenamiento» para guardar los datos que tienes mucho antes de quedarte sin #núcleos. Dadas las limitaciones de las computadoras/laptops, el límite superior es de unos 8 núcleos.

Hadoop

Hadoop tiene una forma innovadora de mejorar los modelos con conjuntos de datos limitados. Surgió de la necesidad de utilizar grandes conjuntos de datos en vista del precio y las limitaciones tecnológicas en algún momento.

Dado que los algoritmos de aprendizaje automático generan mejores resultados con más y más datos (particularmente para técnicas como la agrupación, la detección de valores atípicos y los recomendadores de productos), un buen enfoque ahora es usar una «pequeña muestra» del conjunto de datos completo, la pequeña muestra básicamente será cualquier cantidad que quepa en la memoria de su computadora para que pueda ejecutar tareas de explotación y obtener resultados en conjuntos de datos completos sin muestrearlo todo.

Todo lo que tienes que hacer ahora es escribir un map-reduce jo (guión PIG o HIVE), ejecutarlo directamente en Hadoop sobre el conjunto de datos completo para obtener los resultados en tu laptop.

Independientemente, Hadoop también proporciona almacenamiento escalable linealmente y potencia de procesamiento para que ahora puedas almacenar todos los datos en formato RAW y usar el conjunto de datos completo para obtener modelos mejores y más precisos.

Python/Pandas

La mayoría de las personas también usan Pandas para leer archivos CSV y Excel para limpiar, filtrar, particionar, agregar y resumir datos con la intención de producir gráficos simples. Esto no requiere ningún hardware especial, puedes hacerlo en cualquier laptop.

Del mismo modo, si tienes una aplicación que requiere la fusión de tablas grandes con miles de millones de filas para crear un vector para cada objeto de datos, puedes usar secuencias de comandos HIVE o PIG que deberían hacer que este trabajo sea muy eficiente en cualquier computadora/laptop.

Por otro lado, entrenar una red neuronal pesada definitivamente está fuera del alcance de las laptops porque tienen que realizar análisis de medición repetidos (lo que aumenta la covarianza de la varianza exponencialmente y hace que tu computadora se quede sin recursos).

Entonces, en conclusión, La mayoría de los algoritmos de aprendizaje automático son básicamente intensivos en CPU y hambrientos de memoria, pero algunos requieren el uso de servidores/servicios en la nube.

Las mejores laptops para Ciencia de Datos

¿Cuál es el mejor portátil para trabajar con Ciencia de Datos? Aquí hay una lista de laptops altamente sofisticadas con excelentes configuraciones a las que puedes referirte para una mejor elección:

1. Lenovo Ideapad 3

La mejor computadora portátil económica para el análisis de datos

Lenovo Ideapad Gaming 3 15 Las mejores laptops para Ciencia de Datos

Comprar en Amazon.com

Comprar en Amazon.es

Pantalla 15.6″ FHD (1920 x 1080) | Procesador AMD Ryzen 5 5600H | Tarjeta gráfica NVIDIA GeForce GTX 1650 | Memoria RAM 8 GB DDR4 | Almacenamiento 256 GB SSD | Windows 11 Home

La laptop Lenovo Ideapad 3 es la más básica y con mayor rendimiento para prácticamente CUALQUIER tipo de análisis de datos. También es más que ideal para cualquiera que esté comenzando con el análisis de datos, esto incluye a los estudiantes que investigan con O toman clases de Análisis de datos.

RAM de 8 Gb: es suficiente para modelos estadísticos simples y ML/DL de pequeños conjuntos de datos. Obviamente, también puede ejecutar cualquier paquete y software de análisis de datos (R/MatLab/SAS, etc.).

Dado que Windows consume 2 GB, los programas en segundo plano 1 GB, aún le quedan 4,7 GB de RAM.

El límite superior que puede manejar esta computadora portátil debe ser de:

  • 5000MB(5G)/300MB~16*300k filas=4500K filas con 4 variables.
  • La probabilidad de que alguien que comienza con el análisis de datos tenga que trabajar con un conjunto de datos tan grande es muy escasa.
  • Si alguna vez necesitas trabajar en conjuntos de datos más grandes, recuerda que la nube siempre está ahí para ti para un procesamiento aún más rápido.
  • Y, de hecho, esa es la verdad sobre el análisis de datos hoy en día.

Es mucho más fácil ingresar al análisis de datos y la ciencia de datos con cualquier computadora ahora porque si pagas por un servicio basado en la nube, puedes hacer cualquier cálculo de forma remota en un clúster.

P: Pero si no quiero usar la nube. ¿Qué pasa si me encuentro con conjuntos de datos aún más grandes? Como dije, aún puedes ejecutar conjuntos de datos mucho más grandes en una laptop siempre que aumentes tu RAM. Esta laptop se puede actualizar a 16 GB.

Si intentas perforar conjuntos de datos aún más grandes, la laptop se quedará sin RAM y recurrirá a la unidad de almacenamiento.

En tal escenario (~12000K filas con 4 variables), las computadoras con un SSD PCIe NVME no serán tan lentas como las computadoras HDD ya que son entre 5 y 17 veces más rápidas para leer/escribir datos.

GPU 1650GTX: antes de pensar en comprar una laptop a bajo precio, ten en cuenta que las laptops más baratas no tendrán ningún tipo de GPU dedicada. Incluso aquellas con GPU dedicadas serán más caras o te costarán un poco menos que esta y lo más probable es que vengan con un 1050Ti/MX450 que es varias veces más débil que un 1650GTX (estos dos tienen muchos menos núcleos CUDA).

La verdad es que todas las laptops con GPU son lo suficientemente buenas como para funcionar con la computación paralela, sin embargo, ¿por qué pagar 30 dólares menos por una GPU mucho más débil?

2. Acer Aspire 5

La mejor laptop económica para análisis de datos

Mejores laptops para Ciencia de Datos 2020

Comprar en Amazon.com

Comprar en Amazon.es

Pantalla 5 15.6″ FHD | Procesador 11th Intel Core i3-1115G4 (hasta 4.1GHz) | Memoria RAM 8GB | Almacenamiento 512 GB NVMe SSD | Windows 10 S

Este es el tipo de modelo que recomendaría para aquellos que en verdad recién están comenzando con el análisis de datos, o para un científico de datos que usará solamente la nube para cualquier proceso.

Dado que principalmente tomarás clases y/o aprenderás a codificar/usar bibliotecas que tienen muestras muy pequeñas, no necesitarás nada más que una laptop económica con Windows 10. Este también es el caso de alguien que solo usa esta laptop para codificar y un servicio en la nube para hacer todo el procesamiento (aunque aún puedes usarla para manejar conjuntos de datos muy grandes, siempre que aumentes la memoria RAM respectivamente).

P: Espera, espera, esta laptop es demasiado económica, ¿realmente será tan buena? Para fines de ciencia de datos, SÍ.

La mayoría de las personas no tienen idea de cuán rápidos son los procesadores modernos, independientemente de cuán baratos sean y el hecho de que se trata de RAM y luego de almacenamiento. Míralo de cerca, también tiene un SSD NVMe.

También tiene una resolución FHD, lo que significa que va a dar tanto espacio como la primera laptop (dos ventanas abiertas una al lado de la otra: una para la documentación y otra para el IDE/Visualización de datos es cómodo).

Nota: esta laptop no tiene una GPU dedicada, por lo que cualquier procesamiento paralelo estará restringido al uso de la cantidad de subprocesos proporcionados por la CPU, que es 4.

3. MacBook Pro M1 

La mejor laptop Mac para análisis de datos

Apple MacBook Pro

Comprar en Amazon.com

Comprar en Amazon.es

Pantalla 16-inch | Chip M1 Pro de Apple con CPU de diez núcleos y GPU de dieciséis núcleos |  Memoria RAM 16 GB | Almacenamiento 512 GB SSD

El lanzamiento de las MacBooks M1 Pro 2021 ha revolucionado el mundo de las laptops, convirtiendo la elección de una laptop Apple en una de las opciones más inteligentes para cualquier Científico de Datos. Si ya estás ganando mucho dinero en este campo, definitivamente será obvia la elección inteligente de una MacBook Pro con chip M1 Pro 2021.

Aquí están las razones:

  • El entorno tipo UNIX. Como se establece en la sección «cómo comprar la mejor computadora para la ciencia de datos», OSX es el sistema operativo más eficiente en el trabajo para la ciencia de datos, tan bueno como un sistema Linux.
  • No se trata solo de cómo python funciona mejor en un sistema UNIX, sino también de cómo todos los paquetes de software e idiomas están disponibles de inmediato.
  • Portabilidad y duración de la batería inigualable: para aquellos que siempre se abren camino hacia un servidor, estas dos características se vuelven súper útiles. Puedes moverte de un lugar a otro y seguir ejecutando grandes cantidades de datos desde cualquier lugar y en cualquier momento (siempre que tengas una conexión Wifi o incluso datos móviles).
  • Y por último el chip M1 Pro: para fines de ciencia de datos, supera por completo a cualquier CPU «móvil» de Intel/AMD, con un rendimiento más rápido en este campo debido al procesamiento paralelo debido a su alto número de núcleos.

Como dije, es un alto número de núcleos, es más alto que lo que encontrará en cualquier chip Intel/AMD móvil.
Se dice que la API y la arquitectura están optimizadas para el «aprendizaje automático» y es cierto.

Sin embargo, hay un truco: para fines de procesamiento de GPU, no muchas bibliotecas han adoptado la arquitectura de GPU. Todavía pueden encontrar útil la GPU en algunas aplicaciones en las que realmente superará a cualquier CPU (nuevamente debido al alto número de núcleos).

MacBook Air M1 Pro frente a MacBook M1 Pro: Sin embargo, al 85% de los usuarios de ciencia de datos les irá bien con la MacBook Air, ya que tiene aún más potencia de «CIENCIA DE DATOS» que la mayoría de las laptops para juegos para fines de procesamiento no paralelo (la RAM se puede actualizar a 16 GB y SSD a 1 TBNVMe).

Es posible que el 15 % restante deba considerar la MacBook Pro de 13″ si desea ejecutar conjuntos de datos que requieren 32 GB de RAM.

4. Dell XPS 13

Mejor UltraBook de Windows para Ciencia de Datos

Dell XPS 13 9360

Comprar en Amazon.com

Comprar en Amazon.es

Pantalla 13.3″ InfinityEdge Touchscreen FHD (1920×1080) | Procesador Intel 8th Gen Quad-Core i5-8250U | Almacenamiento 128GB M.2 SSD | Memoria RAM 8 GB  | Backlit Keyboard | Windows 10

Con cualquier laptop puedes entrar en el mismo ritmo como lo harías con una MacBook, siempre que instales LINUX en ella.

Si tienes el presupuesto, siempre es bueno optar por uns Dell XPS o una Lenovo ThinkPad, por dos razones:

  • Ambas funcionarán inmediatamente después de configurar una distribución de Linux. No habrá problemas de compatibilidad con cada pieza de hardware.
  • Obtendrás casi la misma calidad de construcción/duración de la batería y distribución del peso de una MacBook.
  • Este modelo Dell XPS 13 no tiene GPU.

5. Lenovo ThinkPad E15 2022

La mejor laptop con Windows para el análisis de datos

Lenovo ThinkPad E15

Comprar en Amazon.com

Comprar en Amazon.es

Pantalla 15.6″ FHD 1080p | Procesador AMD 8-Core Ryzen 7 4700U (supera al i7-10710u) | Memoria RAM 16 GB DDR4 | Almacenamiento 512 GB PCIe SSD | Wi-Fi 6 | Windows 10 Pro

Esta laptop Lenovo Thinkpad te permitirá trabajar sin problemas con entornos similares a Unix, con todas las especificaciones necesarias para procesar una muestra muy grande de datos.

De hecho, los thinkpads son la opción para cualquiera que quiera usar una distribución de Linux en una laptop.


Lenovo México

Hay varios modelos y algunas versiones de ThinkPads y la mayoría te permitirá elegir el tamaño de RAM que desees (hasta 64 GB) y también tiene una amplia variedad de opciones para el procesador, como se muestra aquí: Lenovo OEM E15 ThinkPad.

Sin GPU dedicada: ninguno de los ThinkPad ofrece una GPU dedicada. Entonces, si estás pensando en ejecutar computación paralela para Depp Learning/Machine Learning/Neural Networks en su RIG (sin el uso de un servicio de granja), entonces deberías considerar otras opciones.

Al igual que la MacBook Pro y la Dell XPS, puedes usar las ThinkPad para probar la muestra más grande de su conjunto de datos que pueda caber en la memoria, pero deja el procesamiento final en una granja de computadoras.

Conclusión

La computación en la nube



Los datos modernos (aunque pueden caber en la memoria RAM de las laptops y PCs de escritorio) generalmente se realizan en granjas de computadoras porque se procesarán instantáneamente (en horas o incluso minutos en lugar de días).

Y cuando te lances a la industria en busca de trabajo, eso te ayudará a destacar como candidato. No se trata solo de la experiencia, se trata de la voluntad y la capacidad de familiarizarse con muchas cosas.

Para fines de computación en la nube, realmente solo necesitas una máquina básica y no es necesario invertir en laptops como la MacBook Pro, Dell XPS o incluso estas ThinkPads. Sin embargo, sé que cuando comencé no estaba muy preparado para cambiar de mi laptop a un servicio remoto en la nube o simplemente a cualquier servidor con mejores recursos. La mayoría de ustedes muy seguramente todavía quiere jugar y probar la mayor cantidad de datos posible en un pequeño caballo de batalla.

 

Un comentario en «Las mejores laptops para Ciencia de Datos»

Deja una respuesta

Tu dirección de correo electrónico no será publicada.