Recientemente @pablooliete me ha planteado en las redes sociales, el reto de hacer una selección «condensada» y parcialmente personalizada de la selección de libros de Data Science para 2021, aparecida en el siguiente artículo de medium.com:

Tal y como quedó establecido en el reto, he seguido los mismos temas que el el articulista: data science, estadística, machine learning y deep learning, habiendo dejado fuera la Inteligencia artificial (IA) no basada en Deep Learning, dado que se presencia era incidental (sólo está explícitamente nombrada en el título de 1 de los 21 libros citados en el artículo y en general, la IA es un contenido colateral en sus índices).

Por otro lado y, de acuerdo nuevamente con el reto, he intentado combinar libros para expertos generalistas y curiosos en general, como por ejemplo directivos de empresas y, por otro lado, libros para especialistas, para aquel que quiera y pueda absorber un tema en profundidad, incluso «manchándose de código». En todo caso, los libros de mi lista se trata de libros que he leído, total o parcialmente.

Libros generalistas en data science

1.- The Art of Data Science — A Guide for Anyone Who Works With Data

Autores: Roger D. Peng and Elizabeth Matsui

Image for post

Sobre este libro, he de reconocer que tengo debilidad por Roger D. Peng. Ha sido profesor mío en diversos cursos MOOC en Coursera, en la especialización de Data Science, de la Universidad John Hopkins, la misma que está centralizando los datos mundiales sobre la pandemia de covid-19, en un gran ejercicio de lo que es la Data Science. Este libro junto con otros más que tiene publicados son, en realidad, un resumen de lo que él y otros profesores cuentan en estos cursos de especialización en Data Science. Roger D. Peng siempre ofrece consejos equilibrados y basados en la experiencia.

En este libro en particular, explica el término generales el proceso de análisis de datos, jalonado con su propia experiencia y fallos previos gestionando estos procesos. Este libro es una ayuda real para todos aquellos que deben gestionar equipos de data science en empresas o pretendan entrar en el mundo de la consultoría sobre data science.

Los autores ponen el libro en versión electrónica, de forma incluso gratuita, aquí, si bien el precio mínimo sugerido es de 15$+IVA.


2. Data Science for Business — What You Need to Know about Data Mining and Data Analytic-Thinking

Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking (English Edition) de [Foster Provost, Tom Fawcett]

Se trata de un libro muy bueno para directivos que quieran entender dónde y cómo usar la mentalidad de Data Science en los procesos de negocio tanto a nivel operativo como estratégico. Este libro colma las aspiraciones de aquellos que por desconocimiento, no acaban de ver cómo podrían usar el data science para su negocio. En sus propias palabras:

«Los objetivos principales de este libro son ayudarle a ver los problemas de negocio desde una perspectiva de los datos y entender los principios para extraer conocimiento útil de los datos«.

Y a fe que los autores consiguen estos objetivos…altamente recomendable.


Libros para especialistas de data science, machine learning y deep learning

The Elements of Statistical Learning — Data Mining, Inference, and Prediction

By Trevor Hastie, Robert Tibshirani, et al.

Image for post

Los libros de Springer son generalmente muy completos, auténticas referencias de «fondo de armario», donde acudir en buscar de respuestas con el necesario rigor técnico que precisan los especialistas.

Este libro habla tanto de aprendizaje supervisado, como no supervisado y de técnicas estadísticas: Lo que es seguro es que no decepcionará al lector exigente técnicamente. Eso sí, no es un libro para los débiles de corazón. Se debe usar como se hace con una enciclopedia: hay que leer en cada momento lo que uno necesita, no es un libro para leer de principio a fin de una «tacada» (¡peligro de desprendimiento cerebral o de desdoblamiento de personalidad!.)


Deep Learning, por Ian Goodfellow, Joshua Bengio y Aaron Courville

Este libro es mi aportación personal a la lista, de acuerdo con las especificaciones del reto. Si no me hubieran dejado añadir ninguno lo habría añadido igual como bonus.

El Deep Learning no es simplemente un machine learning con una red neuronal de más de dos niveles, sino que se trata de una nueva rama de la Inteligencia Artificial que está consiguiendo desde 2012 unos logros sin precedentes que están captando la atención mundial de inversores y curiosos. Se trata de unas serie de arquitecturas de redes neuronales avanzadas que tienen sólo unas débiles raíces comunes con el machine learning y que se beneficia de las enormes cantidades de datos que generamos en Internet y por la digitalización de todos tipo de procesos.

El libro está escrito por entre otros, por dos de las mayores expertos en Deep Learning: Bengio y GoodFellow. Contiene todas las explicaciones detalladas sobre las matemáticas en las que se basa el deep learning. Básicamente es la biblia del Deep Learning, que como el anterior libro, hay que tomar a pequeñas dosis, según necesidades.


Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems

Por Aurélien Géron

Los libros de O’Reilly son siempre interesantes. Suelen ser un cuidadoso equilibrio entre presentación teórica de conceptos, explicaciones detalladas basadas en datos de ejemplo y presentación de código «manos a la obra» usando los cuadernos interactivos Jupyter escritos en Python y usando las populares librerías de machine learning (ML) Scikit.Learn, Keras y Tensorflow que simplifican mucho la definición y entrenamiento de los algoritmos de ML en general y las redes neuronales del Deep Learning.

Sin duda, una de las mejores introducciones para aquellos que les guste «aprender haciendo». Muy bueno para introducirse en el campo como especialista.

Y con esto termino mi lista. Lo cierto es que se pueden elaborar seguro otras listas tan buenas como esta con los 21 libros, pero lamentablemente la mayoría de esos títulos no los he leído (presupuesto y tiempo limitados, sorry), así que he hecho la selección a partir de lo que conozco.

Posted by santiago

Deja un comentario