César Pérez L´pez
Octubre de 2024 Páginas: 370
Código 11282 ISBN/EAN: 9788419034755
CONTENIDO:
La ciencia de datos es un campo interdisciplinar que utiliza métodos, algoritmos, procesos y sistemas para extraer conocimiento y conclusiones a partir de todo tipo de datos. A través del aprendizaje automático combina elementos de estadística, informática, matemáticas y técnicas de análisis para resolver problemas, hacer predicciones y generar valor a partir de los datos. Se apoya en grandes volúmenes de datos (Big data) para descubrir patrones, tendencias y relaciones que pueden ser utilizadas para la toma de decisiones. El aprendizaje automático utiliza dos tipos de técnicas:
- el aprendizaje supervisado, que entrena a un modelo con datos conocidos de entrada y salida para que pueda predecir resultados futuros, y
- el aprendizaje no supervisado, que encuentra patrones ocultos o estructuras intrínsecas en los datos de entrada.
El aprendizaje supervisado utiliza técnicas de clasificación y regresión basadas en modelos predictivos, según la naturaleza de la variable dependiente. Si esta es categórica estamos ante las técnicas predictivas de clasificación y si es cuantitativa estamos antes las técnicas predictivas de regresión.
Este libro desarrolla las técnicas de aprendizaje supervisado para la clasificación. Comienza en el análisis discriminante, tanto simple como múltiple y tanto lineal como cuadrático. También, se abordan los modelos lineales generalizados haciendo hincapié en los modelos de elección discreta y en los modelos de recuento como casos particulares. Se profundiza en la regresión logística, los modelos Probit, los modelos de Poisson y los modelos Binomial Negativa. Se hace hincapié en la diagnosis a través de instrumentos como la matriz de confusión, la curva ROC y la acuracidad.
Los capítulos siguientes se centran en la clasificación mediante árboles de decisión, teniendo en cuenta los árboles de clasificación, los árboles de regresión y los árboles aleatorios (Random Forest). También se profundiza en otros clasificadores como el algoritmo KNN del vecino más cercano, el algoritmo SVM (Support Vector Machine) y el algoritmo Naive Bayes. A continuación, se abordan las técnicas de ensamblado de modelos como Boosting, Bagging, Stacking, Voting y Blending.
Finalmente se desarrollan temas avanzados como los modelos de redes neuronales para la clasificación. Se tienen en cuenta arquitecturas como el Perceptrón Multicapa, la Red de Base Radial, las redes Adaline, las redes de Hopfield y las redes neuronales para predicción se series temporales como las redes LSTM, las redes recurrentes RNN, las redes GRU y las redes NARX.
Para todos los temas se presentan conceptos metodológicos ilustrados con ejemplos prácticos y ejercicios en Python.
INDICE EXTRACTADO:
Capítulo 1. Primeros conceptos en ciencia de datos
1.1 Ciencia de datos
1.2 El proceso de la ciencia de datos
1.3 Clasificación de las técnicas de ciencia de datos
Capítulo 2. Clasificación y segmentación mediante análisis discriminante
2.1 Análisis discriminante
2.2 Clasificación con dos grupos
2.3 Contrastes y probabilidad de pertenencia (2 grupos)
2.4 Clasificación con más de dos grupos
2.5 Selección de variables discriminantes. Métodos alternativos
2.6 Interpretación de la función discriminante
2.7 Clasificación de los individuos
2.8 Probabilidad de pertenencia a un grupo
2.9 Análisis discriminante canónico
2.10 Esquema general del análisis discriminante
Capítulo 3. Análisis discriminante con Python
3.1 Análisis discriminante lineal simple a través de Python
3.2 Análisis discriminante lineal simple cuadrático a través de Python
3.3 Análisis discriminante lineal múltiple a través de Python
3.4 Análisis discriminante múltiple cuadrático a través de Python
Capítulo 4. Modelos lineales generalizados. Modelos de elección discreta: modelos Logit, Probit y recuento
4.1 Aprendizaje supervisado: modelo lineal generalizado
4.2 Modelos de variable dependiente limitada y recuento: Logit, Probit, Poisson y binomial negativa
4.3 Distribuciones de la familia exponencial
Capítulo 5. Modelos lineales generalizados, Logit, Probit y recuento con Python
5.1 Tratamiento de los modelos lineales generalizados a través de Python
5.2 Modelos Logit y Probit multinomiales a través de la librería STATMODELS
5.3 Modelos Logit y Probit ordenados a través de STATSMODELS
5.4 Modelo Logit binario a través de Scikit Learn
5.5 Modelo Logit múltiple a través de Scikit Learn
Capítulo 6. Árboles de decisión. Tratamiento a través de Python
6.1 Árboles de decisión
6.2 Características de los árboles de decisión
6.3 Tipos de árboles de decisión
6.4 Python y los árboles de decisión
6.5 Python y los árboles aleatorios (Random Forest)
Capítulo 7. Clasificación a través del algoritmo kNN del vecino más cercano. Tratamiento con Python
7.1 El algoritmo kNN
7.2 El algoritmo kNN en Python
Capítulo 8. Clasificación a través de Support Vector Machine (SVM). Tratamiento a través de Python
8.1 Support vector machine
8.2 Support vector machine con Python
Capítulo 9. Clasificación a través del algoritmo Naive Bayes. Tratamiento a través de Python
9.1 Algoritmo Naive Bayes
9.2 Naive Bayes a través de Python
Capítulo 10. Métodos de ensamblado. Tratamiento a través de Python
10.1 Métodos de ensamblado
10.2 Bagging en Python
10.3 Boosting en Python
10.4 Stacking en Python
10.5 Voting en Python
Capítulo 11. Modelos de redes neuronales. Tratamiento con Python
11.1 Descripción de una red neuronal
11.2 Redes neuronales y ajuste de modelos predictivos (aprendizaje supervisado)
11.3 Aprendizaje en las redes neuronales
11.4 Funcionamiento de una red neuronal
11.5 El algoritmo de aprendizaje retropropagación (Back- Propagation)
11.6 Análisis de series temporales mediante redes neuronales
11.7 Redes neuronales a través de Python: Perceptron multicapa (MLP)
11.8 Redes neuronales a través de Python: red de base radial (RBF)
11.9 Redes neuronales Adaline con Python
11.10 Redes neuronales de Hopfield para reconocimiento de patrones en Python
11.11 Redes neuronales para predicción de series temporales en Python