Joaquin-Amat-Rodrigo

Joaquín es licenciado en Biotecnología con un máster en Ciencia de Datos y Big Data. Es un apasionado del software de código abierto y de los contenidos educativos de libre acceso. A lo largo de los años ha contribuido al desarrollo del proyecto skforecast y a esta misma web con contenido divulgativo gratuito. Su actual área de interés es seguir desarrollando y aplicando sus habilidades en ciencia de datos para resolver problemas en las industrias farmacéutica y biomédica.

Artículos

Bibliografía

Libros y recursos sobre ciencia de datos, machine learning y estadística con Python

Regresión lineal con Python

Teoría y ejemplos sobre modelos de regresión lineal con Python (Scikit-learn y Statsmodels)

Regresión logística con Python

Teoría y ejemplos sobre modelos de regresión logística con Python (Scikit-learn y Statsmodels)

Regularización Ridge, Lasso y Elastic Net con Python

Tutorial sobre cómo aplicar regularización Ridge, Lasso y Elastic Net a modelos lineales con Python y Scikit-learn

Machine learning con Python y Scikitlearn

Tutorial sobre cómo crear de modelos de machine learning con Python y Scikit-learn

Árboles de decisión con Python: regresión y clasificación

Tutorial sobre modelos cómo crear de modelos de árboles con Python y Scikit-learn

Random Forest con Python

Tutorial sobre cómo crear modelos Random Forest con Python y Scikit-learn

Random Forest con valores nulos y variables categóricas

Tutorial sobre cómo crear modelos Random Forest cuando los datos contienen valores nulos y variables categóricas

Regresión cuantílica: intervalos de predicción con Random Forest Python

Teoría y ejemplos prácticos de cómo calcular intervalos de predicción con Random Forest en python

Gradient Boosting con Python

Tutorial sobre cómo crear modelos Gradient Boosting con Python y Scikit-learn

Gradient Boosting probabilístico con python

Tutorial sobre cómo crear modelos Natural Gradient Boosting (NGBoost) con Python que permiten generar predicciones probabilísticas

Pandas category en modelos de machine learning

Codificar variables categóricas con pandas dtype category en modelos scikitlearn, LightGBM y XGBoost

Máquinas de Vector Soporte (SVM) con Python

Teoría y ejemplos sobre cómo crear modelos de máquina vector soporte, support vector machine (SVM) con python

Redes neuronales con Python

Teoría y ejemplos sobre cómo crear modelos de redes neuronales con python

Calibrar modelos de machine learning

Tutorial sobre cómo calibrar las probabilidades de un modelo de machine learning con Python y Scikit-learn

Gráficos ICE y PDP para interpretar modelos predictivos en python

Interpretación de modelos de machine learning con gráficos Individual Conditional Expectation (ICE) y Partial Dependence (PDP) en Python

Análisis de componentes principales con Python

Teoría y ejemplos sobre cómo aplicar análisis de componentes principales con Python

Clustering con Python

Tutorial con teoría y ejemplos de los algoritmos clustering Kmeans, hierarchical clustering, DBSCAN y gaussian mixture models con python

Detección de anomalías con PCA

Teoría y ejemplos de cómo detectar anomalías (outliers) con análisis de componentes principales PCA y Python

Detección de anomalías con autoencoders

Teoría y ejemplos de cómo detectar anomalías (outliers) con autoencoders y Python

Detección de anomalías con Gaussian Mixture Models

Teoría y ejemplos de cómo detectar anomalías (outliers) con Gaussian Mixture Models y Python

Detección de anomalías con Isolation Forest

Teoría y ejemplos de cómo detectar anomalías (outliers) con Isolation Forest y Python

Análisis de texto (text mining) con Python

Ejemplo de cómo aplicar text mining y análisis de sentimientos a datos de Twitter con python

Ajuste y selección de distribuciones con Python

Métodos para encontrar la distribución que mejor se ajusta a los datos.

Ajuste de distribuciones no paramétricas con kernel density estimation KDE y Python

Método para encontrar la distribución no paramétrica que mejor se ajusta a los datos.

Skforecast

Skforecast, librería de Python que facilita el uso de modelos scikit-learn para problemas de forecasting y series temporales.

Forecasting series temporales con Python y Scikitlearn

Adaptación de modelos de regresión de scikit learn para predicción de series temporales.

Predicción (forecasting) de la demanda eléctrica con Python

Ejemplo de cómo predecir la demanda de energía eléctrica mediante modelos de forecasting con Python.

Predicción (forecasting) de las visitas a una página web

Ejemplo de cómo predecir el tráfico de una web utilizando modelos de machine learning con Python.

Forecasting series temporales con gradient boosting: Skforecast, XGBoost, LightGBM y CatBoost

Ejemplo de cómo predecir el número de usuarios del sistema de alquier de bibicletas urbanas utilizando modelos de gradient boosting en python.

Selección de predictores con algorítmo genético

Implementación de un algoritmo genético para la selección de variables predictoras en Python.

Machine Learning con H2O y Python

Tutorial sobre cómo crear modelos de machine learning con H2O y Python.

Optimización con algoritmo genético (GA) Python

Implementación de un algoritmo genético para optimización en Python.

Optimización con enjambre de partículas Python

Implementación de un algoritmo de optimización Particle Swarm Optimization (PSO) en Python.

Reconocimiento facial con deep learning y python

Ejemplo de cómo reconocer e identificar personas en imágenes y video con deep learning y Python.

Análisis de puntos de interés con OpenStreetMap y python

Tutorial sobre cómo extraer y analizar datos de OpenStreetMap (OSM) con python.

Análisis de normalidad

Métodos para contrastar la normalidad de una muestra de datos con Python. Test Shapiro-Wilk, test D'Agostino's K-squared, asimetría (Skewness) y curtosis.

Análisis de homocedasticidad y heterocedasticidad con python

Métodos para contrastar la homocedasticidad y heterocedasticidad de una muestra de datos con Python. Test de Levene, test de Bartlett y test de Fligner-Killeen.

Correlación lineal con Python

Teoría y ejemplos de correlación lineal con Python. Coeficiente de correlación de Pearson, Spearman, Kendall, correlación parcial y matriz de correlaciones.

Ajuste y selección de distribuciones con Python

Métodos para encontrar la distribución que mejor se ajusta a los datos.

Ajuste de distribuciones no paramétricas con kernel density estimation KDE y Python

Método para encontrar la distribución no paramétrica que mejor se ajusta a los datos.

Test de permutación para el contraste de hipótesis con Python

Permutaciones y simulación de Monte Carlo para comparar medias, varianzas u otros estadísticos.

Bootstrapping, contraste de hipótesis e intervalos de confianza con Python

Bootstrapping como método no paramétrico para comparar estadísticos y crear intervalos de confianza con Python.

Test Kolmogorov–Smirnov

Comparación de distribuciones con Python: test Kolmogorov–Smirnov.

T-test

Test estadístico para comparar las medias de dos grupos.

ANOVA

Análisis de varianza con Python.

U-test

Test U de Mann-Whitney-Wilcoxon para comparar las medianas de dos grupos.

Bibliografía

Libros y recursos sobre ciencia de datos, machine learning y estadística con R

Correlación lineal y regresión lineal simple en R

Apuntes sobre distintos métodos de correlación lineal y regresión lineal simple con lenguaje de programación R.

Regresión Lineal Múltiple en R

Tutorial sobre modelos de regresión lineal múltiple.

Ejemplo práctico de regresión lineal simple, múltiple, polinomial e interacción entre predictores

Tobit Regression: modelos lineales para datos censurados

Ajuste de modelos de regresión Tobit para datos censurados en R.

Regresión logística en R

Creación de modelos de clasificación mediante regresión logística con R.

Análisis discriminante lineal (LDA) y Análisis discriminante cuadrático (QDA)

Modelos de clasificación con Análisis discriminante lineal y Análisis discriminante cuadrático con R.

Validación de modelos: Cross-validation, OneLeaveOut, Bootstrap

Métodos y estrategias para evaluar modelos predictivos.

Selección de predictores: subset selection, ridge, lasso y reducción de dimensionalidad

Estrategias para seleccionar predictores en R.

Regresión no lineal: Regresión Polinómica, Splines, Smooth Splines y GAMs

Métodos de regresión no lineal y su aplicación en R.

Introducción a los modelos GAMLSS

Introducción práctica a los modelos GAMLSS (modelos aditivos generalizados para posición, escala y forma)

Árboles de decisión, Random Forest, Gradient Boosting y C5.0

Tutorial sobre modelos Random Forest, Gradient Boosting y cómo crearlos con R.

Algoritmo Perceptrón

Implementación del algoritmo perceptrón simple con R.

SVM Máquinas de Vector Soporte (Support Vector Machines)

Apuntes sobre Máquinas de Vector Soporte (Support Vector Machines, SVM) y su aplicación con R.

Redes neuronales con R

Teoría y ejemplos sobre cómo crear modelos de redes neuronales con R

Análisis de Componentes Principales (Principal Component Analysis, PCA) y t-SNE

Apuntes sobre reducción de dimensionalidad con los métodos PCA y t-SNE, y su aplicación con R.

Clustering y heatmaps: aprendizaje no supervisado con R

Apuntes sobre métodos de clustering y representación gráfica de dendogramas y heatmaps con R.

Machine Learning con R y caret

Tutorial sobre la creación de modelos de machine learning y data mining con caret.

Machine learning con R y tidymodels

Tutorial sobre cómo crear de modelos de machine learning con tidymodels

Machine learning con R y mlr3

Tutorial sobre cómo crear de modelos de machine learning con mlr3

Machine Learning con H2O y R

Tutorial sobre cómo crear modelos de machine learning con H2O y R.

Gráficos ICE para interpretar modelos predictivos

Creación de gráficos Individual Conditional Expectation (ICE) para interpretar modelos predictivos black box.

H2O, IML y DALEX

Ejemplo práctico de cómo entrenar modelos de machine learning con la librería H2O y de cómo compararlos e interpretarlos con Dalex e IML.

Optimización bayesiana de hiperparámetros

Ejemplo práctico de cómo encontrar los mejores hiperparámetros de un modelo predictivo mediante optimización bayesiana

Algoritmo genético para la selección de predictores

Implementación de un algoritmo genético para la selección de variables predictoras en R.

Optimización con algoritmo genético (GA)

Implementación de un algoritmo genético para optimización en R.

Optimización con enjambre de partículas (Particle Swarm Optimization)

Implementación de un algoritmo de optimización Particle Swarm Optimization (PSO) en R.

Reglas de asociación y algoritmo Apriori con R

Apuntes sobre reglas de asociación, el algoritmo Apriori y de cómo ejecutarlos con R.

Sistemas de recomendación con R

Tutorial sobre sistemas de recomendación y su implementación en lenguaje R.

Text mining con R: ejemplo práctico Twitter

Ejemplo práctico de análisis de texto empleando datos de Twitter y lenguaje R.

Detección de anomalías con Autoencoders y PCA

Ejemplos de cómo detectar anomalías con Autoencoders y PCA empleando el error de reconstrucción.

Detección de anomalías con Isolation Forest

Ejemplo de cómo utilizar Isolation Forest para la detección de anomalías.

Detección de anomalías con trimmed k-means

Detección de anomalías con el método de clustering robusto trimmed k-means.

Detección de anomalías: Attribute wise learning for scoring outliers (ALSO)

Implementación y uso del algoritmo ALSO para la detección de anomalías

Regresión cuantílica (Quantile Regression) con R

Apuntes sobre regresión de cuantiles, comparación de medianas y su aplicación en R.

Regresión cuantílica: modelos GAMLSS

Descripción y ejemplo de cómo predecir cuantiles con modelos GAMLSS

Regresión cuantílica: Quantile Regression Forest

Descripción y ejemplo de cómo predecir cuantiles con Quantile Regression Forest.

Distributional Regression Forest: Random Forest probabilístico

Descripción y ejemplo de cómo predecir probabilidades con Distributional Regression Forest.

Regresión cuantílica: Gradient Boosting Quantile Regression

Descripción y ejemplo de cómo predecir cuantiles con gradient boosting

Bibliografía

Libros y recursos sobre ciencia de datos, machine learning y estadística con R

Análisis de normalidad

Métodos para contrastar la normalidad de una muestra de datos.

Análisis de la homogeneidad de varianza (homocedasticidad)

Formas de contrastar la igualdad de varianza entre dos o más grupos.

T-test

Test estadístico para comparar las medias de dos grupos.

Test estadístico para proporciones

Test estadístico para variables dicotómicas (proporciones) e intervalos de confianza.

Test Wilcoxon-Mann-Whitney

Alternativa no paramétrica al t-test de medias independientes.

Test de los rangos con signo de Wilcoxon

Test de rangos de Wilcoxon como alternativa no paramétrica al t-test de medias dependientes.

ANOVA con R

Apuntes de cómo realizar los distintos tipos de ANOVA en R para comparar múltiples medias.

Test de Kruskal-Wallis

Test de Kruskal-Wallis como alternativa no paramétrica al ANOVA de datos independientes.

Test de Friedman

Test de Friedman como alternativa no paramétrica al ANOVA de datos dependientes.

Test binomial exacto, test multinomial y test chi-cuadrado goodnes of fit

Apuntes sobre test estadísticos para variables cualitativas en R (parte 1).

Test exacto de Fisher, chi-cuadrado de Pearson, McNemar y Q-Cochran

Apuntes sobre test estadísticos para variables cualitativas en R (parte 2).

Resampling: Test de permutación, Simulación de Monte Carlo y Bootstrapping

Información sobre las diferentes técnicas de resampling y su aplicación como test estadísticos.

Comparaciones múltiples: corrección de p-value y FDR

Múltiples test estadísticos: inflación del error, corrección de p-value y FDR.

Comparación de distribuciones: test Kolmogorov–Smirnov

Métodos estadísticos para comparar la distribución de variables continuas.

Forecasting series temporales con Python y Scikitlearn

Adaptación de modelos de regresión de scikit learn para predicción de series temporales.

Predicción (forecasting) de la demanda eléctrica con Python

Ejemplo de cómo predecir la demanda de energía eléctrica mediante modelos de forecasting con Python.

Predicción (forecasting) de las visitas a una página web

Ejemplo de cómo predecir el tráfico de una web utilizando modelos de machine learning con Python.

Forecasting series temporales con gradient boosting: Skforecast, XGBoost, LightGBM y CatBoost

Ejemplo de cómo predecir el número de usuarios del sistema de alquier de bibicletas urbanas utilizando modelos de gradient boosting en python.

Predicción del precio de Bitcoin con Python

Ejemplo de cómo utilizar modelos de forecasting para predecir el precio de la criptomoneda Bitcoin y estudio de las implicaciones que aparecen cuando una serie temporal no tenga ningún patrón.

Forecasting probabilístico

Métodos con los que estimar intervalos de predicción para modelos de machine learning aplicados a problemas de forecasting.

Multi-series forecasting con Python y Skforecast

Modelos de forecasting para predecir múltiples series temporales de forma simultánea.

Introducción a grafos y redes con Python

Teoría y ejemplos sobre cómo crear y analizar redes con NetworkX y python.

Detección de comunidades en grafos y redes con python

Ejemplo de cómo utilizar el algoritmo de Louvain para detectar comunidades en redes con NetworkX y python.

Análisis de redes con NetworkX

Ejemplo de cómo analizar redes utilizando NetworkX y python.

Métricas para grafos y redes

Principales métricas para describir grafos y redes.

Forecasting de series temporales incompletas

Modelado y predicción de series temporales incompletas con datos faltantes

Forecasting de demanda intermitente con Python y Skforecast

Predicción de demanda intermitente con modelos de machine learning y skforecast.

Reglas de asociación con Python

Teoría y ejemplos sobre cómo identificar itemsets frecuentes y crear reglas de asociación con python.

Modelos ARIMA y SARIMAX con Python

Modelos ARIMA y SARIMAX para la predicción de series temporales.

Forecasting con modelos de deep learning

Forecasting utilizando modelos basados redes neuronales RNN y LSTM

Reducir el impacto del covid-19 en modelos de forecasting

Ejemplo de cómo atenuar el impacto del covid y otros periodos anomalos en series temporales a la hora de entrenar modelos de forecasting

Interpretabilidad en modelos de forecasting

Interpretabilidad de modelos de forecasting utilizando shape values, gráficos de dependecia parcial e importancia de predictores

Modelos de forecasting globales

Modelos de forecasting globales para predecir múltiples series temporales.

Información de contacto