Regresión lineal con Python
Teoría y ejemplos sobre modelos de regresión lineal con Python (Scikit-learn y Statsmodels)
Joaquín es licenciado en Biotecnología con un máster en Ciencia de Datos y Big Data. Es un apasionado del software de código abierto y de los contenidos educativos de libre acceso. A lo largo de los años ha contribuido al desarrollo del proyecto skforecast y a esta misma web con contenido divulgativo gratuito. Su actual área de interés es seguir desarrollando y aplicando sus habilidades en ciencia de datos para resolver problemas en las industrias farmacéutica y biomédica.
Teoría y ejemplos sobre modelos de regresión lineal con Python (Scikit-learn y Statsmodels)
Teoría y ejemplos sobre modelos de regresión logística con Python (Scikit-learn y Statsmodels)
Tutorial sobre cómo aplicar regularización Ridge, Lasso y Elastic Net a modelos lineales con Python y Scikit-learn
Tutorial sobre cómo crear de modelos de machine learning con Python y Scikit-learn
Tutorial sobre modelos cómo crear de modelos de árboles con Python y Scikit-learn
Tutorial sobre cómo crear modelos Random Forest con Python y Scikit-learn
Tutorial sobre cómo crear modelos Random Forest cuando los datos contienen valores nulos y variables categóricas
Teoría y ejemplos prácticos de cómo calcular intervalos de predicción con Random Forest en python
Tutorial sobre cómo crear modelos Gradient Boosting con Python y Scikit-learn
Tutorial sobre cómo crear modelos Natural Gradient Boosting (NGBoost) con Python que permiten generar predicciones probabilísticas
Codificar variables categóricas con pandas dtype category en modelos scikitlearn, LightGBM y XGBoost
Teoría y ejemplos sobre cómo crear modelos de máquina vector soporte, support vector machine (SVM) con python
Teoría y ejemplos sobre cómo crear modelos de redes neuronales con python
Tutorial sobre cómo calibrar las probabilidades de un modelo de machine learning con Python y Scikit-learn
Interpretación de modelos de machine learning con gráficos Individual Conditional Expectation (ICE) y Partial Dependence (PDP) en Python
Teoría y ejemplos sobre cómo aplicar análisis de componentes principales con Python
Tutorial con teoría y ejemplos de los algoritmos clustering Kmeans, hierarchical clustering, DBSCAN y gaussian mixture models con python
Teoría y ejemplos de cómo detectar anomalías (outliers) con análisis de componentes principales PCA y Python
Teoría y ejemplos de cómo detectar anomalías (outliers) con autoencoders y Python
Teoría y ejemplos de cómo detectar anomalías (outliers) con Gaussian Mixture Models y Python
Teoría y ejemplos de cómo detectar anomalías (outliers) con Isolation Forest y Python
Ejemplo de cómo aplicar text mining y análisis de sentimientos a datos de Twitter con python
Métodos para encontrar la distribución que mejor se ajusta a los datos.
Método para encontrar la distribución no paramétrica que mejor se ajusta a los datos.
Skforecast, librería de Python que facilita el uso de modelos scikit-learn para problemas de forecasting y series temporales.
Adaptación de modelos de regresión de scikit learn para predicción de series temporales.
Ejemplo de cómo predecir la demanda de energía eléctrica mediante modelos de forecasting con Python.
Ejemplo de cómo predecir el tráfico de una web utilizando modelos de machine learning con Python.
Ejemplo de cómo predecir el número de usuarios del sistema de alquier de bibicletas urbanas utilizando modelos de gradient boosting en python.
Implementación de un algoritmo genético para la selección de variables predictoras en Python.
Tutorial sobre cómo crear modelos de machine learning con H2O y Python.
Implementación de un algoritmo genético para optimización en Python.
Implementación de un algoritmo de optimización Particle Swarm Optimization (PSO) en Python.
Ejemplo de cómo reconocer e identificar personas en imágenes y video con deep learning y Python.
Tutorial sobre cómo extraer y analizar datos de OpenStreetMap (OSM) con python.
Métodos para contrastar la normalidad de una muestra de datos con Python. Test Shapiro-Wilk, test D'Agostino's K-squared, asimetría (Skewness) y curtosis.
Métodos para contrastar la homocedasticidad y heterocedasticidad de una muestra de datos con Python. Test de Levene, test de Bartlett y test de Fligner-Killeen.
Teoría y ejemplos de correlación lineal con Python. Coeficiente de correlación de Pearson, Spearman, Kendall, correlación parcial y matriz de correlaciones.
Métodos para encontrar la distribución que mejor se ajusta a los datos.
Método para encontrar la distribución no paramétrica que mejor se ajusta a los datos.
Permutaciones y simulación de Monte Carlo para comparar medias, varianzas u otros estadísticos.
Bootstrapping como método no paramétrico para comparar estadísticos y crear intervalos de confianza con Python.
Comparación de distribuciones con Python: test Kolmogorov–Smirnov.
Test estadístico para comparar las medias de dos grupos.
Análisis de varianza con Python.
Test U de Mann-Whitney-Wilcoxon para comparar las medianas de dos grupos.
Apuntes sobre distintos métodos de correlación lineal y regresión lineal simple con lenguaje de programación R.
Tutorial sobre modelos de regresión lineal múltiple.
Ajuste de modelos de regresión Tobit para datos censurados en R.
Creación de modelos de clasificación mediante regresión logística con R.
Modelos de clasificación con Análisis discriminante lineal y Análisis discriminante cuadrático con R.
Métodos y estrategias para evaluar modelos predictivos.
Estrategias para seleccionar predictores en R.
Métodos de regresión no lineal y su aplicación en R.
Introducción práctica a los modelos GAMLSS (modelos aditivos generalizados para posición, escala y forma)
Tutorial sobre modelos Random Forest, Gradient Boosting y cómo crearlos con R.
Implementación del algoritmo perceptrón simple con R.
Apuntes sobre Máquinas de Vector Soporte (Support Vector Machines, SVM) y su aplicación con R.
Teoría y ejemplos sobre cómo crear modelos de redes neuronales con R
Apuntes sobre reducción de dimensionalidad con los métodos PCA y t-SNE, y su aplicación con R.
Apuntes sobre métodos de clustering y representación gráfica de dendogramas y heatmaps con R.
Tutorial sobre la creación de modelos de machine learning y data mining con caret.
Tutorial sobre cómo crear de modelos de machine learning con tidymodels
Tutorial sobre cómo crear de modelos de machine learning con mlr3
Tutorial sobre cómo crear modelos de machine learning con H2O y R.
Creación de gráficos Individual Conditional Expectation (ICE) para interpretar modelos predictivos black box.
Ejemplo práctico de cómo entrenar modelos de machine learning con la librería H2O y de cómo compararlos e interpretarlos con Dalex e IML.
Ejemplo práctico de cómo encontrar los mejores hiperparámetros de un modelo predictivo mediante optimización bayesiana
Implementación de un algoritmo genético para la selección de variables predictoras en R.
Implementación de un algoritmo genético para optimización en R.
Implementación de un algoritmo de optimización Particle Swarm Optimization (PSO) en R.
Apuntes sobre reglas de asociación, el algoritmo Apriori y de cómo ejecutarlos con R.
Tutorial sobre sistemas de recomendación y su implementación en lenguaje R.
Ejemplo práctico de análisis de texto empleando datos de Twitter y lenguaje R.
Ejemplos de cómo detectar anomalías con Autoencoders y PCA empleando el error de reconstrucción.
Ejemplo de cómo utilizar Isolation Forest para la detección de anomalías.
Detección de anomalías con el método de clustering robusto trimmed k-means.
Implementación y uso del algoritmo ALSO para la detección de anomalías
Apuntes sobre regresión de cuantiles, comparación de medianas y su aplicación en R.
Descripción y ejemplo de cómo predecir cuantiles con modelos GAMLSS
Descripción y ejemplo de cómo predecir cuantiles con Quantile Regression Forest.
Descripción y ejemplo de cómo predecir probabilidades con Distributional Regression Forest.
Descripción y ejemplo de cómo predecir cuantiles con gradient boosting
Métodos para contrastar la normalidad de una muestra de datos.
Formas de contrastar la igualdad de varianza entre dos o más grupos.
Test estadístico para comparar las medias de dos grupos.
Test estadístico para variables dicotómicas (proporciones) e intervalos de confianza.
Alternativa no paramétrica al t-test de medias independientes.
Test de rangos de Wilcoxon como alternativa no paramétrica al t-test de medias dependientes.
Apuntes de cómo realizar los distintos tipos de ANOVA en R para comparar múltiples medias.
Test de Kruskal-Wallis como alternativa no paramétrica al ANOVA de datos independientes.
Test de Friedman como alternativa no paramétrica al ANOVA de datos dependientes.
Apuntes sobre test estadísticos para variables cualitativas en R (parte 1).
Apuntes sobre test estadísticos para variables cualitativas en R (parte 2).
Información sobre las diferentes técnicas de resampling y su aplicación como test estadísticos.
Múltiples test estadísticos: inflación del error, corrección de p-value y FDR.
Métodos estadísticos para comparar la distribución de variables continuas.
Adaptación de modelos de regresión de scikit learn para predicción de series temporales.
Ejemplo de cómo predecir la demanda de energía eléctrica mediante modelos de forecasting con Python.
Ejemplo de cómo predecir el tráfico de una web utilizando modelos de machine learning con Python.
Ejemplo de cómo predecir el número de usuarios del sistema de alquier de bibicletas urbanas utilizando modelos de gradient boosting en python.
Ejemplo de cómo utilizar modelos de forecasting para predecir el precio de la criptomoneda Bitcoin y estudio de las implicaciones que aparecen cuando una serie temporal no tenga ningún patrón.
Métodos con los que estimar intervalos de predicción para modelos de machine learning aplicados a problemas de forecasting.
Modelos de forecasting para predecir múltiples series temporales de forma simultánea.
Teoría y ejemplos sobre cómo crear y analizar redes con NetworkX y python.
Ejemplo de cómo utilizar el algoritmo de Louvain para detectar comunidades en redes con NetworkX y python.
Ejemplo de cómo analizar redes utilizando NetworkX y python.
Principales métricas para describir grafos y redes.
Modelado y predicción de series temporales incompletas con datos faltantes
Predicción de demanda intermitente con modelos de machine learning y skforecast.
Teoría y ejemplos sobre cómo identificar itemsets frecuentes y crear reglas de asociación con python.
Modelos ARIMA y SARIMAX para la predicción de series temporales.
Forecasting utilizando modelos basados redes neuronales RNN y LSTM
Ejemplo de cómo atenuar el impacto del covid y otros periodos anomalos en series temporales a la hora de entrenar modelos de forecasting
Interpretabilidad de modelos de forecasting utilizando shape values, gráficos de dependecia parcial e importancia de predictores
Modelos de forecasting globales para predecir múltiples series temporales.