Más sobre ciencia de datos: cienciadedatos.net
El siguiente listado contiene las fuentes de información sobre ciencia de datos, machine learning, estadística y programación en R que he ido encontrando y que me han resultado útiles. Están ordenadas según, a mi parecer, facilitan el aprendizaje.
A la hora de adentrarse en estas disciplinas existen diferentes aproximaciones, en mi caso, el objetivo inicial fue aprender las principales herramientas estadísticas y de machine learning empleadas en el análisis de datos del ámbito biomédico. La programación (en este caso R) era simplemente la herramienta auxiliar de la que me ayudaba para realizar los cálculos necesarios. La experiencia me he convencido de que adquirir ambos conocimientos en paralelo mejora mucho el aprendizaje. ¡Nada mejor para entender un algoritmo que poder simular, representar y aplicar fácilmente los cálculos necesarios!
OpenIntro Statistics: Fourth Edition by David Diez, Mine Çetinkaya-Rundel, Christopher Barr
Linear Models with R by Julian J.Faraway
An Introduction to Statistical Learning: with Applications in R (Springer Texts in Statistics)
Applied Predictive Modeling by Max Kuhn and Kjell Johnson
Practical Guide to Cluster Analysis in R: Unsupervised Machine Learning by Alboukadel Kassambara
Interpretable Machine Learning by Christoph Molnar
Handbook of Biological Statistics by John H. McDonald
Resampling Data: Using a Statistical Jackknife S. Sawyer | Washington University | March 11, 2005
Nature Search Points of Significance
Este material, creado por Joaquín Amat Rodrigo, tiene licencia Attribution-NonCommercial-ShareAlike 4.0 International.
Se permite:
Compartir: copiar y redistribuir el material en cualquier medio o formato.
Adaptar: remezclar, transformar y crear a partir del material.
Bajo los siguientes términos:
Atribución: Debes otorgar el crédito adecuado, proporcionar un enlace a la licencia e indicar si se realizaron cambios. Puedes hacerlo de cualquier manera razonable, pero no de una forma que sugiera que el licenciante te respalda o respalda tu uso.
NoComercial: No puedes utilizar el material para fines comerciales.
CompartirIgual: Si remezclas, transformas o creas a partir del material, debes distribuir tus contribuciones bajo la misma licencia que el original.