Este artículo es un complemento al video de Youtube en el que platico sobre algunos de los temas básicos que no puedes olvidar si estas empezando a aprender Machine Learning.
Empezar tu aprendizaje de machine learning puede ser abrumador en un inicio, ya que parece que uno debe dominar varias disciplinas simultaneamente. Esta guía la hice para que sepas cuales son los básicos (y no tan básico) que necesitas para poder desempeñar roles de machine learning y data science.
Esta lista no es todo lo que hay en la disciplina, pero dominando esto podrás solucionar la mayoría de los retos que te encuentres en el futuro.
Rubros de aprendizaje
Dividí el aprendizaje en Matematicas, Programacion y Modelos. Pero es muy importante mencionar que no hay que verlos como elementos individuales, todos están relacionados entre si, por un lado esta la matematica la cual esta detras de los modelos, pero no olvidemos que se llama MACHINE Learning, la otra parte importante de la ecuación es como implementar de manera optima estos modelos matematicos y es ahi donde la programacion.
Aviso
- Esta lista la hice buscando especificamente fuentes en español, aunque hay algunos casos donde son en inglés y esta marcado como tal
- La lista la estaré actualizando mientras encuentre más fuentes de utilidad, asi que si tienes alguna fuente (de preferencia en español) que consideras que sería bueno agregarla, hazmela llegar al siguiente correo:
Mates
- Probabilidad y Estadistica(estadistica descriptiva e inferencial) Otro Link
- Herramientas necesarias para entender tus datos, saber que hacer con ellos.
- Entender los modelos
- Distribucion de datos
- Media / Medianas / modas
- Sesgos
- EDA Exploratory data analysis
- Cuartiles
- Tipo de variables (categoricas, continuas)
- Tipos de gráficas Libro: Como mentir con estadisticas
- Teorema de Bayes
- Entender Regresion / clasificacion / clustering / reduccion de dimensionalidad Diferencia entre regresion y clasificacion
- Varianzas / Desviaciones
- Metricas de evaluacion
- f1, acc, precision, error cuadratico, r cuadrada
- Algebra Lineal Curso Algebra Lineal
- Matrices y vectores
- Operaciones matriciales
- Cálculo Curso de calculo multivariable Calculo avanzado 1
- Derivadas
- Integrales
Programacion
- Python / R Documentacion Python Automate boring stuff Curso coursera
- Variables
- Entender como funcionan las paqueterias
- Funciones
- For / if
- Paqueterías
- Pandas / Numpy
- Arreglos, listas, tensores
- Tensorflow / Pytorch
- OpenCV
- SKlearn Aprende ML con sklean y TF
- Pandas / Numpy
- Despliegue
- Servicios en la nube
- Docker / Kubernetes
- APIs Rest
- TF / Torch Serve
- SQL
Modelos
- Entrenamiento / Testing
- overfitting / underfitting
- Split de datos
- Aprendizaje supervizado / No supervisado / Semi supervisado
- Modelos lineales
- SVM
- PCA, embeddings (reduccion de dimensionalidades)
- KNN
- K means
- XGBoost
- Arboles de decision / random forrest
- Redes neuronales Deep Learning Andrew NG
- Optmizadores
- Funciones de perdida
- Enconders
- Certificado profesional de Ciencia de los datos de IBM