Schița de curs
- Machine Learning introducere
- Tipuri de învățare automată - învățare supravegheată vs. învățare nesupravegheată
- De la învățarea statistică la învățarea automată
- Fluxul de lucru Data Mining:
- Business înțelegerea
- Înțelegerea datelor
- Pregătirea datelor
- Modelarea
- Evaluarea
- Implementare
- Algoritmi de învățare automată
- Alegerea algoritmului potrivit pentru problemă
- Supraadaptarea și compromisul tendință-varianță în ML
- Biblioteci ML și limbaje de programare
- De ce să utilizați un limbaj de programare
- Alegerea între R și Python
- Python curs intensiv
- Python resurse
- Python Biblioteci pentru învățarea automată
- Jupyter notebooks și codare interactivă
- Testarea algoritmilor ML
- Generalizare și supraajustare
- Evitarea supraadaptării
- Metoda Holdout
- Validare încrucișată
- Bootstrapping
- Evaluarea predicțiilor numerice
- Măsuri de acuratețe: ME, MSE, RMSE, MAPE
- Stabilitatea parametrilor și a predicțiilor
- Evaluarea algoritmilor de clasificare
- Precizia și problemele sale
- Matricea confuziei
- Problema claselor neechilibrate
- Vizualizarea performanței modelului
- Curba de profit
- Curba ROC
- Curba de ridicare
- Selectarea modelului
- Reglarea modelului - strategii de căutare în grilă
- Exemple în Python
- Pregătirea datelor
- Importul și stocarea datelor
- Înțelegerea datelor - explorări de bază
- Manipularea datelor cu ajutorul bibliotecii pandas
- Transformarea datelor - analiza datelor
- Analiza exploratorie
- Observații lipsă - detectare și soluții
- Valori aberante - detectare și strategii
- Standarizare, normalizare, binarizare
- Recodificarea datelor calitative
- Exemple în Python
- Clasificare
- Clasificare binară vs. multiclasă
- Clasificarea prin funcții matematice
- Funcții discriminante liniare
- Funcții discriminante pătratice
- Regresia logistică și abordarea probabilităților
- Vecinii cei mai apropiați (k-nearest neighbors)
- Naïve Bayes
- Arbori de decizie
- CART
- Bagging
- Random Forests
- Boosting
- Xgboost
- Mașini vectoriale cu suport și nuclee
- Clasificator cu marjă maximă
- Mașină vectorială cu suport
- Învățarea ansamblului
- Exemple în Python
- Regresie și predicție numerică
- Estimarea celor mai mici pătrate
- Tehnici de selecție a variabilelor
- Regularizare și stabilitate - L1, L2
- Neliniarități și medii pătrate generalizate
- Regresia polinomială
- Spline de regresie
- Arbori de regresie
- Exemple în Python
- Învățare nesupravegheată
- Clustering
- Clustering bazat pe centroizi - k-means, k-medoids, PAM, CLARA
- Clustering ierarhic - Diana, Agnes
- Clustering bazat pe model - EM
- Hărți autoorganizatoare
- Evaluarea și aprecierea clusterelor
- Reducerea dimensionalității
- Analiza componentelor principale și analiza factorilor
- Descompunerea valorii singulare
- Scalarea multidimensională
- Exemple în Python
- Clustering
- Text mining
- Preprocesarea datelor
- Modelul bag-of-words
- Stemming și lemmizare
- Analiza frecvenței cuvintelor
- Analiza sentimentelor
- Crearea norilor de cuvinte
- Exemple în Python
- Motoare de recomandări și filtrare colaborativă
- Date de recomandare
- Filtrarea colaborativă bazată pe utilizator
- Filtrarea colaborativă bazată pe elemente
- Exemple în Python
- Extragerea modelelor de asociere
- Algoritmul seturilor de elemente frecvente
- Analiza coșului de cumpărături
- Exemple în Python
- Analiza valorilor aberante
- Analiza valorii extreme
- Detectarea valorilor aberante pe baza distanței
- Metode bazate pe densitate
- Detectarea valorilor aberante înalt-dimensionale
- Exemple în Python
- Machine Learning studiu de caz
- Business înțelegerea problemei
- Preprocesarea datelor
- Selectarea și reglarea algoritmului
- Evaluarea rezultatelor
- Implementare
Cerințe
Cunoașterea și conștientizarea Machine Learning fundamentelor
Mărturii (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Curs - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Curs - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback