Schița de curs
Introducere
- Construirea de algoritmi eficienți de recunoaștere a tiparelor, clasificare și regresie.
Configurarea mediului de dezvoltare
- Python biblioteci
- Editorii online vs. offline
Prezentare generală a ingineriei caracteristicilor
- Variabile de intrare și de ieșire (caracteristici)
- Avantajele și dezavantajele ingineriei caracteristicilor
Tipuri de probleme întâlnite în datele brute
- Date necurate, date lipsă etc.
Variabile de preprocesare
- Gestionarea datelor lipsă
Gestionarea valorilor lipsă în date
Lucrul cu variabilele categorice
Conversia etichetelor în numere
Manipularea etichetelor în variabilele categoriale
Transformarea variabilelor pentru a îmbunătăți puterea predictivă
- Numerical, categorical, date, etc.
Curățarea unui set de date
Machine Learning Modelare
Manipularea valorilor aberante din date
- Variabile numerice, variabile categorice etc.
Rezumat și concluzii
Cerințe
- Python experiență în programare.
- Experiență cu Numpy, Pandas și scikit-learn.
- Familiaritate cu algoritmii de învățare automată.
Audiență
- Dezvoltatorii
- Științifici de date
- Analiști de date
Mărturii (2)
the ML ecosystem not only MLFlow but Optuna, hyperops, docker , docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Curs - MLflow
I enjoyed participating in the Kubeflow training, which was held remotely. This training allowed me to consolidate my knowledge for AWS services, K8s, all the devOps tools around Kubeflow which are the necessary bases to properly tackle the subject. I wanted to thank Malawski Marcin for his patience and professionalism for training and advice on best practices. Malawski approaches the subject from different angles, different deployment tools Ansible, EKS kubectl, Terraform. Now I am definitely convinced that I am going into the right field of application.