Cursuri de pregatire Apache Airflow for Data Science: Automating Machine Learning Pipelines
Apache Airflow este o platformă open-source pentru orchestrarea fluxurilor de lucru și automatizarea conductelor complexe de date.
Această formare live (online sau la fața locului), condusă de un instructor, se adresează participanților de nivel mediu care doresc să automatizeze și să gestioneze fluxurile de lucru de învățare automată, inclusiv formarea, validarea și implementarea modelelor utilizând Apache Airflow.
Până la sfârșitul acestei formări, participanții vor fi capabili să:
- Să configureze Apache Airflow pentru orchestrarea fluxurilor de lucru de învățare automată.
- Să automatizeze preprocesarea datelor, formarea modelului și sarcinile de validare.
- Să integreze Airflow cu cadrele și instrumentele de învățare automată.
- Implementați modele de învățare automată utilizând conducte automate.
- Monitorizați și optimizați fluxurile de lucru de învățare automată în producție.
Formatul cursului
- Prelegere și discuții interactive.
- O mulțime de exerciții și practică.
- Implementare practică într-un mediu live-lab.
Opțiuni de personalizare a cursului
- Pentru a solicita o instruire personalizată pentru acest curs, vă rugăm să ne contactați pentru a aranja.
Schița de curs
Introducere la Apache Airflow pentru Machine Learning
- Prezentare generală a Apache Airflow și relevanța sa pentru știința datelor
- Caracteristici cheie pentru automatizarea fluxurilor de lucru de învățare automată
- Configurarea Airflow pentru proiecte de știința datelor
Construirea de conducte Machine Learning cu Airflow
- Proiectarea DAG-urilor pentru fluxuri de lucru ML end-to-end
- Utilizarea operatorilor pentru ingestia datelor, preprocesarea și ingineria caracteristicilor
- Programarea și gestionarea dependențelor de conducte
Formarea și validarea modelelor
- Automatizarea sarcinilor de formare a modelelor cu Airflow
- Integrarea Airflow cu cadrele ML (de exemplu, TensorFlow, PyTorch)
- Validarea modelelor și stocarea metricilor de evaluare
Implementarea și monitorizarea modelelor
- Implementarea modelelor de învățare automată utilizând conducte automate
- Monitorizarea modelelor implementate cu ajutorul sarcinilor Airflow
- Gestionarea reantrenării și a actualizărilor modelelor
Personalizare și integrare avansate
- Dezvoltarea de operatori personalizați pentru sarcini specifice ML
- Integrarea Airflow cu platforme cloud și servicii ML
- Extinderea fluxurilor de lucru Airflow cu plugin-uri și senzori
Optimizarea și scalarea conductelor ML
- Îmbunătățirea performanței fluxului de lucru pentru date la scară largă
- Scalarea implementărilor Airflow cu Celery și Kubernetes
- Cele mai bune practici pentru fluxuri de lucru ML de nivel de producție
Studii de caz și aplicații practice
- Exemple din lumea reală de automatizare ML cu ajutorul Airflow
- Exercițiu practic: Construirea unei conducte ML de la un capăt la altul
- Discutarea provocărilor și soluțiilor în gestionarea fluxurilor de lucru ML
Rezumat și pași următori
Cerințe
- Familiaritate cu fluxurile de lucru și conceptele de învățare automată
- Înțelegerea de bază a Apache Airflow, inclusiv a DAG-urilor și operatorilor
- Competențe în programarea Python
Audiență
- Oameni de știință în domeniul datelor
- ingineri în domeniul învățării automate
- Dezvoltatori AI
Cursurile publice necesita 5+ participanti
Cursuri de pregatire Apache Airflow for Data Science: Automating Machine Learning Pipelines - Booking
Cursuri de pregatire Apache Airflow for Data Science: Automating Machine Learning Pipelines - Enquiry
Upcoming Courses
Cursuri înrudite
AdaBoost Python for Machine Learning
14 oreAceastă instruire live, cu instructor, în România (online sau la fața locului) se adresează cercetătorilor de date și inginerilor software care doresc să utilizeze AdaBoost pentru a construi algoritmi de boosting pentru învățarea automată cu Python.
Până la sfârșitul acestui training, participanții vor fi capabili să:
- Să configureze mediul de dezvoltare necesar pentru a începe să construiască modele de învățare automată cu AdaBoost.
- Să înțeleagă abordarea învățării în ansamblu și cum să implementeze boosting adaptiv.
- Să învețe cum să construiască modele AdaBoost pentru a stimula algoritmii de învățare automată în Python.
- Să utilizați reglarea hiperparametrilor pentru a crește precizia și performanța modelelor AdaBoost.
Anaconda Ecosystem for Data Scientists
14 oreAceastă instruire live, condusă de un instructor în România (online sau la fața locului) se adresează oamenilor de știință din domeniul datelor care doresc să utilizeze ecosistemul Anaconda pentru a captura, gestiona și implementa pachete și fluxuri de lucru pentru analiza datelor într-o singură platformă.
Până la sfârșitul acestui curs, participanții vor fi capabili să:
- Să instaleze și să configureze componentele și bibliotecile Anaconda.
- Să înțeleagă conceptele, caracteristicile și beneficiile de bază ale Anaconda.
- Să gestioneze pachete, medii și canale utilizând Anaconda Navigator.
- Utilizați Conda, R și pachetele Python pentru știința datelor și învățarea automată.
- Cunoașteți câteva cazuri practice de utilizare și tehnici pentru gestionarea mai multor medii de date.
AutoML with Auto-Keras
14 oreAcest curs de formare live, condus de un instructor în România (online sau la fața locului) se adresează oamenilor de știință din domeniul datelor, precum și persoanelor mai puțin tehnice care doresc să utilizeze Auto-Keras pentru a automatiza procesul de selecție și optimizare a unui model de învățare automată.
La sfârșitul acestui training, participanții vor fi capabili să:
- Să automatizeze procesul de formare a modelelor de învățare automată foarte eficiente.
- Să caute automat cei mai buni parametri pentru modelele de învățare profundă.
- Să construiască modele de învățare automată extrem de precise.
- Să utilizeze puterea învățării automate pentru a rezolva probleme de afaceri din lumea reală.
AutoML
14 oreAcest curs de formare live, condus de un instructor în România (online sau la fața locului) se adresează persoanelor tehnice cu experiență în învățarea automată care doresc să optimizeze modelele de învățare automată utilizate pentru detectarea modelelor complexe în big data.
La sfârșitul acestei formări, participanții vor fi capabili să:
- Să instaleze și să evalueze diverse instrumente open source AutoML (H2O AutoML, auto-sklearn, TPOT, TensorFlow, PyTorch, Auto-Keras, TPOT, Auto-WEKA, etc.)
- Pregătiți modele de învățare automată de înaltă calitate.
- Rezolvați eficient diferite tipuri de probleme de învățare automată supravegheată.
- Scrieți doar codul necesar pentru a iniția procesul de învățare automată.
Creating Custom Chatbots with Google AutoML
14 oreAcest curs de instruire live, condus de un instructor în România (online sau la fața locului) se adresează participanților cu diferite niveluri de expertiză care doresc să utilizeze platforma Google AutoML pentru a construi chatbots personalizate pentru diverse aplicații.
La sfârșitul acestui curs de formare, participanții vor putea să:
- Înțeleagă elementele fundamentale ale dezvoltării chatbot-urilor.
- Să navigheze în Google Cloud Platform și să acceseze AutoML.
- Pregătească datele pentru antrenarea modelelor de chatbot.
- Să antreneze și să evalueze modele personalizate de chatbot folosind AutoML.
- Să implementeze și să integreze chatbots în diverse platforme și canale.
- Monitorizați și optimizați performanța chatbot-ului în timp.
DataRobot
7 oreAcest curs de formare live, condus de un instructor în România (online sau la fața locului) se adresează cercetătorilor și analiștilor de date care doresc să automatizeze, să evalueze și să gestioneze modele predictive utilizând capacitățile de învățare automată ale DataRobot.
Până la sfârșitul acestei instruiri, participanții vor fi capabili să:
- Să încarce seturi de date în DataRobot pentru a analiza, evalua și verifica calitatea datelor.
- Să construiască și să antreneze modele pentru a identifica variabile importante și pentru a atinge obiectivele de predicție.
- Să interpreteze modelele pentru a crea informații valoroase care sunt utile în luarea deciziilor de afaceri.
- Să monitorizeze și să gestioneze modelele pentru a menține o performanță optimizată de predicție.
Data Mining with Weka
14 oreAcest curs de formare live, condus de un instructor în România (online sau la fața locului) se adresează analiștilor de date și cercetătorilor de date de nivel începător până la mediu care doresc să utilizeze Weka pentru a efectua activități de extragere de date.
Până la sfârșitul acestei instruiri, participanții vor fi capabili să:
- Să instaleze și să configureze Weka.
- Să înțeleagă mediul Weka și workbench-ul.
- Să execute sarcini de extragere a datelor utilizând Weka.
Google Cloud AutoML
7 oreAceastă instruire live, condusă de un instructor în România (online sau la fața locului) se adresează oamenilor de știință, analiștilor și dezvoltatorilor de date care doresc să exploreze produsele și caracteristicile AutoML pentru a crea și implementa modele de instruire ML personalizate cu un efort minim.
Până la sfârșitul acestui training, participanții vor fi capabili să:
- Să exploreze linia de produse AutoML pentru a implementa diferite servicii pentru diverse tipuri de date.
- Să pregătească și să eticheteze seturi de date pentru a crea modele ML personalizate.
- Să instruiască și să gestioneze modelele pentru a produce modele de învățare automată precise și corecte.
- Să facă predicții utilizând modele instruite pentru a îndeplini obiectivele și nevoile de afaceri.
Kaggle
14 oreAceastă formare live, cu instructor, în România (online sau la fața locului) se adresează cercetătorilor și dezvoltatorilor de date care doresc să învețe și să își construiască o carieră în Data Science folosind Kaggle.
Până la sfârșitul acestei formări, participanții vor fi capabili să:
- Să învețe despre știința datelor și învățarea automată.
- Să exploreze analiza datelor.
- Să învețe despre Kaggle și modul său de funcționare.
Machine Learning for Mobile Apps using Google’s ML Kit
14 oreAceastă instruire live, condusă de un instructor (online sau la fața locului) se adresează dezvoltatorilor care doresc să utilizeze Google ML Kit pentru a construi modele de învățare automată care sunt optimizate pentru procesarea pe dispozitive mobile.
Până la sfârșitul acestei formări, participanții vor fi capabili să:
- Să configureze mediul de dezvoltare necesar pentru a începe să dezvolte funcții de învățare automată pentru aplicațiile mobile.
- Să integreze noile tehnologii de învățare automată în aplicațiile Android și iOS utilizând API-urile ML Kit.
- Să îmbunătățească și să optimizeze aplicațiile existente utilizând SDK ML Kit pentru procesarea și implementarea pe dispozitiv.
Accelerating Python Pandas Workflows with Modin
14 oreAcest curs de formare live, condus de un instructor în România (online sau la fața locului) se adresează cercetătorilor și dezvoltatorilor de date care doresc să utilizeze Modin pentru a construi și implementa calcule paralele cu Pandas pentru o analiză mai rapidă a datelor.
Până la sfârșitul acestui training, participanții vor fi capabili să:
- Să configureze mediul necesar pentru a începe să dezvolte fluxuri de lucru Pandas la scară largă cu Modin.
- Să înțeleagă caracteristicile, arhitectura și avantajele Modin.
- Să cunoască diferențele dintre Modin, Dask și Ray.
- Efectuați operații Pandas mai rapid cu Modin.
- Implementați întregul API și funcțiile Pandas.
Machine Learning with Random Forest
14 oreAcest curs de formare live, condus de un instructor în România (online sau la fața locului) se adresează cercetătorilor de date și inginerilor software care doresc să utilizeze Random Forest pentru a construi algoritmi de învățare automată pentru seturi mari de date.
Până la sfârșitul acestei instruiri, participanții vor fi capabili să:
- Configurați mediul de dezvoltare necesar pentru a începe să construiască modele de învățare automată cu Random forest.
- Înțeleagă avantajele Random Forest și cum să îl implementeze pentru a rezolva probleme de clasificare și regresie.
- Să învețe cum să gestioneze seturi mari de date și să interpreteze arbori de decizie multipli în Random Forest.
- Evaluați și optimizați performanța modelului de învățare automată prin reglarea hiperparametrilor.
Advanced Analytics with RapidMiner
14 oreAcest curs de formare live, condus de un instructor în România (online sau la fața locului) se adresează analiștilor de date de nivel mediu care doresc să învețe cum să utilizeze RapidMiner pentru a estima și proiecta valori și să utilizeze instrumente analitice pentru prognozarea seriilor temporale.
La finalul acestei formări, participanții vor fi capabili să:
- Să învețe să aplice metodologia CRISP-DM, să selecteze algoritmi de învățare automată adecvați și să îmbunătățească construcția și performanța modelelor.
- Să utilizeze RapidMiner pentru a estima și proiecta valori și să utilizeze instrumente analitice pentru prognozarea seriilor temporale.
RapidMiner for Machine Learning and Predictive Analytics
14 oreRapidMiner este o platformă software open source pentru știința datelor pentru prototiparea și dezvoltarea rapidă a aplicațiilor. Acesta include un mediu integrat pentru pregătirea datelor, învățarea automată, învățarea profundă, extragerea textelor și analiza predictivă.
În cadrul acestui curs live condus de un instructor, participanții vor învăța cum să utilizeze RapidMiner Studio pentru pregătirea datelor, învățarea automată și implementarea modelelor predictive.
Până la sfârșitul acestei instruiri, participanții vor fi capabili să:
- Să instaleze și să configureze RapidMiner
- Pregătirea și vizualizarea datelor cu RapidMiner
- Să valideze modele de învățare automată
- Mashup date și să creeze modele predictive
- Să operaționalizeze analizele predictive în cadrul unui proces de afaceri
- Depanarea și optimizarea RapidMiner
Audiență
- Oameni de știință în domeniul datelor
- ingineri
- Dezvoltatori
Formatul cursului
- Parte prelegere, parte discuție, exerciții și multă practică
Notă
- Pentru a solicita o instruire personalizată pentru acest curs, vă rugăm să ne contactați pentru a aranja.
GPU Data Science with NVIDIA RAPIDS
14 oreAcest curs de formare live, condus de un instructor în România (online sau la fața locului) se adresează cercetătorilor și dezvoltatorilor de date care doresc să utilizeze RAPIDS pentru a construi conducte de date, fluxuri de lucru și vizualizări accelerate GPU, aplicând algoritmi de învățare automată, cum ar fi XGBoost, cuML etc.
La sfârșitul acestui curs, participanții vor fi capabili să:
- Configurați mediul de dezvoltare necesar pentru a construi modele de date cu NVIDIA RAPIDS.
- Să înțeleagă caracteristicile, componentele și avantajele RAPIDS.
- Să utilizeze GPUs pentru a accelera conductele de date și de analiză de la un capăt la altul.
- Implementați pregătirea datelor și ETL accelerate cu GPU- cu cuDF și Apache Arrow.
- Învățați cum să efectuați sarcini de învățare automată cu algoritmi XGBoost și cuML.
- Creați vizualizări de date și executați analize grafice cu cuXfilter și cuGraph.