Cursuri de pregatire Jupyter for Data Science Teams
Jupyter este un IDE interactiv și un mediu de calcul interactiv bazat pe web, cu sursă deschisă.
Acest curs de formare live (online sau la fața locului), condus de un instructor, prezintă ideea de dezvoltare colaborativă în știința datelor și demonstrează cum să se utilizeze Jupyter pentru a urmări și a participa în echipă la "ciclul de viață al unei idei de calcul". Acesta îi conduce pe participanți prin crearea unui proiect de exemplu de știință a datelor bazat pe partea superioară a ecosistemului Jupyter.
La finalul acestui curs de formare, participanții vor fi capabili să:
- Să instaleze și să configureze Jupyter, inclusiv crearea și integrarea unui depozit de echipă pe Git.
- Să utilizeze caracteristicile Jupyter, cum ar fi extensiile, widgeturile interactive, modul multiutilizator și altele pentru a permite colaborarea în cadrul proiectului.
- Să creeze, să partajeze și să organizeze Jupyter Notebooks cu membrii echipei.
- Alegeți din Scala, Python, R, pentru a scrie și executa coduri împotriva sistemelor de date mari, cum ar fi Apache Spark, toate prin intermediul interfeței Jupyter.
Formatul cursului
- Prelegere interactivă și discuții.
- Multe exerciții și practică.
- Implementare practică într-un mediu live-lab.
Opțiuni de personalizare a cursului
- Jupyter Notebook suportă peste 40 de limbaje, inclusiv R, Python, Scala, Scala, Julia, etc. Pentru a personaliza acest curs în limba (limbile) pe care o (le) alegeți, vă rugăm să ne contactați pentru a aranja.
Schița de curs
Introducere în Jupyter
- Prezentare generală a Jupyter și a ecosistemului său
- Instalare și configurare
- Configurarea Jupyter pentru colaborarea în echipă
Caracteristici de colaborare
- Utilizarea Git pentru controlul versiunilor
- Extensii și widget-uri interactive
- Modul multiutilizator
Crearea și gestionarea notebook-urilor
- Structura și funcționalitatea notebook-urilor
- Partajarea și organizarea notebook-urilor
- Cele mai bune practici pentru colaborare
Programming cu Jupyter
- Alegerea și utilizarea limbajelor de programare (Python, R, Scala)
- Scrierea și execuția codului
- Integrarea cu sistemele de date mari (Apache Spark)
Caracteristici avansate Jupyter
- Personalizarea mediului Jupyter
- Automatizarea fluxurilor de lucru cu Jupyter
- Explorarea cazurilor avansate de utilizare
Sesiuni practice
- Laboratoare practice
- Proiecte de știință a datelor din lumea reală
- Exerciții de grup și evaluări inter pares
Rezumat și pași următori
Cerințe
- Programming experiență în limbaje precum Python, R, Scala etc.
- O experiență în știința datelor
Audiență
- Echipe de știință a datelor
Cursurile publice necesita 5+ participanti
Cursuri de pregatire Jupyter for Data Science Teams - Booking
Cursuri de pregatire Jupyter for Data Science Teams - Enquiry
Jupyter for Data Science Teams - Cerere de consultanta
Cerere de consultanta
Mărturii (1)
It is great to have the course custom made to the key areas that I have highlighted in the pre-course questionnaire. This really helps to address the questions that I have with the subject matter and to align with my learning goals.
Winnie Chan - Statistics Canada
Curs - Jupyter for Data Science Teams
Upcoming Courses
Cursuri înrudite
Introduction to Data Science and AI using Python
35 oreAceasta este o introducere de 5 zile în Data Science și AI.
Cursul se livrează cu exemple și exerciții cu Python
Apache Airflow for Data Science: Automating Machine Learning Pipelines
21 oreAceastă formare live, cu instructor, în România (online sau la fața locului) se adresează participanților de nivel mediu care doresc să automatizeze și să gestioneze fluxurile de lucru de învățare automată, inclusiv formarea, validarea și implementarea modelelor utilizând Apache Airflow.
Până la sfârșitul acestei formări, participanții vor fi capabili să:
- Să configureze Apache Airflow pentru orchestrarea fluxurilor de lucru de învățare automată.
- Să automatizeze preprocesarea datelor, formarea modelului și sarcinile de validare.
- Să integreze Airflow cu cadrele și instrumentele de învățare automată.
- Implementați modele de învățare automată utilizând conducte automate.
- Monitorizați și optimizați fluxurile de lucru de învățare automată în producție.
Anaconda Ecosystem for Data Scientists
14 oreAceastă instruire live, condusă de un instructor în România (online sau la fața locului) se adresează oamenilor de știință din domeniul datelor care doresc să utilizeze ecosistemul Anaconda pentru a captura, gestiona și implementa pachete și fluxuri de lucru pentru analiza datelor într-o singură platformă.
Până la sfârșitul acestui curs, participanții vor fi capabili să:
- Să instaleze și să configureze componentele și bibliotecile Anaconda.
- Să înțeleagă conceptele, caracteristicile și beneficiile de bază ale Anaconda.
- Să gestioneze pachete, medii și canale utilizând Anaconda Navigator.
- Utilizați Conda, R și pachetele Python pentru știința datelor și învățarea automată.
- Cunoașteți câteva cazuri practice de utilizare și tehnici pentru gestionarea mai multor medii de date.
AWS Cloud9 for Data Science
28 oreAceastă instruire live cu instructor în România (online sau la fața locului) se adresează cercetătorilor și analiștilor de date de nivel mediu care doresc să utilizeze AWS Cloud9 pentru fluxuri de lucru simplificate în domeniul științei datelor.
Până la sfârșitul acestui training, participanții vor fi capabili să:
- Să configureze un mediu pentru știința datelor în AWS Cloud9.
- Să efectueze analize de date utilizând Python, R și Jupyter Notebook în Cloud9.
- Să integreze AWS Cloud9 cu serviciile de date AWS precum S3, RDS și Redshift.
- Utilizați AWS Cloud9 pentru dezvoltarea și implementarea modelelor de învățare automată.
- Optimizați fluxurile de lucru bazate pe cloud pentru analiza și prelucrarea datelor.
Big Data Business Intelligence for Telecom and Communication Service Providers
35 oreVizualizare
Furnizorii de servicii (CSP) se confruntă cu presiune pentru a reduce costurile și a maximiza veniturile medii pe utilizator (ARPU), asigurând în același timp o experiență excelentă a clienților, dar volumele de date continuă să crească. Traficul global de date mobile va crește la o rată anuală de creștere combinată (CAGR) de 78% până în 2016, ajungând la 10,8 exabite pe lună.
Între timp, CSP generează volume mari de date, inclusiv înregistrări de detalii de apel (CDR), date de rețea și date despre clienți. Companiile care exploatează pe deplin aceste date câștigă un prag competitiv. Conform unui sondaj recent realizat de The Economist Intelligence Unit, companiile care folosesc deciziile bazate pe date se bucură de o creștere de productivitate de 5-6%. Cu toate acestea, 53% dintre companii folosesc doar jumătate din datele lor valoroase, iar un sfert dintre respondenți a observat că cantități imense de date utile nu sunt folosite. Volumele de date sunt atât de mari încât analiza manuală este imposibilă, iar cele mai multe sisteme software de moștenire nu se pot menține, ceea ce duce la descărcarea sau ignorarea datelor valoroase.
Cu Big Data & Analytics’ software-ul de date mari de mare viteză, scalabil, CSP-urile pot minera toate datele lor pentru o mai bună luare a deciziilor în mai puțin timp. Diferite produse și tehnici oferă o platformă de software fin-to-end pentru colectarea, pregătirea, analizarea și prezentarea de înțelegeri din datele mari. Domeniile de aplicare includ monitorizarea performanței rețelei, detecția fraudelor, detecția clienților și analiza riscurilor de credit. Big Data & Scala produselor de analiză pentru a gestiona terabite de date, dar implementarea unor astfel de instrumente necesită un nou tip de sistem de bază de date bazată pe cloud, cum ar fi Hadoop sau procesorul de calcul paralel cu scară masivă (KPU etc.)
Acest curs lucrează pe Big Data BI pentru Telco acoperă toate domeniile emergente în care CSP-urile investesc pentru creșterea productivității și deschiderea unui nou flux de venituri de afaceri. Cursul va oferi o imagine completă de 360 de grade a Big Data BI în Telco, astfel încât factorii de decizie și managerii pot avea o imagine foarte largă și cuprinzătoare a posibilităților Big Data BI în Telco pentru productivitate și câștiguri de venituri.
Obiectivele cursului
Obiectivul principal al cursului este de a introduce noi Big Data tehnici de inteligență a afacerilor în 4 sectoare de Telecom Business (Marketing/ Vânzări, Operațiuni de rețea, Operațiuni financiare și Relații cu clienții Management). Elevii vor fi invitați să urmeze:
- Introducere la Big Data-ce este 4Vs (volume, viteză, varietate și veracitate) în Big Data- Generație, extracție și management din perspectiva Telco
- Cum se diferențiază analiza de date de moștenire
- In-house justificare a Big Data -Perspectivă Telco
- Introducere la Hadoop Ecosistem- familiaritate cu toate Hadoop instrumente cum ar fi Hive, Pig, SPARC –când și cum sunt utilizate pentru a rezolva problema Big Data
- Cum Big Data este extras pentru a analiza pentru instrumentul de analiză-cum Business Analysis’s pot reduce punctele lor de durere de colectare și de analiză a datelor prin abordarea integrată Hadoop dashboard
- Introducere de bază a analizei Insight, analizei de vizualizare și analizei predictive pentru Telco
- Analiza clienților Churn și Big Data-cum Big Data analiza pot reduce churnul clienților și insatisfacția clienților în studiile de caz Telco
- Analiza eșecurilor de rețea și a eșecurilor de serviciu din meta-data rețelei și IPDR
- Analiza financiară-fraudă, vase și estimarea ROI din vânzări și date operaționale
- Problema achiziției clienților - Marketingul țintă, segmentarea clienților și vânzările transversale din datele de vânzare
- Introducere și rezumat al tuturor produselor analitice Big Data și unde se potrivesc în spațiul analitic Telco
- Conclusie-cum să luați o abordare pas cu pas pentru a introduce Big Data Business Intelligence în organizația dvs.
Publicul țintă
- Operarea rețelei, managerii financiari, managerii CRM și managerii IT de top în biroul Telco CIO.
- Business Analiștii din Telco
- Administratori de birouri / analisti CFO
- Manageri de operare
- Managerii QA
Introduction to Google Colab for Data Science
14 oreAceastă instruire live, condusă de un instructor în România (online sau la fața locului) se adresează cercetătorilor de date de nivel începător și profesioniștilor IT care doresc să învețe elementele de bază ale științei datelor utilizând Google Colab.
Până la sfârșitul acestui training, participanții vor fi capabili să:
- Să configureze și să navigheze în Google Colab.
- Să scrie și să execute cod Python de bază.
- Să importe și să gestioneze seturi de date.
- Să creeze vizualizări utilizând biblioteci Python.
A Practical Introduction to Data Science
35 oreParticipanții care finalizează această formare vor dobândi o înțelegere practică, reală a Data Science și a tehnologiilor, metodologiilor și instrumentelor aferente.
Participanții vor avea ocazia să pună în practică aceste cunoștințe prin exerciții practice. Interacțiunea în grup și feedback-ul instructorului constituie o componentă importantă a cursului.
Cursul începe cu o introducere în conceptele elementare ale Data Science, apoi progresează în instrumentele și metodologiile utilizate în Data Science.
Audiență
- Dezvoltatori
- analiști tehnici
- Consultanți IT
Formatul cursului
- Parte prelegere, parte discuție, exerciții și multă practică
Notă
- Pentru a solicita o instruire personalizată pentru acest curs, vă rugăm să ne contactați pentru a aranja.
Data Science for Big Data Analytics
35 oreDatele mari sunt seturi de date atât de voluminoase și complexe încât softurile tradiționale de aplicații de prelucrare a datelor nu sunt adecvate pentru a le trata. Provocările de date mari includ captarea datelor, stocarea datelor, analiza datelor, căutarea, partajarea, transferul, vizualizarea, interogarea, actualizarea și confidențialitatea informațiilor.
Data Science essential for Marketing/Sales professionals
21 oreAcest curs este destinat Marketing profesioniștilor în vânzări care intenționează să aprofundeze aplicarea științei datelor în Marketing/Vânzări. Cursul oferă o acoperire detaliată a diferitelor tehnici de știință a datelor utilizate pentru „upsale”, „cross-sale”, segmentarea pieței, branding și CLV.
Diferența dintre Marketing și vânzări - Cum este că vânzările și marketingul sunt diferite?
În cuvinte foarte simple, vânzările pot fi denumite un proces care se concentrează sau vizează indivizi sau grupuri mici. Marketing, pe de altă parte, vizează un grup mai mare sau publicul larg. Marketing include cercetarea (identificarea nevoilor clientului), dezvoltarea produselor (producerea de produse inovatoare) și promovarea produsului (prin reclame) și crearea conștientizării despre produs în rândul consumatorilor. Ca atare, marketingul înseamnă generarea de clienți potențiali sau perspective. Odată ce produsul este scos pe piață, este sarcina vânzătorului să convingă clientul să cumpere produsul. Vânzările înseamnă convertirea clienților potențiali sau potențialilor în achiziții și comenzi, în timp ce marketingul vizează termene mai lungi, vânzările se referă la obiective mai scurte.
Introduction to Data Science
35 oreAcest training, instruit în direct (la fața locului sau la distanță), este orientat către profesioniști care doresc să înceapă o carieră în Data Science .
Până la sfârșitul acestui antrenament, participanții vor putea:
- Instalați și configurați Python și MySql.
- Înțelegeți ce este Data Science și cum poate adăuga valoare practic oricărei afaceri.
- Aflați elementele fundamentale ale codării în Python
- Aflați tehnici de Machine Learning supravegheate și nesupervizate și cum să le implementați și să interpretați rezultatele.
Formatul cursului
- Prelegeri și discuții interactive.
- O mulțime de exerciții și practică.
- Implementarea practică într-un mediu de laborator live.
Opțiuni de personalizare a cursului
- Pentru a solicita un antrenament personalizat pentru acest curs, vă rugăm să ne contactați pentru a vă organiza.
Kaggle
14 oreAceastă formare live, cu instructor, în România (online sau la fața locului) se adresează cercetătorilor și dezvoltatorilor de date care doresc să învețe și să își construiască o carieră în Data Science folosind Kaggle.
Până la sfârșitul acestei formări, participanții vor fi capabili să:
- Să învețe despre știința datelor și învățarea automată.
- Să exploreze analiza datelor.
- Să învețe despre Kaggle și modul său de funcționare.
Data Science with KNIME Analytics Platform
21 oreKNIME Platforma Analytics este o opțiune de sursă deschisă de top pentru inovația bazată pe date, ajutându-vă să descoperiți potențialul ascuns în datele dvs., să găsiți noi înțelegeri sau să preveniți viitorul nou. Cu mai mult de 1000 de module, sute de exemple pregătite, o gamă cuprinzătoare de instrumente integrate și cea mai largă selecție de algoritmi avansate disponibile, KNIME Platforma Analytics este cutia de instrumente perfectă pentru orice om de știință a datelor și analist de afaceri.
Acest curs pentru KNIME Platforma Analytics este o oportunitate ideală pentru începători, utilizatori avansati și KNIME experți să fie introduse la KNIME, să învețe cum să-l folosească mai eficient, și cum să creeze rapoarte clare, cuprinzătoare bazate pe KNIME fluxurile de lucru
Această formare directă de instructor (online sau on-site) este destinată profesioniștilor de date care doresc să utilizeze KNIME pentru a răspunde nevoilor complexe ale afacerilor.
Este destinat publicului care nu cunoaște programarea și intenționează să utilizeze instrumente de ultimă oră pentru a implementa scenarii analitice
La sfârșitul cursului, participanții vor putea:
- Instalați și configurați KNIME.
- Creați [ 0 ] scenarii
- Tren, testare și modele validate
- Implementarea se încheie cu lanțul de valoare final al modelelor de știință a datelor
Formatul cursului
- Lecții și discuții interactive.
- Multe exerciții și practici.
- Implementarea pe mâini într-un mediu live-lab.
Opțiuni de personalizare
- Pentru a solicita o pregătire personalizată pentru acest curs sau pentru a afla mai multe despre acest program, vă rugăm să ne contactați pentru a organiza.
MATLAB Fundamentals, Data Science & Report Generation
35 oreÎn prima parte a acestui curs, vom aborda elementele de bază ale MATLAB și funcția sa atât ca limbaj, cât și ca platformă. În această discuție este inclusă o introducere în sintaxa MATLAB, matrice și matrici, vizualizarea datelor, dezvoltarea scripturilor și principiile orientate pe obiect.
În a doua parte, vom demonstra modul de utilizare a MATLAB pentru extragerea datelor, învățarea automată și analiza predictivă. Pentru a oferi participanților o perspectivă clară și practică a abordării și puterii MATLAB, vom face comparații între utilizarea MATLAB și utilizarea altor instrumente, cum ar fi foile de calcul, C, C++ și Visual Basic.
În a treia parte a cursului, participanții învață cum să își eficientizeze activitatea prin automatizarea prelucrării datelor și generării de rapoarte.
Pe parcursul cursului, participanții vor pune în practică ideile învățate prin exerciții practice într-un mediu de laborator. Până la sfârșitul cursului, participanții vor avea o înțelegere aprofundată a capacităților MATLAB și vor putea să le utilizeze pentru a rezolva probleme reale de știința datelor, precum și pentru a-și eficientiza activitatea prin automatizare.
Pe parcursul cursului vor fi efectuate evaluări pentru a măsura progresul.
Formatul cursului
- Cursul include exerciții teoretice și practice, inclusiv discuții de caz, inspectarea codului eșantion și implementarea practică.
Notă
- Sesiunile practice se vor baza pe șabloane de rapoarte de date de probă prestabilite. Dacă aveți cerințe specifice, vă rugăm să ne contactați pentru a aranja.
Accelerating Python Pandas Workflows with Modin
14 oreAcest curs de formare live, condus de un instructor în România (online sau la fața locului) se adresează cercetătorilor și dezvoltatorilor de date care doresc să utilizeze Modin pentru a construi și implementa calcule paralele cu Pandas pentru o analiză mai rapidă a datelor.
Până la sfârșitul acestui training, participanții vor fi capabili să:
- Să configureze mediul necesar pentru a începe să dezvolte fluxuri de lucru Pandas la scară largă cu Modin.
- Să înțeleagă caracteristicile, arhitectura și avantajele Modin.
- Să cunoască diferențele dintre Modin, Dask și Ray.
- Efectuați operații Pandas mai rapid cu Modin.
- Implementați întregul API și funcțiile Pandas.
GPU Data Science with NVIDIA RAPIDS
14 oreAcest curs de formare live, condus de un instructor în România (online sau la fața locului) se adresează cercetătorilor și dezvoltatorilor de date care doresc să utilizeze RAPIDS pentru a construi conducte de date, fluxuri de lucru și vizualizări accelerate GPU, aplicând algoritmi de învățare automată, cum ar fi XGBoost, cuML etc.
La sfârșitul acestui curs, participanții vor fi capabili să:
- Configurați mediul de dezvoltare necesar pentru a construi modele de date cu NVIDIA RAPIDS.
- Să înțeleagă caracteristicile, componentele și avantajele RAPIDS.
- Să utilizeze GPUs pentru a accelera conductele de date și de analiză de la un capăt la altul.
- Implementați pregătirea datelor și ETL accelerate cu GPU- cu cuDF și Apache Arrow.
- Învățați cum să efectuați sarcini de învățare automată cu algoritmi XGBoost și cuML.
- Creați vizualizări de date și executați analize grafice cu cuXfilter și cuGraph.