Schița de curs

Introducere

Prezentare generală a Spark Streaming Caracteristici și arhitectură

  • Surse de date acceptate
  • API-uri de bază

Pregătirea mediului

  • Dependențe
  • Spark și contextul de streaming
  • Conectarea la Kafka

Procesarea mesajelor

  • Parsarea mesajelor primite ca JSON
  • Procese ETL
  • Pornirea contextului de streaming

Efectuarea unei ferestre Stream Processing

  • Interval de glisare
  • Configurarea livrării punctului de control
  • Lansarea mediului

Prototiparea codului de procesare

  • Conectarea la un subiect Kafka
  • Recuperarea JSON din sursa de date utilizând Paw
  • Variații și procesare suplimentară

Transmiterea codului

  • Variabile de control al lucrării
  • Definirea valorilor pentru potrivire
  • Funcții și condiții

Achiziționarea fluxului de ieșire

  • Contoare
  • Ieșire Kafka (potrivire și neapropiere)

Rezolvarea problemelor

Rezumat și concluzie

Cerințe

  • Experiență cu Python și Apache Kafka
  • Familiaritate cu platformele de procesare a fluxurilor

Audiență

  • Ingineri de date
  • Oameni de știință în domeniul datelor
  • Programatori
 7 ore

Numărul de participanți


Pret per participant

Mărturii (5)

Upcoming Courses

Categorii înrudite