Schița de curs

Introducere la Reinforcement Learning

  • Prezentare generală a învățării prin consolidare și a aplicațiilor sale
  • Diferențe între învățarea supravegheată, nesupravegheată și prin consolidare
  • Concepte-cheie: agent, mediu, recompense și politică

Procese decizionale Markov (MDP)

  • Înțelegerea stărilor, acțiunilor, recompenselor și tranzițiilor de stare
  • Funcțiile de valoare și ecuația Bellman
  • Programarea dinamică pentru rezolvarea MDP

Algoritmi RL de bază

  • Metode tabulare: Q-Learning și SARSA
  • Metode bazate pe politici: Algoritmul REINFORCE
  • Cadrele Actor-Critic și aplicațiile lor

Adânc Reinforcement Learning

  • Introducere în Deep Q-Networks (DQN)
  • Reluarea experienței și rețelele țintă
  • Gradienți de politică și metode avansate de RL profundă

Cadre și instrumente de RL

  • Introducere în OpenAI Gym și alte medii RL
  • Utilizarea PyTorch sau TensorFlow pentru dezvoltarea modelului RL
  • Formarea, testarea și evaluarea comparativă a agenților RL

Provocări în RL

  • Echilibrarea explorării și exploatării în formare
  • Gestionarea recompenselor rare și a problemelor de atribuire a creditelor
  • Scalabilitate și provocări computaționale în RL

Aplicații practice Activitie

  • Implementarea algoritmilor Q-Learning și SARSA de la zero
  • Instruirea unui agent bazat pe DQN pentru a juca un joc simplu în OpenAI Gym
  • Reglarea fină a modelelor RL pentru îmbunătățirea performanțelor în medii personalizate

Rezumat și pași următori

Cerințe

  • Înțelegere aprofundată a principiilor și algoritmilor de învățare automată
  • Competențe în programare Python
  • Familiaritate cu rețelele neuronale și cadrele de învățare profundă

Audiență

  • ingineri în domeniul învățării automate
  • Specialiști AI
 14 ore

Numărul de participanți


Pret per participant

Upcoming Courses

Categorii înrudite