Pruebad96

Currently Anonymized Name Pruebad96

Popular repositories Loading

arduino arduino Public

Forked from firmata/arduino

Firmata firmware for Arduino

C++
Multi-Arm-Bandit Multi-Arm-Bandit Public

Implementation of diferent basic techniques to estimate value functions in stationary environments, also called Multi Arm Bandit Problems. Reference: Reinforcement Learning An Introduction by R.Sut…

Jupyter Notebook 1
Q_Learning_Explained Q_Learning_Explained Public

Forked from llSourcell/Q_Learning_Explained

This is the code for "Q Learning Explained" by Siraj Raval on Youtube

Python
Dynamic-Programming Dynamic-Programming Public

Implementetion of diferent basic techniques to estimate value functions and policies in MDP based environments. Reference: Reinforcement Learning An Introduction by R.Sutton and A.Barto.

Jupyter Notebook
Attention-Seeker Attention-Seeker Public

Jupyter Notebook