Giới thiệu về blog

Chào các bạn, mình là Vương Đình Ân, sinh viên năm cuối trường Đại học Bách khoa Hà Nội, tại blog này, mình sẽ chia sẻ những kiến thức mà mình biết về Reinforcement Learning. Blog này được lập ra chỉ với mục đích duy nhất là học hỏi, chia sẻ kiến thức chứ không có tính chất như một khóa học.

Một số tài liệu tham khảo:

[1] Sutton, Richard S., and Andrew G. Barto. Reinforcement learning: An introduction. MIT press, 2018.
[2] Szepesvári, Csaba. “Algorithms for reinforcement learning.” Synthesis lectures on artificial intelligence and machine learning 4.1 (2010): 1-103.
[3] Denny Britz, Implementation of Reinforcement Learning Algorithms. Python, OpenAI Gym, Tensorflow. Exercises and Solutions to accompany Sutton’s Book and David Silver’s course., (2016), GitHub repository, https://github.com/dennybritz/reinforcement-learning
[4] Paszke, A. (2017, March 24). Reinforcement Learning (DQN) Tutorial — PyTorch Tutorials 1.10.1+cu102 documentation. REINFORCEMENT LEARNING (DQN) TUTORIAL. Retrieved March 3, 2022, from https://pytorch.org/tutorials/intermediate/reinforcement_q_learning.html

Posts

Feb 20, 2022
Bài 1: Giới thiệu về Reinforcement Learning (Học tăng cường)
Feb 19, 2022
Bài 2: Chuỗi đưa quyết định Markov (MDP)
Feb 17, 2022
Bài 3: Bài toán Multi-armed bandits
Feb 16, 2022
Bài 4: Giới thiệu về bài toán dự đoán giá trị (Value prediction)
Feb 15, 2022
Bài 5: Các thuật toán giải bài toán dự đoán giá trị
Feb 14, 2022
Bài 6: Giới thiệu về bài toán điều khiển (Control)
Feb 13, 2022
Bài 7: Thuật toán Q-Learning

Giới thiệu về blog

Posts

Bài 1: Giới thiệu về Reinforcement Learning (Học tăng cường)

Bài 2: Chuỗi đưa quyết định Markov (MDP)

Bài 3: Bài toán Multi-armed bandits

Bài 4: Giới thiệu về bài toán dự đoán giá trị (Value prediction)

Bài 5: Các thuật toán giải bài toán dự đoán giá trị

Bài 6: Giới thiệu về bài toán điều khiển (Control)

Bài 7: Thuật toán Q-Learning