Giới thiệu về blog
Chào các bạn, mình là Vương Đình Ân, sinh viên năm cuối trường Đại học Bách khoa Hà Nội, tại blog này, mình sẽ chia sẻ những kiến thức mà mình biết về Reinforcement Learning. Blog này được lập ra chỉ với mục đích duy nhất là học hỏi, chia sẻ kiến thức chứ không có tính chất như một khóa học.
Một số tài liệu tham khảo:
- [1] Sutton, Richard S., and Andrew G. Barto. Reinforcement learning: An introduction. MIT press, 2018.
- [2] Szepesvári, Csaba. “Algorithms for reinforcement learning.” Synthesis lectures on artificial intelligence and machine learning 4.1 (2010): 1-103.
- [3] Denny Britz, Implementation of Reinforcement Learning Algorithms. Python, OpenAI Gym, Tensorflow. Exercises and Solutions to accompany Sutton’s Book and David Silver’s course., (2016), GitHub repository, https://github.com/dennybritz/reinforcement-learning
- [4] Paszke, A. (2017, March 24). Reinforcement Learning (DQN) Tutorial — PyTorch Tutorials 1.10.1+cu102 documentation. REINFORCEMENT LEARNING (DQN) TUTORIAL. Retrieved March 3, 2022, from https://pytorch.org/tutorials/intermediate/reinforcement_q_learning.html
Posts
Bài 1: Giới thiệu về Reinforcement Learning (Học tăng cường)
Bài 2: Chuỗi đưa quyết định Markov (MDP)
Bài 3: Bài toán Multi-armed bandits
Bài 4: Giới thiệu về bài toán dự đoán giá trị (Value prediction)
Bài 5: Các thuật toán giải bài toán dự đoán giá trị
Bài 6: Giới thiệu về bài toán điều khiển (Control)
Bài 7: Thuật toán Q-Learning
subscribe via RSS