- [Automata] Ch8 图灵机 TM
- [ControlSystem] Ch13 数字控制系统简介
- [ControlSystem] Ch11 状态变量反馈控制系统设计
- [ControlSystem] Ch3 状态空间模型
- [ControlSystem] Ch7 根轨迹法
- [ControlSystem] Ch6 控制系统的稳定性
- [RLHF] OpenRLHF食用指南
- [docker] nvidia-docker使用教程
- [RL] TRPO 和 PPO
- [misc] 24-12 那些我看到的
- [Automata] Ch7 上下文无关语言 CFL
- [misc] 24-11 那些我看到的
- [ControlSystem] Ch5 控制系统的性能
- [misc] 先装ubuntu, 再装win11双系统
- [Automata] Ch6 下推自动机 PDA
- [Automata] Ch3 正则表达式与正则语言: Regular Expressions and Languages
- [Automata] Ch5 上下文无关语法 CFG
- [RL] PyTorch实现RL框架算法 及 DQN
- [misc] 11-10 折腾的一些杂项
- [PyTorch] 关于自动求导机制以及优化器的工作原理
- [RL] stable-baselines3实现DQN, double DQN, Rainbow, DDPG, TD3, SAC, TRPO, PPO
- [misc] 11-06 折腾的一些杂项
- [misc] 11-05 折腾的一些杂项
- 当妖精们舞动翅膀
- [RL] 第八讲: 深度策略梯度
- [RL] 第七讲: 深度强化学习
- [RL] 第六讲: 价值和策略近似逼近方法
- 笔记本续航省电攻略 Ubuntu22.04
- [Complier] Ch3 词法分析
- [misc] 11-04 折腾的一些杂项