少女祈祷中...
[Automata] Ch8 图灵机 TM
[ControlSystem] Ch13 数字控制系统简介
[ControlSystem] Ch11 状态变量反馈控制系统设计
[ControlSystem] Ch3 状态空间模型
[ControlSystem] Ch7 根轨迹法
[ControlSystem] Ch6 控制系统的稳定性
[RLHF] OpenRLHF食用指南
[docker] nvidia-docker使用教程
[RL] TRPO 和 PPO
[misc] 24-12 那些我看到的
[Automata] Ch7 上下文无关语言 CFL
[misc] 24-11 那些我看到的
[ControlSystem] Ch5 控制系统的性能
[misc] 先装ubuntu, 再装win11双系统
[Automata] Ch6 下推自动机 PDA
[Automata] Ch3 正则表达式与正则语言: Regular Expressions and  Languages
[Automata] Ch5 上下文无关语法 CFG
[RL] PyTorch实现RL框架算法 及 DQN
[misc] 11-10 折腾的一些杂项
[PyTorch] 关于自动求导机制以及优化器的工作原理
[RL] stable-baselines3实现DQN, double DQN, Rainbow, DDPG, TD3, SAC, TRPO, PPO
[misc] 11-06 折腾的一些杂项
[misc] 11-05 折腾的一些杂项
当妖精们舞动翅膀
[RL] 第八讲: 深度策略梯度
[RL] 第七讲: 深度强化学习
[RL] 第六讲: 价值和策略近似逼近方法
笔记本续航省电攻略 Ubuntu22.04
[Complier] Ch3 词法分析
[misc] 11-04 折腾的一些杂项