2025-04-09 3.1k words 10 mins

[misc] 25-03 那些我看到的

前段时间的总结回顾.

2025-03-11 3.1k words 10 mins

[misc] 25-03 那些我看到的

前段时间的总结回顾.

2024-12-17 4.4k words 17 mins

[Automata] Ch9 Petri网络 PN

学习Automata PPT的记录.

2024-12-16 4.1k words 16 mins

[Automata] Ch9 变迁系统 TS

学习Automata PPT的记录.

2024-12-14 1.9k words 7 mins

[Automata] Ch8 图灵机 TM

学习Automata PPT的记录.

2024-12-14 492 words 1 min

[ControlSystem] Ch13 数字控制系统简介

学习控制理论课程PPT的记录.

2024-12-14 1.4k words 6 mins

[ControlSystem] Ch11 状态变量反馈控制系统设计

学习控制理论课程PPT的记录.

2024-12-13 1.8k words 8 mins

[ControlSystem] Ch3 状态空间模型

学习控制理论课程PPT的记录.

2024-12-13 2k words 7 mins

[ControlSystem] Ch7 根轨迹法

学习控制理论课程PPT的记录.

2024-12-13 893 words 3 mins

[ControlSystem] Ch6 控制系统的稳定性

学习控制理论课程PPT的记录.

2024-12-05 1.8k words 8 mins

[RLHF] OpenRLHF食用指南 (并非指南)

使用OpenRLHF
https://github.com/OpenRLHF/OpenRLHF?tab=readme-ov-file
的过程.

2024-12-05 2.1k words 9 mins

[docker] nvidia-docker使用教程

nvidia-docker安装过程中各种报错的解决流程. 以及GPT回答的docker教程.

2024-12-03 4.4k words 18 mins

[RL] TRPO 和 PPO

准备写TRPO和PPO的代码. 数学的推导非常的多, 即使不深究原理也有难度

2024-12-02 1.7k words 5 mins

[misc] 24-12 那些我看到的

11月的总结回顾

2024-11-25 912 words 4 mins

[Automata] Ch7 上下文无关语言 CFL

学习Automata PPT的记录. 相关笔记会另开博客记录. 也可能不会开.

2024-11-18 6.5k words 22 mins

[misc] 24-11 那些我看到的

小说我岳父是李世民 B站视频里找的. 主要情节就是男主在不知情的情况下娶了李世民的女儿, 顺便治好了她的贫血. 然后就是发明现代人的各种小玩意. 目前看了200章左右, 总共是一千章. 比较平淡的文笔, 有种简简单单过日子的低欲望感觉. 就是男主的性格不是很讨喜, 有种刻意"犯贱"的感觉, 只看见借着现代人的优势在那搅东搅西了, 没看到性格上的闪光点. 看着不是很喜欢. 评价是5-6分, 能看, 但是不太能看. 文笔看着还行, 虽然很碎也很浅, 但是至少能把事情讲清楚. 情节安排和人物形象有些不讨喜. 一品布衣也是B站视频找的. 也是开局送老婆的类型. 开始

2024-11-14 4.6k words 19 mins

[ControlSystem] Ch5 控制系统的性能

学习控制理论课程PPT的记录. 相关笔记会另开博客记录. 也可能不会开.

2024-11-13 1.6k words 5 mins

[misc] 先装ubuntu, 再装win11双系统

先装ubuntu, 再装win11双系统. 预计流程应该和普通的双系统差不多.

2024-11-13 4.1k words 18 mins

[Automata] Ch6 下推自动机 PDA

学习Automata PPT的记录. 相关笔记会另开博客记录. 也可能不会开.

2024-11-13 203 words 1 min

[Automata] Ch3 正则表达式与正则语言: Regular Expressions and Languages

CH3 Regular Expressions and Languages

学习课程"形式语言与自动机"时做的笔记, 内容主要来自 Automata Theory, Languages, and Computation一书的第三章. 主要是关于RE的内容.

2024-11-13 2.1k words 8 mins

[Automata] Ch5 上下文无关语法 CFG

学习Automata PPT的记录. 相关笔记会另开博客记录. 也可能不会开.

2024-11-11 1.1k words 4 mins

[RL] PyTorch实现RL框架算法及 DQN

前两天折腾了一下DQN, 但是很杂乱. 今天打算干干净净地把DQN给做了.

2024-11-10 1k words 4 mins

[misc] 11-10 折腾的一些杂项

11.10的一些杂项

2024-11-08 3.1k words 11 mins

[PyTorch] 关于自动求导机制以及优化器的工作原理

关于自动求导机制以及优化器的工作原理. 主要是GPT的说明, 夹杂了一些自己的总结.

2024-11-07 5.5k words 22 mins

[RL] stable-baselines3实现DQN, double DQN, Rainbow, DDPG, TD3, SAC, TRPO, PPO

实现DQN算法前, 打算先做一个baseline, 下面是具体的实现过程.

2024-11-07 633 words 2 mins

[misc] 11-06 折腾的一些杂项

11.06的一些杂项

2024-11-05 1.1k words 4 mins

[misc] 11-05 折腾的一些杂项

11.05的一些杂项

2024-11-05 165 words 1 min

当妖精们舞动翅膀

随手写了一首小诗.

2024-11-05 997 words 4 mins

[RL] 第八讲: 深度策略梯度

基于上海交通大学强化学习课程系列课程学习RL的笔记.
SJTU RL Course (wnzhang.net)

前面讲的DQNs和DPGs要么是基于价值的方法, 要么是基于确定性策略的方法. 这里我们讨论基于随机策略的方法.

2024-11-05 929 words 3 mins

[RL] 第七讲: 深度强化学习

基于上海交通大学强化学习课程系列课程学习RL的笔记.
SJTU RL Course (wnzhang.net)

我们进一步介绍各种深度学习方法. 由于引入了神经网络和深度学习, 所以我们遇到了更多的问题, 也探究出了更多的解决方法.

[misc] 25-03 那些我看到的

[misc] 25-03 那些我看到的

[Automata] Ch9 Petri网络 PN

[Automata] Ch9 变迁系统 TS

[Automata] Ch8 图灵机 TM

[ControlSystem] Ch13 数字控制系统简介

[ControlSystem] Ch11 状态变量反馈控制系统设计

[ControlSystem] Ch3 状态空间模型

[ControlSystem] Ch7 根轨迹法

[ControlSystem] Ch6 控制系统的稳定性

[RLHF] OpenRLHF食用指南 (并非指南)

[docker] nvidia-docker使用教程

[RL] TRPO 和 PPO

[misc] 24-12 那些我看到的

[Automata] Ch7 上下文无关语言 CFL

[misc] 24-11 那些我看到的

[ControlSystem] Ch5 控制系统的性能

[misc] 先装ubuntu, 再装win11双系统

[Automata] Ch6 下推自动机 PDA

[Automata] Ch3 正则表达式与正则语言: Regular Expressions and Languages

CH3 Regular Expressions and Languages

[Automata] Ch5 上下文无关语法 CFG

[RL] PyTorch实现RL框架算法 及 DQN

[misc] 11-10 折腾的一些杂项

[PyTorch] 关于自动求导机制以及优化器的工作原理

[RL] stable-baselines3实现DQN, double DQN, Rainbow, DDPG, TD3, SAC, TRPO, PPO

[misc] 11-06 折腾的一些杂项

[misc] 11-05 折腾的一些杂项

当妖精们舞动翅膀

[RL] 第八讲: 深度策略梯度

[RL] 第七讲: 深度强化学习

[RL] PyTorch实现RL框架算法及 DQN