基于上海交通大学强化学习课程系列课程学习RL的笔记. SJTU RL Course (wnzhang.net) 此为第二讲的内容, 主要讲述了马尔科夫决策过程MDP的概念, 并给出了策略度量, 策略值函数, 基于值函数进行策略提升的内容.
CH1 Introduction 编译原理一书, Introduction一章的阅读笔记. 因为是introduction所以不用看得那么认真, 随便看看就好. 需要把热情留到后面. 在写这篇博客时, 对编译原理的整体理解还不是很深入, 因此可能有错漏. 预计会在全部学完之后, 对这篇introduction中的内容进行检查更正.
整了一个"文艺作品补完计划", 汇总了搜集到的一些榜单. 大致上从经典文学, 网络文学, 番剧轻小说, 电影, 电视剧几个方面, 尝试列出一个"不可不看"表. 这个表只起一个参考价值, 各人的兴趣喜好不同, 榜上内容当然也不能获得所有人的喜爱.
CH1 INTRODUCTION 学习课程"形式语言与自动机"时做的笔记, 内容主要来自 Automata Theory, Languages, and Computation一书的第一章. 提及的内容主要是形式化证明的知识.