#Mathematics
10 items
2026-04-13 RL 数学 Note 4:随机近似、TD 与 Q-learning notes 2026-04-13 RL 数学 Note 5:策略梯度、Baseline 与 Off-Policy notes 2026-03-31 ODE Note 3:初值问题分析 notes 2026-03-19 RL 数学 Note 1:值函数与贝尔曼期望方程 notes 2026-03-19 RL 数学 Note 2:贝尔曼最优方程、值迭代与策略迭代 notes 2026-03-18 ODE Note 1:从一般线性 k 阶微分方程到一阶自治系统的动力学视角 notes 2026-03-18 ODE Note 2:一阶非自洽周期系统的定性研究 notes 2026-02-27 概率论随笔 2.5:一些细节 notes 2026-02-26 概率论随笔 2:期望、条件与独立性 notes 2026-02-08 概率论随笔 1:测度、sigma-代数与随机变量 notes