Research Notes | Feixiang Tao

ESC

Type to search...

0 results

Notes Blog Projects Publications Tags CV About

Notes Blog Projects Publications Tags CV About

Notes

Technical derivations and theoretical explorations in physics, mathematics, and computer science.

2026-01-22 EECS498 Note 1: 信息与优化

2026-01-11 数理方法 Note 1: 希尔伯特空间 #1

2026-06-15 CS336 Lecture 6: GPU 性能、Kernel 手写与 Nsight 分析 #6

2026-01-02 CS61C note1 Number Representation/C Intro #1

2026-05-02 Intro to TCS Note 1：表示 #1 2026-05-02 Intro to TCS Note 2：计算与 Boolean 电路 #2

2026-01-06 分析力学 Note 0: 变分基础 #1 2026-01-02 分析力学 Note 1: 最小作用量原理 #2 2026-01-08 分析力学 Note 2.1: 位形空间 #3 2026-01-08 分析力学 Note 2.2: 度规、与相对论时空 #4 2026-01-09 分析力学 Note 2.3: 为什么切向量是偏导算子？ #5 2026-01-12 分析力学 Note 3: 再论最小作用量与相对论时空 #6

2026-03-12 MiniMind 总架构图 2026-03-18 MiniMind 01: RMSNorm #1 2026-03-18 MiniMind 02: RoPE & YaRN #2 2026-03-18 MiniMind 03: GQA #3 2026-03-18 MiniMind 04: FFN #4 2026-03-18 MiniMind 05: 拼装 Model #5

2026-03-18 ODE Note 1：从一般线性 k 阶微分方程到一阶自治系统的动力学视角 #1 2026-03-18 ODE Note 2：一阶非自洽周期系统的定性研究 #2 2026-03-31 ODE Note 3：初值问题分析 #3

2026-02-08 概率论随笔 1：测度、sigma-代数与随机变量 #1 2026-02-26 概率论随笔 2：期望、条件与独立性 #2 2026-02-27 概率论随笔 2.5：一些细节 #2.5

2026-03-19 RL 数学 Note 1：值函数与贝尔曼期望方程 #1 2026-03-19 RL 数学 Note 2：贝尔曼最优方程、值迭代与策略迭代 #2 2026-04-13 RL 数学 Note 4：随机近似、TD 与 Q-learning #4 2026-04-13 RL 数学 Note 5：策略梯度、Baseline 与 Off-Policy #5 2026-05-12 RL 数学 Note 6：序列决策与大语言模型的强化学习 #6 2026-05-12 RL 数学 Note 7：基于模型的强化学习 #7 2026-05-12 RL 数学 Note 8：基于模型的强化学习算法 #8 2026-05-12 RL 数学 Note 9：离线强化学习 #9 2026-05-12 RL 数学 Note 10：离线强化学习算法 #10

Feixiang Tao · 2026 · Shenzhen