返回学习路线
2基础筑基

第 2 周:数学够用基础

矩阵乘法、向量空间、导数与链式法则

本周目标

  • 补齐 AI/ML 所需的核心数学知识,建立直觉理解。
  • 能把关键概念写成:公式(LaTeX)、代码(NumPy)、几何图像(可视化)。
  • 每个概念都回答两个问题:在 ML 中用在哪里为什么需要

学习内容

1. 线性代数核心(扩展为完整章节)

线性代数是 ML 的「表示与变换」基础:数据是向量/矩阵,模型大量使用线性映射与矩阵分解。

1.1 矩阵与向量基础

1.1.1 标量、向量、矩阵、张量的定义与区别

直觉/定义

  • 标量:单个实数 aRa\in\mathbb{R}
  • 向量:有序数组 xRn\mathbf{x}\in\mathbb{R}^n
  • 矩阵:二维数组 ARm×n\mathbf{A}\in\mathbb{R}^{m\times n}
  • 张量:更高维数组 TRd1××dk\mathcal{T}\in\mathbb{R}^{d_1\times\cdots\times d_k}

从计算角度:张量是“多维数组”,关键是 形状(shape)广播(broadcasting)

核心公式(LaTeX)

x=[x1xn],A=[Aij]m×n.\mathbf{x}=\begin{bmatrix}x_1\\\vdots\\x_n\end{bmatrix},\quad\mathbf{A}=\left[A_{ij}\right]_{m\times n}.

数据表/对照表

对象例子形状(shape)ML中用在哪里为什么需要
标量学习率 η\eta()超参数、损失控制优化步长/衡量效果
向量特征 x\mathbf{x}(d,)样本表示、embedding表示样本为点
矩阵批数据 X\mathbf{X}(N,d)训练输入、权重 W\mathbf{W}批量并行/线性变换
张量图像 batch(B,C,H,W)CNN/Transformer表示结构数据

在 ML 中用在哪里?

  • 监督学习:XRN×d\mathbf{X}\in\mathbb{R}^{N\times d}yRN\mathbf{y}\in\mathbb{R}^N
  • 神经网络:参数、激活、梯度都是张量。

为什么需要?

  • 统一符号让模型表达清晰。
  • 向量化计算可把 Python 循环换成底层 BLAS/GPU 高效运算。

1.1.2 矩阵运算:加法、乘法、转置、逆矩阵

直觉/定义

矩阵运算对应对数据的组合与变换:

  • 加法/数乘:线性组合。
  • 乘法:把输入按列做线性组合。
  • 转置:交换行列(常用于构造内积/协方差)。
  • 逆:对可逆变换进行“反变换”(但数值计算中更常解方程而非显式求逆)。

核心公式(LaTeX)

加法/数乘: (A+B)ij=Aij+Bij,(cA)ij=cAij.(\mathbf{A}+\mathbf{B})_{ij}=A_{ij}+B_{ij},\quad (c\mathbf{A})_{ij}=cA_{ij}.

乘法: (AB)ij=k=1nAikBkj.(\mathbf{A}\mathbf{B})_{ij}=\sum_{k=1}^n A_{ik}B_{kj}.

转置: (A)ij=Aji.(\mathbf{A}^\top)_{ij}=A_{ji}.

逆矩阵: A1A=I.\mathbf{A}^{-1}\mathbf{A}=\mathbf{I}.

代码示例(Python/NumPy)

import numpy as np

A = np.array([[1.,2.,3.],[0.,1.,4.],[5.,6.,0.]])
B = np.eye(3)
x = np.array([1.,2.,3.])

print("A+B=\n", A + B)
print("A@x=", A @ x)
print("A.T=\n", A.T)

# 不建议训练中频繁 inv,这里仅演示
A_inv = np.linalg.inv(A)
print("A_inv@A≈I=\n", A_inv @ A)

# 更推荐:解方程 Ax=b
b = np.array([1.,0.,1.])
sol = np.linalg.solve(A, b)
print('solve=', sol)

在 ML 中用在哪里?

  • 线性回归解析解:w^=(XX)1Xy\hat{\mathbf{w}}=(\mathbf{X}^\top\mathbf{X})^{-1}\mathbf{X}^\top\mathbf{y}(当可逆)。
  • 正规方程、最小二乘、卡尔曼滤波等大量出现 XX\mathbf{X}^\top\mathbf{X}

为什么需要?

  • 乘法是线性层的核心。
  • 理解转置与形状能避免维度错误。
  • 理解“解方程优于求逆”能避免数值灾难。

1.1.3 特殊矩阵:单位矩阵、对角矩阵、对称矩阵、正交矩阵

直觉/定义

特殊结构带来更强性质与更快算法:

  • 单位矩阵 I\mathbf{I}:保持向量不变。
  • 对角矩阵:仅对角线非零,乘法等价逐元素缩放。
  • 对称矩阵:A=A\mathbf{A}=\mathbf{A}^\top
  • 正交矩阵:QQ=I\mathbf{Q}^\top\mathbf{Q}=\mathbf{I},保持长度与角度。

核心公式(LaTeX)

正交保持长度: Qx22=(Qx)(Qx)=x(QQ)x=x22.\|\mathbf{Qx}\|_2^2=(\mathbf{Qx})^\top(\mathbf{Qx})=\mathbf{x}^\top(\mathbf{Q}^\top\mathbf{Q})\mathbf{x}=\|\mathbf{x}\|_2^2.

对称矩阵谱定理(提示): A=QΛQ.\mathbf{A}=\mathbf{Q}\mathbf{\Lambda}\mathbf{Q}^\top.

在 ML 中用在哪里?

  • PCA 的协方差矩阵对称半正定。
  • QR 分解中 Q\mathbf{Q} 是正交矩阵,用于最小二乘的稳定求解。

为什么需要?

  • 结构信息决定可用的数值方法(如 SPD 用 Cholesky 更快更稳)。
  • 正交变换常用于数值稳定与特征解耦。

线性变换示意

练习与思考(1.1 矩阵与向量基础)

建议:先手算,再用 NumPy 验证。每题写出「结果 + 一句话解释」。

  • 题 01:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 02:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 03:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 04:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 05:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 06:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 07:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 08:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 09:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 10:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 11:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 12:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 13:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 14:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 15:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 16:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 17:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 18:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 19:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 20:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 21:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 22:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 23:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 24:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 25:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 26:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 27:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 28:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 29:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 30:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 31:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 32:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 33:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 34:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 35:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 36:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 37:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 38:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 39:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 40:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 41:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 42:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 43:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 44:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 45:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 46:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 47:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 48:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 49:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 50:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 51:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 52:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 53:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 54:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 55:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 56:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 57:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 58:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 59:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 60:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 61:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 62:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 63:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 64:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 65:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 66:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 67:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 68:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 69:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 70:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 71:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 72:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 73:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 74:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 75:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 76:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 77:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 78:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 79:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 80:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:

1.2 向量空间与线性变换

1.2.1 向量空间、线性组合、线性无关

直觉/定义

向量空间是“可做线性运算”的集合。线性组合刻画张成(span),线性无关刻画是否冗余。

核心公式(LaTeX)

线性组合: x=i=1kaivi.\mathbf{x}=\sum_{i=1}^k a_i\mathbf{v}_i.

线性无关: i=1kaivi=0ai=0 (i).\sum_{i=1}^k a_i\mathbf{v}_i=\mathbf{0}\Rightarrow a_i=0\ (\forall i).

在 ML 中用在哪里?

  • 特征共线性会让回归解不稳。
  • 表示学习希望学到能张成数据变化的基向量。

为什么需要?

  • 冗余维度增加过拟合风险并恶化条件数。
要点速览(1.2.1)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:
  • 要点 41:
  • 要点 42:
  • 要点 43:
  • 要点 44:
  • 要点 45:
  • 要点 46:
  • 要点 47:
  • 要点 48:
  • 要点 49:
  • 要点 50:

1.2.2 基与维度、秩(rank)

直觉/定义

基是一组“最少且足够”的方向;秩是矩阵列空间维度,反映有效自由度。

核心公式(LaTeX)

rank(A)=dim(Col(A))=dim(Row(A)).\mathrm{rank}(\mathbf{A})=\dim(\mathrm{Col}(\mathbf{A}))=\dim(\mathrm{Row}(\mathbf{A})).

代码示例(Python/NumPy)

import numpy as np
A = np.array([[1.,2.,3.],[2.,4.,6.],[1.,0.,1.]])
print(np.linalg.matrix_rank(A))

在 ML 中用在哪里?

  • 推荐系统/矩阵补全中的低秩假设。
  • 线性回归满秩性决定解是否唯一。

为什么需要?

  • 判断可压缩性与可解性;决定是否需要正则化。
要点速览(1.2.2)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:
  • 要点 41:
  • 要点 42:
  • 要点 43:
  • 要点 44:
  • 要点 45:
  • 要点 46:
  • 要点 47:
  • 要点 48:
  • 要点 49:
  • 要点 50:

1.2.3 线性变换的几何意义(旋转/缩放/投影/剪切)

直觉/定义

线性变换保持过原点直线结构。旋转/缩放改变形状但保持线性结构;投影会降低维度。

核心公式(LaTeX)

线性: T(ax+by)=aT(x)+bT(y).T(a\mathbf{x}+b\mathbf{y})=aT(\mathbf{x})+bT(\mathbf{y}).

矩阵表示: T(x)=Ax.T(\mathbf{x})=\mathbf{A}\mathbf{x}.

在 ML 中用在哪里?

  • 线性层、特征变换、PCA 投影。

为什么需要?

  • 许多学习问题是寻找合适变换使数据可分或更易拟合。
要点速览(1.2.3)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:
  • 要点 41:
  • 要点 42:
  • 要点 43:
  • 要点 44:
  • 要点 45:
  • 要点 46:
  • 要点 47:
  • 要点 48:
  • 要点 49:
  • 要点 50:
  • 要点 51:
  • 要点 52:
  • 要点 53:
  • 要点 54:
  • 要点 55:
  • 要点 56:
  • 要点 57:
  • 要点 58:
  • 要点 59:
  • 要点 60:

1.2.4 在 ML 中的应用:特征空间、数据变换

直觉/定义

把样本看作空间点:分类=超平面分割;回归=拟合连续曲面;降维=投影到低维子空间。

核心公式(LaTeX)

线性回归: y^=wx+b.\hat{y}=\mathbf{w}^\top\mathbf{x}+b.

子空间投影(示意): z=U(xμ).\mathbf{z}=\mathbf{U}^\top(\mathbf{x}-\boldsymbol{\mu}).

在 ML 中用在哪里?

  • 标准化/白化改善优化。
  • PCA/ICA 等变换用于去噪与压缩。

为什么需要?

  • 好的表示能降低模型复杂度、提升可泛化性。
要点速览(1.2.4)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:
  • 要点 41:
  • 要点 42:
  • 要点 43:
  • 要点 44:
  • 要点 45:
  • 要点 46:
  • 要点 47:
  • 要点 48:
  • 要点 49:
  • 要点 50:
练习与思考(1.2 向量空间与线性变换)

建议:先手算,再用 NumPy 验证。每题写出「结果 + 一句话解释」。

  • 题 01:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 02:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 03:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 04:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 05:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 06:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 07:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 08:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 09:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 10:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 11:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 12:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 13:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 14:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 15:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 16:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 17:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 18:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 19:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 20:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 21:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 22:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 23:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 24:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 25:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 26:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 27:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 28:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 29:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 30:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 31:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 32:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 33:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 34:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 35:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 36:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 37:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 38:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 39:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 40:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 41:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 42:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 43:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 44:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 45:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 46:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 47:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 48:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 49:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 50:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 51:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 52:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 53:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 54:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 55:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 56:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 57:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 58:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 59:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 60:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 61:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 62:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 63:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 64:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 65:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 66:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 67:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 68:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 69:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 70:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 71:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 72:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 73:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 74:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 75:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 76:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 77:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 78:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 79:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 80:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:

1.3 特征值与特征向量

1.3.1 定义与几何直觉

直觉/定义

特征向量方向在变换下不变,只会按特征值缩放。

核心公式(LaTeX)

Av=λv, v0.\mathbf{A}\mathbf{v}=\lambda\mathbf{v},\ \mathbf{v}\ne\mathbf{0}.

1.3.1 定义与几何直觉

在 ML 中用在哪里?

  • PCA 主方向。
  • 谱聚类/图嵌入。

为什么需要?

  • 用少量方向概括变换的主要行为。
要点速览(1.3.1)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:
  • 要点 41:
  • 要点 42:
  • 要点 43:
  • 要点 44:
  • 要点 45:
  • 要点 46:
  • 要点 47:
  • 要点 48:
  • 要点 49:
  • 要点 50:

1.3.2 特征值分解(EVD)

直觉/定义

可对角化矩阵=在特征基上逐维缩放。对称矩阵可正交对角化更稳定。

核心公式(LaTeX)

A=VΛV1.\mathbf{A}=\mathbf{V}\mathbf{\Lambda}\mathbf{V}^{-1}. A=QΛQ (对称).\mathbf{A}=\mathbf{Q}\mathbf{\Lambda}\mathbf{Q}^\top\ (对称).

在 ML 中用在哪里?

  • 协方差矩阵分析;Hessian 曲率分析。

为什么需要?

  • 将矩阵问题化为标量问题(特征值)+方向问题(特征向量)。
要点速览(1.3.2)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:
  • 要点 41:
  • 要点 42:
  • 要点 43:
  • 要点 44:
  • 要点 45:
  • 要点 46:
  • 要点 47:
  • 要点 48:
  • 要点 49:
  • 要点 50:

1.3.3 在 PCA 中的核心作用

直觉/定义

PCA 等价于最大化 Rayleigh 商,因此主成分是最大特征值的特征向量。

核心公式(LaTeX)

maxu2=1 uΣu.\max_{\|\mathbf{u}\|_2=1}\ \mathbf{u}^\top\mathbf{\Sigma}\mathbf{u}. Σu=λu.\mathbf{\Sigma}\mathbf{u}=\lambda\mathbf{u}.

在 ML 中用在哪里?

  • 降维、去噪、可视化、加速训练。

为什么需要?

  • 把信息集中到少数维度,降低噪声与冗余。
要点速览(1.3.3)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:
  • 要点 41:
  • 要点 42:
  • 要点 43:
  • 要点 44:
  • 要点 45:
  • 要点 46:
  • 要点 47:
  • 要点 48:
  • 要点 49:
  • 要点 50:
  • 要点 51:
  • 要点 52:
  • 要点 53:
  • 要点 54:
  • 要点 55:
  • 要点 56:
  • 要点 57:
  • 要点 58:
  • 要点 59:
  • 要点 60:

1.3.4 NumPy 实现(EVD/PCA)

直觉/定义

对称矩阵用 eigh;排序后取前 k 个特征向量即主成分。

代码示例(Python/NumPy)

import numpy as np
N, d = 200, 2
np.random.seed(0)
X = np.random.randn(N, d) @ np.array([[2.,1.],[0.,0.5]]).T
Xc = X - X.mean(axis=0, keepdims=True)
Sigma = (Xc.T @ Xc) / N
vals, vecs = np.linalg.eigh(Sigma)
idx = np.argsort(vals)[::-1]
vals, vecs = vals[idx], vecs[:,idx]
U = vecs[:, :1]
Z = Xc @ U
print('top eigenvalue', vals[0])

在 ML 中用在哪里?

  • PCA 预处理;低维可视化;压缩。

为什么需要?

  • 把推导落到可运行代码;理解“矩阵→特征→投影”。
要点速览(1.3.4)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:
  • 要点 41:
  • 要点 42:
  • 要点 43:
  • 要点 44:
  • 要点 45:
  • 要点 46:
  • 要点 47:
  • 要点 48:
  • 要点 49:
  • 要点 50:
练习与思考(1.3 特征值与特征向量)

建议:先手算,再用 NumPy 验证。每题写出「结果 + 一句话解释」。

  • 题 01:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 02:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 03:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 04:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 05:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 06:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 07:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 08:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 09:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 10:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 11:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 12:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 13:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 14:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 15:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 16:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 17:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 18:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 19:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 20:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 21:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 22:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 23:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 24:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 25:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 26:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 27:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 28:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 29:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 30:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 31:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 32:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 33:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 34:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 35:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 36:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 37:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 38:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 39:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 40:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 41:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 42:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 43:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 44:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 45:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 46:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 47:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 48:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 49:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 50:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 51:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 52:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 53:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 54:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 55:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 56:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 57:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 58:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 59:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 60:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 61:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 62:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 63:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 64:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 65:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 66:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 67:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 68:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 69:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 70:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 71:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 72:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 73:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 74:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 75:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 76:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 77:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 78:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 79:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 80:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:

1.4 矩阵分解

1.4.1 SVD(奇异值分解)原理与应用

直觉/定义

SVD 将任意矩阵分解为两个正交变换与一次按轴缩放;奇异值大小提供“重要性排序”。

核心公式(LaTeX)

A=UΣV.\mathbf{A}=\mathbf{U}\mathbf{\Sigma}\mathbf{V}^\top. Ak=U:,1:kΣ1:k,1:kV:,1:k.\mathbf{A}_k=\mathbf{U}_{:,1:k}\mathbf{\Sigma}_{1:k,1:k}\mathbf{V}_{:,1:k}^\top.

1.4.1 SVD(奇异值分解)原理与应用

在 ML 中用在哪里?

  • 推荐系统矩阵分解。
  • 文本 LSA/LSI、压缩去噪、低秩近似。

为什么需要?

  • 在 Frobenius 范数下给出最佳低秩近似,是压缩与降维的核心工具。

SVD低秩近似误差

要点速览(1.4.1)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:
  • 要点 41:
  • 要点 42:
  • 要点 43:
  • 要点 44:
  • 要点 45:
  • 要点 46:
  • 要点 47:
  • 要点 48:
  • 要点 49:
  • 要点 50:
  • 要点 51:
  • 要点 52:
  • 要点 53:
  • 要点 54:
  • 要点 55:
  • 要点 56:
  • 要点 57:
  • 要点 58:
  • 要点 59:
  • 要点 60:

1.4.2 QR 分解

直觉/定义

QR 把矩阵拆成“正交基 + 上三角”,适合稳定求解最小二乘。

核心公式(LaTeX)

A=QR, QQ=I.\mathbf{A}=\mathbf{Q}\mathbf{R},\ \mathbf{Q}^\top\mathbf{Q}=\mathbf{I}.

在 ML 中用在哪里?

  • 最小二乘求解比正规方程更稳定。

为什么需要?

  • 避免平方条件数放大带来的数值不稳定。
要点速览(1.4.2)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:

1.4.3 Cholesky 分解

直觉/定义

对称正定矩阵可写成 A=LL\mathbf{A}=\mathbf{L}\mathbf{L}^\top,可高效求解线性系统与计算对数行列式。

核心公式(LaTeX)

A=LL, A0.\mathbf{A}=\mathbf{L}\mathbf{L}^\top,\ \mathbf{A}\succ 0.

在 ML 中用在哪里?

  • 高斯过程、贝叶斯线性回归、协方差矩阵运算。

为什么需要?

  • SPD 专用分解更快更稳;避免显式求逆。
要点速览(1.4.3)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:

1.4.4 推荐系统与数据压缩中的应用

直觉/定义

矩阵分解把交互/信号拆成少量潜因子;压缩保留主导奇异值即可保留主要结构。

核心公式(LaTeX)

RPQ.\mathbf{R}\approx\mathbf{P}\mathbf{Q}^\top.

在 ML 中用在哪里?

  • 协同过滤、矩阵补全、embedding 压缩、低秩微调。

为什么需要?

  • 用更少参数逼近原始数据,提升泛化并降低存储/算力。
要点速览(1.4.4)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:
练习与思考(1.4 矩阵分解)

建议:先手算,再用 NumPy 验证。每题写出「结果 + 一句话解释」。

  • 题 01:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 02:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 03:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 04:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 05:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 06:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 07:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 08:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 09:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 10:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 11:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 12:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 13:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 14:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 15:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 16:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 17:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 18:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 19:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 20:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 21:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 22:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 23:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 24:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 25:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 26:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 27:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 28:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 29:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 30:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 31:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 32:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 33:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 34:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 35:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 36:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 37:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 38:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 39:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 40:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 41:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 42:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 43:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 44:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 45:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 46:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 47:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 48:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 49:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 50:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 51:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 52:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 53:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 54:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 55:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 56:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 57:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 58:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 59:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 60:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 61:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 62:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 63:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 64:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 65:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 66:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 67:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 68:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 69:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 70:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 71:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 72:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 73:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 74:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 75:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 76:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 77:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 78:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 79:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 80:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:

1.5 范数与距离

1.5.1 L1/L2/Lp 范数

直觉/定义

范数定义“大小”;不同 p 产生不同几何形状(菱形/圆/方形),从而影响正则化解。

核心公式(LaTeX)

xp=(ixip)1/p.\|\mathbf{x}\|_p=\left(\sum_i |x_i|^p\right)^{1/p}.

在 ML 中用在哪里?

  • L1: 稀疏特征选择;L2: 平滑与 weight decay。

为什么需要?

  • 选择范数=选择归纳偏置(inductive bias)。
要点速览(1.5.1)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:
  • 要点 41:
  • 要点 42:
  • 要点 43:
  • 要点 44:
  • 要点 45:
  • 要点 46:
  • 要点 47:
  • 要点 48:
  • 要点 49:
  • 要点 50:

1.5.2 矩阵范数(Frobenius/谱范数)

直觉/定义

Frobenius 是元素平方和开方;谱范数是最大放大倍数(最大奇异值)。

核心公式(LaTeX)

AF=i,jAij2.\|\mathbf{A}\|_F=\sqrt{\sum_{i,j}A_{ij}^2}. A2=σmax(A).\|\mathbf{A}\|_2=\sigma_{\max}(\mathbf{A}).

在 ML 中用在哪里?

  • 稳定性分析、对抗鲁棒性、谱归一化。

为什么需要?

  • 量化线性层放大程度,理解梯度爆炸/消失。
要点速览(1.5.2)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:

1.5.3 余弦相似度

直觉/定义

余弦相似度关注夹角,适合比较 embedding 的语义方向。

核心公式(LaTeX)

cos(x,y)=xyx2y2.\mathrm{cos}(\mathbf{x},\mathbf{y})=\frac{\mathbf{x}^\top\mathbf{y}}{\|\mathbf{x}\|_2\|\mathbf{y}\|_2}.

在 ML 中用在哪里?

  • 向量检索、推荐、对比学习。

为什么需要?

  • 对长度不敏感,在高维语义空间更稳健。
要点速览(1.5.3)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:

1.5.4 范数在正则化与损失函数中的应用

直觉/定义

正则化=给参数加约束或惩罚;范数是最常用的惩罚形式。

核心公式(LaTeX)

\min_\mathbf{w}\ rac{1}{N}\sum_i\ell_i + \lambda\|\mathbf{w}\|_2^2.

在 ML 中用在哪里?

  • weight decay、稀疏化、对抗训练(约束扰动范数)。

为什么需要?

  • 控制复杂度,提升泛化,改善数值稳定性。
要点速览(1.5.4)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:
练习与思考(1.5 范数与距离)

建议:先手算,再用 NumPy 验证。每题写出「结果 + 一句话解释」。

  • 题 01:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 02:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 03:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 04:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 05:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 06:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 07:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 08:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 09:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 10:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 11:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 12:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 13:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 14:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 15:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 16:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 17:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 18:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 19:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 20:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 21:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 22:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 23:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 24:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 25:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 26:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 27:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 28:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 29:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 30:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 31:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 32:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 33:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 34:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 35:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 36:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 37:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 38:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 39:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 40:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 41:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 42:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 43:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 44:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 45:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 46:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 47:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 48:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 49:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 50:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 51:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 52:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 53:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 54:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 55:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 56:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 57:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 58:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 59:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 60:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 61:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 62:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 63:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 64:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 65:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 66:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 67:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 68:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 69:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 70:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 71:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 72:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 73:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 74:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 75:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 76:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 77:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 78:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 79:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 80:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:

2. 微积分与优化(扩展为完整章节)

优化的核心问题:给定损失 L(θ)\mathcal{L}(\theta),如何高效找到使其尽可能小的参数 θ\theta

2.1 导数与梯度

2.1.1 导数的直觉与定义

直觉/定义

导数是局部线性近似的斜率,描述函数对输入的敏感度。

核心公式(LaTeX)

f(x)=limh0f(x+h)f(x)h.f^{\prime}(x)=\lim_{h\to 0}\frac{f(x+h)-f(x)}{h}.

在 ML 中用在哪里?

  • 损失函数对参数的导数决定更新方向。

为什么需要?

  • 训练就是迭代下降;导数提供可计算的“下降信息”。
要点速览(2.1.1)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:

2.1.2 偏导数与梯度

直觉/定义

多元函数对每个变量都有偏导;梯度把所有偏导组成向量,是最陡上升方向。

核心公式(LaTeX)

f(x)=[f/x1f/xd].\nabla f(\mathbf{x})=\begin{bmatrix}\partial f/\partial x_1\\\vdots\\\partial f/\partial x_d\end{bmatrix}.

在 ML 中用在哪里?

  • 反向传播计算的就是对所有参数的梯度。

为什么需要?

  • 参数维度巨大,梯度是唯一可扩展的优化信号。
要点速览(2.1.2)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:

2.1.3 方向导数

直觉/定义

沿某单位方向的变化率,是梯度与方向的内积。

核心公式(LaTeX)

Duf(x)=f(x)u.D_{\mathbf{u}}f(\mathbf{x})=\nabla f(\mathbf{x})^\top\mathbf{u}.

在 ML 中用在哪里?

  • 线搜索;对抗扰动。

为什么需要?

  • 把多维问题简化为沿某方向的一维分析。
要点速览(2.1.3)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:

2.1.4 链式法则(含多变量)

直觉/定义

复合函数求导要“逐层相乘/相传播”。神经网络训练本质就是链式法则。

核心公式(LaTeX)

一元:ddxf(g(x))=f(g(x))g(x).\frac{d}{dx}f(g(x))=f^{\prime}(g(x))g^{\prime}(x). 多元:xz=Jg(x)yz.\nabla_{\mathbf{x}} z=\mathbf{J}_g(\mathbf{x})^\top\nabla_{\mathbf{y}} z.

在 ML 中用在哪里?

  • 反向传播与自动微分。

为什么需要?

  • 深度模型是大量算子复合,不用链式法则无法高效训练。
要点速览(2.1.4)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:
  • 要点 41:
  • 要点 42:
  • 要点 43:
  • 要点 44:
  • 要点 45:
  • 要点 46:
  • 要点 47:
  • 要点 48:
  • 要点 49:
  • 要点 50:

2.1.5 自动微分 vs 数值微分 vs 符号微分

直觉/定义

数值:近似;符号:代数;自动微分:计算图精确传播。深度学习用反向模式自动微分最合适。

数据表/对照表

方法思想优点缺点典型用途
数值差分简单误差/慢梯度检查
符号代数推导精确表达式膨胀小规模推导
自动计算图准确高效依赖框架训练主流

在 ML 中用在哪里?

  • 开发自定义层/损失时做梯度检查。

为什么需要?

  • 理解自动微分机制有助于 debug 梯度爆炸/消失与数值问题。
要点速览(2.1.5)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:
练习与思考(2.1 导数与梯度)

建议:先手算,再用 NumPy 验证。每题写出「结果 + 一句话解释」。

  • 题 01:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 02:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 03:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 04:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 05:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 06:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 07:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 08:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 09:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 10:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 11:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 12:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 13:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 14:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 15:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 16:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 17:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 18:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 19:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 20:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 21:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 22:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 23:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 24:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 25:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 26:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 27:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 28:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 29:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 30:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 31:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 32:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 33:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 34:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 35:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 36:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 37:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 38:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 39:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 40:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 41:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 42:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 43:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 44:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 45:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 46:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 47:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 48:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 49:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 50:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 51:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 52:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 53:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 54:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 55:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 56:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 57:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 58:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 59:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 60:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 61:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 62:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 63:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 64:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 65:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 66:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 67:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 68:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 69:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 70:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 71:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 72:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 73:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 74:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 75:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 76:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 77:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 78:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 79:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 80:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:

2.2 梯度下降深入

2.2.1 从一维到多维的梯度下降

直觉/定义

每次沿负梯度走一步:Δw=ηf\Delta\mathbf{w}=-\eta\nabla f

核心公式(LaTeX)

wt+1=wtηf(wt).\mathbf{w}_{t+1}=\mathbf{w}_t-\eta\nabla f(\mathbf{w}_t).

2.2.1 从一维到多维的梯度下降

在 ML 中用在哪里?

  • 训练线性模型与神经网络的基础算法框架。

为什么需要?

  • 大规模问题几乎只能依赖迭代一阶方法。
要点速览(2.2.1)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:

2.2.2 学习率选择与收敛性直觉

直觉/定义

学习率决定步幅:过大发散,过小太慢;与损失曲率(Lipschitz 常数)相关。

核心公式(LaTeX)

L-光滑:f(x)f(y)Lxy.\|\nabla f(\mathbf{x})-\nabla f(\mathbf{y})\|\le L\|\mathbf{x}-\mathbf{y}\|.

在 ML 中用在哪里?

  • 学习率调度是深度训练成功关键。

为什么需要?

  • 直接决定训练能否收敛与收敛速度。
要点速览(2.2.2)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:
  • 要点 41:
  • 要点 42:
  • 要点 43:
  • 要点 44:
  • 要点 45:

2.2.3 变体:SGD、Mini-batch、动量法

直觉/定义

用小批量估计梯度降低单步计算量;动量累计方向减少震荡。

核心公式(LaTeX)

动量:vt+1=βvt+f(wt), wt+1=wtηvt+1.\mathbf{v}_{t+1}=\beta\mathbf{v}_t+\nabla f(\mathbf{w}_t),\ \mathbf{w}_{t+1}=\mathbf{w}_t-\eta\mathbf{v}_{t+1}.

在 ML 中用在哪里?

  • SGD+Momentum、Adam 等优化器。

为什么需要?

  • 提升稳定性与收敛速度,适应噪声梯度。
要点速览(2.2.3)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:
  • 要点 41:
  • 要点 42:
  • 要点 43:
  • 要点 44:
  • 要点 45:

2.2.4 NumPy 实现并可视化下降过程

直觉/定义

在可视化的二次函数上实现 GD,能直观看到轨迹与等高线关系。

在 ML 中用在哪里?

  • 对训练循环与调参建立直觉。

为什么需要?

  • 强化对“曲率×步长”的理解。
要点速览(2.2.4)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
练习与思考(2.2 梯度下降深入)

建议:先手算,再用 NumPy 验证。每题写出「结果 + 一句话解释」。

  • 题 01:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 02:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 03:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 04:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 05:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 06:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 07:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 08:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 09:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 10:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 11:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 12:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 13:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 14:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 15:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 16:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 17:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 18:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 19:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 20:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 21:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 22:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 23:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 24:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 25:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 26:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 27:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 28:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 29:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 30:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 31:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 32:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 33:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 34:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 35:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 36:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 37:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 38:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 39:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 40:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 41:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 42:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 43:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 44:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 45:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 46:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 47:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 48:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 49:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 50:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 51:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 52:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 53:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 54:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 55:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 56:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 57:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 58:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 59:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 60:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 61:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 62:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 63:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 64:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 65:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 66:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 67:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 68:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 69:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 70:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 71:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 72:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 73:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 74:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 75:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 76:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 77:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 78:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 79:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 80:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:

2.3 凸优化基础

2.3.1 凸函数与凸集

直觉/定义

凸优化的好处:局部最优=全局最优,理论与算法都更可靠。

核心公式(LaTeX)

f(θx+(1θ)y)θf(x)+(1θ)f(y).f(\theta\mathbf{x}+(1-\theta)\mathbf{y})\le\theta f(\mathbf{x})+(1-\theta)f(\mathbf{y}).

在 ML 中用在哪里?

  • 逻辑回归、SVM、Lasso/Ridge 等大量经典模型。

为什么需要?

  • 给出收敛与最优性保证,是理解经典 ML 的基础。
要点速览(2.3.1)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:

2.3.2 全局最优 vs 局部最优

直觉/定义

凸:任意局部极小即全局极小;非凸:可能多个局部极小与鞍点。

在 ML 中用在哪里?

  • 理解深度学习为何非凸仍可训练。

为什么需要?

  • 形成正确的“收敛目标”预期与诊断方法。
要点速览(2.3.2)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:

2.3.3 拉格朗日乘子法

直觉/定义

把约束通过乘子融入目标,求解驻点条件。

核心公式(LaTeX)

L(x,λ)=f(x)+λg(x).\mathcal{L}(\mathbf{x},\lambda)=f(\mathbf{x})+\lambda g(\mathbf{x}).

在 ML 中用在哪里?

  • PCA/SVM 推导;最大熵模型等。

为什么需要?

  • 连接原问题与对偶问题的桥梁。
要点速览(2.3.3)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:

2.3.4 KKT 条件

直觉/定义

KKT 给出带不等式约束问题的最优性条件,包含互补松弛。

核心公式(LaTeX)

互补松弛:λigi(x)=0.\lambda_i g_i(\mathbf{x})=0.

在 ML 中用在哪里?

  • SVM 的支持向量机制解释。

为什么需要?

  • 理解对偶、稀疏性与约束学习结构。
要点速览(2.3.4)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:

2.3.5 在 SVM 和正则化中的应用

直觉/定义

SVM 用最大间隔增强泛化,软间隔通过松弛变量处理噪声。

核心公式(LaTeX)

min12w22+Ciξis.t.yi(wxi+b)1ξi, ξi0.\min \frac{1}{2}\|\mathbf{w}\|_2^2 + C\sum_i \xi_i \quad \text{s.t.}\quad y_i(\mathbf{w}^\top\mathbf{x}_i+b)\ge 1-\xi_i,\ \xi_i\ge 0.

在 ML 中用在哪里?

  • 经典分类器;核技巧扩展非线性。

为什么需要?

  • 把“几何直觉”落到“可求解的凸优化”。
要点速览(2.3.5)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
练习与思考(2.3 凸优化基础)

建议:先手算,再用 NumPy 验证。每题写出「结果 + 一句话解释」。

  • 题 01:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 02:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 03:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 04:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 05:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 06:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 07:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 08:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 09:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 10:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 11:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 12:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 13:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 14:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 15:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 16:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 17:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 18:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 19:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 20:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 21:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 22:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 23:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 24:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 25:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 26:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 27:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 28:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 29:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 30:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 31:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 32:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 33:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 34:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 35:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 36:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 37:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 38:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 39:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 40:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 41:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 42:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 43:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 44:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 45:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 46:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 47:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 48:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 49:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 50:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 51:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 52:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 53:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 54:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 55:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 56:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 57:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 58:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 59:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 60:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 61:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 62:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 63:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 64:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 65:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 66:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 67:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 68:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 69:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 70:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 71:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 72:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 73:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 74:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 75:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 76:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 77:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 78:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 79:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 80:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:

2.4 泰勒展开与近似

2.4.1 一阶与二阶泰勒展开

直觉/定义

泰勒展开提供局部近似:一阶切线,二阶考虑曲率。

核心公式(LaTeX)

f(x)f(x0)+f(x0)(xx0)+12f(x0)(xx0)2.f(x)\approx f(x_0)+f^{\prime}(x_0)(x-x_0)+\frac{1}{2}f^{\prime\prime}(x_0)(x-x_0)^2.

在 ML 中用在哪里?

  • 二阶方法与损失面局部分析。

为什么需要?

  • 解释“为什么梯度下降在某些区域慢/震荡”:因为曲率差异大。
要点速览(2.4.1)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:

2.4.2 牛顿法与拟牛顿法

直觉/定义

牛顿法用 Hessian 修正方向与尺度;拟牛顿用近似降低代价。

核心公式(LaTeX)

wt+1=wtH1f.\mathbf{w}_{t+1}=\mathbf{w}_t-\mathbf{H}^{-1}\nabla f.

在 ML 中用在哪里?

  • 传统凸模型优化;部分深度二阶近似。

为什么需要?

  • 让你理解预条件、自然梯度等思想来源。
要点速览(2.4.2)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:

2.4.3 Hessian 矩阵

直觉/定义

Hessian 描述曲率;特征值正负决定局部极小/鞍点。

核心公式(LaTeX)

H=2f.\mathbf{H}=\nabla^2 f.

在 ML 中用在哪里?

  • 曲率分析、二阶优化、泛化研究(flat minima)。

为什么需要?

  • 解释训练不稳、学习率敏感与曲率相关。
要点速览(2.4.3)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:
  • 要点 41:
  • 要点 42:
  • 要点 43:
  • 要点 44:
  • 要点 45:

2.4.4 在深度学习二阶优化器中的应用

直觉/定义

现实用结构化近似 Hessian(块对角/克罗内克等)以平衡成本。

在 ML 中用在哪里?

  • K-FAC、Shampoo、AdaHessian 等。

为什么需要?

  • 帮你读懂优化器论文与实现。
要点速览(2.4.4)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
练习与思考(2.4 泰勒展开与近似)

建议:先手算,再用 NumPy 验证。每题写出「结果 + 一句话解释」。

  • 题 01:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 02:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 03:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 04:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 05:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 06:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 07:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 08:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 09:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 10:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 11:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 12:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 13:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 14:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 15:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 16:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 17:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 18:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 19:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 20:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 21:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 22:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 23:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 24:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 25:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 26:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 27:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 28:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 29:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 30:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 31:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 32:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 33:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 34:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 35:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 36:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 37:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 38:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 39:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 40:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 41:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 42:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 43:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 44:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 45:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 46:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 47:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 48:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 49:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 50:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 51:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 52:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 53:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 54:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 55:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 56:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 57:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 58:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 59:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 60:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 61:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 62:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 63:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 64:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 65:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 66:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 67:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 68:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 69:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 70:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 71:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 72:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 73:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 74:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 75:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 76:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 77:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 78:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 79:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 80:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:

3. 概率与统计(扩展为完整章节)

概率统计在 ML 中的典型角色:

  • 用概率分布建模数据生成过程(生成式)。
  • 用似然/后验定义训练目标(MLE/MAP/贝叶斯)。
  • 用统计推断理解“有限样本下的不确定性”。

3.1 概率基础

3.1.1 概率公理与事件

直觉/定义

事件是样本空间的子集;概率满足非负、归一、可列可加(互斥)。

核心公式(LaTeX)

P(A)0, P(Ω)=1, P(iAi)=iP(Ai) (互斥).P(A)\ge 0,\ P(\Omega)=1,\ P(\cup_i A_i)=\sum_i P(A_i)\ (互斥).

在 ML 中用在哪里?

  • 分类概率输出、生成模型的联合/条件分布。

为什么需要?

  • 让“概率”具有可推导、可验证的数学基础。
要点速览(3.1.1)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:

3.1.2 条件概率与贝叶斯定理(含推导)

直觉/定义

条件概率把信息 B 纳入:贝叶斯让我们用容易得到的 P(BA)P(B|A) 推出 P(AB)P(A|B)

核心公式(LaTeX)

P(A|B)= rac{P(A\cap B)}{P(B)}. P(A|B)= rac{P(B|A)P(A)}{P(B)}.

在 ML 中用在哪里?

  • 朴素贝叶斯、贝叶斯推断、校准与不确定性。

为什么需要?

  • 将“先验知识 + 数据证据”统一为后验。
要点速览(3.1.2)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:
  • 要点 41:
  • 要点 42:
  • 要点 43:
  • 要点 44:
  • 要点 45:

3.1.3 全概率公式

直觉/定义

用一组互斥完备事件对概率进行分解与求和。

核心公式(LaTeX)

P(A)=iP(ABi)P(Bi).P(A)=\sum_i P(A|B_i)P(B_i).

在 ML 中用在哪里?

  • 混合模型边缘化隐变量:P(x)=zP(xz)P(z)P(x)=\sum_z P(x|z)P(z)

为什么需要?

  • 理解“边缘化/证据”与生成模型计算。
要点速览(3.1.3)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:

3.1.4 独立性与条件独立性

直觉/定义

独立:互不影响;条件独立:给定某信息后互不影响。图模型用条件独立因子分解联合分布。

核心公式(LaTeX)

独立:P(AB)=P(A)P(B).P(A\cap B)=P(A)P(B). 条件独立:P(ABC)=P(AC)P(BC).P(A\cap B|C)=P(A|C)P(B|C).

在 ML 中用在哪里?

  • 朴素贝叶斯的条件独立假设。
  • 贝叶斯网络/马尔可夫随机场。

为什么需要?

  • 让复杂分布可分解,推断更可行。
要点速览(3.1.4)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:
练习与思考(3.1 概率基础)

建议:先手算,再用 NumPy 验证。每题写出「结果 + 一句话解释」。

  • 题 01:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 02:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 03:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 04:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 05:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 06:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 07:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 08:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 09:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 10:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 11:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 12:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 13:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 14:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 15:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 16:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 17:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 18:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 19:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 20:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 21:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 22:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 23:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 24:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 25:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 26:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 27:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 28:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 29:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 30:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 31:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 32:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 33:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 34:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 35:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 36:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 37:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 38:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 39:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 40:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 41:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 42:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 43:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 44:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 45:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 46:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 47:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 48:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 49:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 50:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 51:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 52:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 53:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 54:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 55:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 56:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 57:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 58:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 59:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 60:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 61:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 62:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 63:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 64:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 65:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 66:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 67:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 68:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 69:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 70:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 71:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 72:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 73:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 74:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 75:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 76:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 77:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 78:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 79:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:
  • 题 80:

    • 问题:
    • 关键公式:
    • NumPy 验证:
    • 在 ML 中的对应场景:

3.2 随机变量与分布

3.2.1 随机变量、分布、CDF

直觉/定义

随机变量把随机结果映射成数;分布描述其概率规律;CDF 描述累计概率。

核心公式(LaTeX)

F(x)=P(Xx).F(x)=P(X\le x).

在 ML 中用在哪里?

  • 似然函数来自分布假设;分类/回归可视作条件分布建模。

为什么需要?

  • 选择分布 = 选择噪声模型与损失函数形式。
要点速览(3.2.1)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:

3.2.2 常见分布(离散/连续)

分布类型典型用途(ML)
伯努利/二项离散二分类标签、A/B 测试计数
泊松离散事件计数、点击/到达建模
均匀连续初始化、随机采样
正态连续噪声建模、CLT、先验
指数连续等待时间、生存分析
Beta/Gamma连续概率/率参数的先验(贝叶斯)

常见连续分布PDF

要点速览(3.2.2)
  • 要点 01:
  • 要点 02:
  • 要点 03:
  • 要点 04:
  • 要点 05:
  • 要点 06:
  • 要点 07:
  • 要点 08:
  • 要点 09:
  • 要点 10:
  • 要点 11:
  • 要点 12:
  • 要点 13:
  • 要点 14:
  • 要点 15:
  • 要点 16:
  • 要点 17:
  • 要点 18:
  • 要点 19:
  • 要点 20:
  • 要点 21:
  • 要点 22:
  • 要点 23:
  • 要点 24:
  • 要点 25:
  • 要点 26:
  • 要点 27:
  • 要点 28:
  • 要点 29:
  • 要点 30:
  • 要点 31:
  • 要点 32:
  • 要点 33:
  • 要点 34:
  • 要点 35:
  • 要点 36:
  • 要点 37:
  • 要点 38:
  • 要点 39:
  • 要点 40:

3.2.3 期望、方差、协方差、相关系数

直觉/定义

期望=平均;方差=波动;协方差=共同变化;相关=归一化协方差。

核心公式(LaTeX)

E[X]=xxp(x) ext或 xf(x)dx.\mathbb{E}[X]=\sum_x xp(x)\ ext{或}\ \int x f(x)dx. Var(X)=E[(XEX)2].\mathrm{Var}(X)=\mathbb{E}[(X-\mathbb{E}X)^2].

ho_{XY}= rac{\mathrm{Cov}(X,Y)}{\sigma_X\sigma_Y}. $$ **在 ML 中用在哪里?** - 协方差矩阵用于 PCA;相关用于特征选择与诊断。 **为什么需要?** - 量化噪声与不确定性,是估计与泛化分析的基础。 ##### 要点速览(3.2.3) - 要点 01: - 要点 02: - 要点 03: - 要点 04: - 要点 05: - 要点 06: - 要点 07: - 要点 08: - 要点 09: - 要点 10: - 要点 11: - 要点 12: - 要点 13: - 要点 14: - 要点 15: - 要点 16: - 要点 17: - 要点 18: - 要点 19: - 要点 20: - 要点 21: - 要点 22: - 要点 23: - 要点 24: - 要点 25: - 要点 26: - 要点 27: - 要点 28: - 要点 29: - 要点 30: - 要点 31: - 要点 32: - 要点 33: - 要点 34: - 要点 35: - 要点 36: - 要点 37: - 要点 38: - 要点 39: - 要点 40: - 要点 41: - 要点 42: - 要点 43: - 要点 44: - 要点 45: #### 3.2.4 NumPy/SciPy 可视化分布(模板) **直觉/定义** 通过画 PDF/直方图建立直觉:参数改变如何影响峰值、尾部与不确定性。 **在 ML 中用在哪里?** - 选择噪声模型、检查残差分布、做模拟实验。 **为什么需要?** - 直觉来自可视化;能更快发现分布假设不合理。 ##### 要点速览(3.2.4) - 要点 01: - 要点 02: - 要点 03: - 要点 04: - 要点 05: - 要点 06: - 要点 07: - 要点 08: - 要点 09: - 要点 10: - 要点 11: - 要点 12: - 要点 13: - 要点 14: - 要点 15: - 要点 16: - 要点 17: - 要点 18: - 要点 19: - 要点 20: - 要点 21: - 要点 22: - 要点 23: - 要点 24: - 要点 25: - 要点 26: - 要点 27: - 要点 28: - 要点 29: - 要点 30: ##### 练习与思考(3.2 随机变量与分布) > 建议:先手算,再用 NumPy 验证。每题写出「结果 + 一句话解释」。 - 题 01: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 02: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 03: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 04: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 05: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 06: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 07: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 08: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 09: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 10: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 11: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 12: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 13: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 14: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 15: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 16: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 17: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 18: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 19: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 20: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 21: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 22: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 23: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 24: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 25: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 26: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 27: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 28: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 29: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 30: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 31: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 32: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 33: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 34: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 35: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 36: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 37: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 38: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 39: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 40: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 41: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 42: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 43: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 44: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 45: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 46: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 47: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 48: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 49: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 50: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 51: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 52: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 53: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 54: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 55: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 56: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 57: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 58: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 59: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 60: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 61: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 62: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 63: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 64: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 65: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 66: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 67: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 68: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 69: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 70: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 71: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 72: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 73: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 74: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 75: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 76: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 77: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 78: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 79: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 80: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: ### 3.3 极限定理 #### 3.3.1 大数定律 **直觉/定义** 样本均值随样本数增大收敛到期望。 **核心公式(LaTeX)** $$\bar{X}_n\xrightarrow{p}\mu. $$ **在 ML 中用在哪里?** - 经验风险(样本平均)近似期望风险。 **为什么需要?** - 解释“更多数据”通常带来更稳定估计。 ##### 要点速览(3.3.1) - 要点 01: - 要点 02: - 要点 03: - 要点 04: - 要点 05: - 要点 06: - 要点 07: - 要点 08: - 要点 09: - 要点 10: - 要点 11: - 要点 12: - 要点 13: - 要点 14: - 要点 15: - 要点 16: - 要点 17: - 要点 18: - 要点 19: - 要点 20: - 要点 21: - 要点 22: - 要点 23: - 要点 24: - 要点 25: - 要点 26: - 要点 27: - 要点 28: - 要点 29: - 要点 30: #### 3.3.2 中心极限定理(详细解释+模拟) **直觉/定义** 许多统计量近似正态来自 CLT:不依赖原分布形状(在一定条件下)。 **核心公式(LaTeX)** $$ rac{\sqrt{n}(ar{X}_n-\mu)}{\sigma}\Rightarrow \mathcal{N}(0,1). $$ ![3.3.2 中心极限定理(详细解释+模拟)](/sec02_06_clt_simulation.png) **在 ML 中用在哪里?** - 置信区间、假设检验、采样理论。 **为什么需要?** - 给出“正态近似”的理论根基,支撑大量推断工具。 ##### 要点速览(3.3.2) - 要点 01: - 要点 02: - 要点 03: - 要点 04: - 要点 05: - 要点 06: - 要点 07: - 要点 08: - 要点 09: - 要点 10: - 要点 11: - 要点 12: - 要点 13: - 要点 14: - 要点 15: - 要点 16: - 要点 17: - 要点 18: - 要点 19: - 要点 20: - 要点 21: - 要点 22: - 要点 23: - 要点 24: - 要点 25: - 要点 26: - 要点 27: - 要点 28: - 要点 29: - 要点 30: - 要点 31: - 要点 32: - 要点 33: - 要点 34: - 要点 35: - 要点 36: - 要点 37: - 要点 38: - 要点 39: - 要点 40: - 要点 41: - 要点 42: - 要点 43: - 要点 44: - 要点 45: - 要点 46: - 要点 47: - 要点 48: - 要点 49: - 要点 50: #### 3.3.3 在统计推断和采样中的意义 **直觉/定义** CLT 让我们把复杂分布的样本均值当作近似正态,从而构造置信区间与检验。 **在 ML 中用在哪里?** - 离线评估指标的置信区间;bootstrap/蒙特卡洛近似。 **为什么需要?** - 让“有限样本”的不确定性可计算。 ##### 要点速览(3.3.3) - 要点 01: - 要点 02: - 要点 03: - 要点 04: - 要点 05: - 要点 06: - 要点 07: - 要点 08: - 要点 09: - 要点 10: - 要点 11: - 要点 12: - 要点 13: - 要点 14: - 要点 15: - 要点 16: - 要点 17: - 要点 18: - 要点 19: - 要点 20: - 要点 21: - 要点 22: - 要点 23: - 要点 24: - 要点 25: - 要点 26: - 要点 27: - 要点 28: - 要点 29: - 要点 30: - 要点 31: - 要点 32: - 要点 33: - 要点 34: - 要点 35: ##### 练习与思考(3.3 极限定理) > 建议:先手算,再用 NumPy 验证。每题写出「结果 + 一句话解释」。 - 题 01: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 02: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 03: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 04: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 05: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 06: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 07: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 08: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 09: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 10: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 11: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 12: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 13: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 14: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 15: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 16: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 17: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 18: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 19: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 20: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 21: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 22: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 23: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 24: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 25: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 26: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 27: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 28: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 29: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 30: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 31: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 32: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 33: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 34: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 35: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 36: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 37: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 38: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 39: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 40: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 41: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 42: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 43: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 44: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 45: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 46: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 47: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 48: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 49: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 50: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 51: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 52: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 53: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 54: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 55: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 56: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 57: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 58: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 59: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 60: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 61: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 62: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 63: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 64: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 65: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 66: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 67: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 68: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 69: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 70: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 71: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 72: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 73: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 74: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 75: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 76: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 77: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 78: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 79: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 80: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: ### 3.4 统计推断 #### 3.4.1 最大似然估计(MLE) **直觉/定义** 选择参数使观测数据出现的概率最大。常把乘积取对数变成求和。 **核心公式(LaTeX)** $$\hat{ heta}_{\mathrm{MLE}}=rg\max_ heta\ \prod_{i=1}^N p(x_i| heta). $$ $$=rg\max_ heta\ \sum_{i=1}^N \log p(x_i| heta). $$ **在 ML 中用在哪里?** - 逻辑回归/softmax 训练等价于最大化条件似然。 **为什么需要?** - 把学习问题转化为可优化的目标函数(对数似然)。 ##### 要点速览(3.4.1) - 要点 01: - 要点 02: - 要点 03: - 要点 04: - 要点 05: - 要点 06: - 要点 07: - 要点 08: - 要点 09: - 要点 10: - 要点 11: - 要点 12: - 要点 13: - 要点 14: - 要点 15: - 要点 16: - 要点 17: - 要点 18: - 要点 19: - 要点 20: - 要点 21: - 要点 22: - 要点 23: - 要点 24: - 要点 25: - 要点 26: - 要点 27: - 要点 28: - 要点 29: - 要点 30: - 要点 31: - 要点 32: - 要点 33: - 要点 34: - 要点 35: - 要点 36: - 要点 37: - 要点 38: - 要点 39: - 要点 40: #### 3.4.2 最大后验估计(MAP) **直觉/定义** 在 MLE 上加入先验:后验最大化。等价于在损失上加正则项(很多情形)。 **核心公式(LaTeX)** $$\hat{ heta}_{\mathrm{MAP}}=rg\max_ heta\ \log p(\mathcal{D}| heta)+\log p( heta). $$ **在 ML 中用在哪里?** - L2 正则≈高斯先验;L1 正则≈拉普拉斯先验(直觉)。 **为什么需要?** - 小样本时先验提供稳定性与归纳偏置。 ##### 要点速览(3.4.2) - 要点 01: - 要点 02: - 要点 03: - 要点 04: - 要点 05: - 要点 06: - 要点 07: - 要点 08: - 要点 09: - 要点 10: - 要点 11: - 要点 12: - 要点 13: - 要点 14: - 要点 15: - 要点 16: - 要点 17: - 要点 18: - 要点 19: - 要点 20: - 要点 21: - 要点 22: - 要点 23: - 要点 24: - 要点 25: - 要点 26: - 要点 27: - 要点 28: - 要点 29: - 要点 30: - 要点 31: - 要点 32: - 要点 33: - 要点 34: - 要点 35: - 要点 36: - 要点 37: - 要点 38: - 要点 39: - 要点 40: #### 3.4.3 贝叶斯估计(后验分布而非点估计) **直觉/定义** 贝叶斯方法输出参数的分布,反映不确定性;预测时对参数积分(边缘化)。 **核心公式(LaTeX)** 预测分布:$$p(y|x,\mathcal{D})=\int p(y|x, heta)p( heta|\mathcal{D})\,d heta. $$ **在 ML 中用在哪里?** - 贝叶斯优化、不确定性估计、变分推断。 **为什么需要?** - 在风险敏感决策与小数据场景更可靠。 ##### 要点速览(3.4.3) - 要点 01: - 要点 02: - 要点 03: - 要点 04: - 要点 05: - 要点 06: - 要点 07: - 要点 08: - 要点 09: - 要点 10: - 要点 11: - 要点 12: - 要点 13: - 要点 14: - 要点 15: - 要点 16: - 要点 17: - 要点 18: - 要点 19: - 要点 20: - 要点 21: - 要点 22: - 要点 23: - 要点 24: - 要点 25: - 要点 26: - 要点 27: - 要点 28: - 要点 29: - 要点 30: - 要点 31: - 要点 32: - 要点 33: - 要点 34: - 要点 35: - 要点 36: - 要点 37: - 要点 38: - 要点 39: - 要点 40: - 要点 41: - 要点 42: - 要点 43: - 要点 44: - 要点 45: #### 3.4.4 假设检验基础 **直觉/定义** 给定零假设 $H_0$ 与备择 $H_1$,用统计量与 p-value 判断数据是否与 $H_0$ 相容。 **核心公式(LaTeX)** p-value(直觉):$$p= P( ext{在 }H_0 ext{ 下,统计量至少同样极端}). $$ **在 ML 中用在哪里?** - A/B 测试;模型改动是否显著提升。 **为什么需要?** - 防止把随机波动误当成真实提升(控制假阳性)。 ##### 要点速览(3.4.4) - 要点 01: - 要点 02: - 要点 03: - 要点 04: - 要点 05: - 要点 06: - 要点 07: - 要点 08: - 要点 09: - 要点 10: - 要点 11: - 要点 12: - 要点 13: - 要点 14: - 要点 15: - 要点 16: - 要点 17: - 要点 18: - 要点 19: - 要点 20: - 要点 21: - 要点 22: - 要点 23: - 要点 24: - 要点 25: - 要点 26: - 要点 27: - 要点 28: - 要点 29: - 要点 30: - 要点 31: - 要点 32: - 要点 33: - 要点 34: - 要点 35: #### 3.4.5 统计推断在机器学习训练中的应用 **直觉/定义** 训练=估计参数;验证=估计泛化误差;推断工具帮我们理解估计偏差与不确定性。 **在 ML 中用在哪里?** - 交叉验证、置信区间、误差条、模型对比。 **为什么需要?** - 更可靠地做实验与结论,避免“过拟合到验证集”。 ##### 要点速览(3.4.5) - 要点 01: - 要点 02: - 要点 03: - 要点 04: - 要点 05: - 要点 06: - 要点 07: - 要点 08: - 要点 09: - 要点 10: - 要点 11: - 要点 12: - 要点 13: - 要点 14: - 要点 15: - 要点 16: - 要点 17: - 要点 18: - 要点 19: - 要点 20: - 要点 21: - 要点 22: - 要点 23: - 要点 24: - 要点 25: - 要点 26: - 要点 27: - 要点 28: - 要点 29: - 要点 30: - 要点 31: - 要点 32: - 要点 33: - 要点 34: - 要点 35: ##### 练习与思考(3.4 统计推断) > 建议:先手算,再用 NumPy 验证。每题写出「结果 + 一句话解释」。 - 题 01: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 02: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 03: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 04: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 05: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 06: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 07: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 08: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 09: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 10: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 11: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 12: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 13: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 14: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 15: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 16: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 17: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 18: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 19: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 20: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 21: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 22: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 23: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 24: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 25: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 26: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 27: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 28: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 29: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 30: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 31: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 32: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 33: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 34: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 35: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 36: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 37: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 38: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 39: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 40: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 41: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 42: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 43: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 44: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 45: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 46: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 47: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 48: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 49: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 50: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 51: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 52: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 53: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 54: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 55: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 56: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 57: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 58: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 59: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 60: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 61: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 62: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 63: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 64: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 65: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 66: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 67: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 68: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 69: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 70: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 71: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 72: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 73: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 74: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 75: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 76: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 77: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 78: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 79: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 80: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: ### 3.5 信息论基础 #### 3.5.1 信息熵(Entropy) **直觉/定义** 熵衡量不确定性:分布越均匀越不确定,熵越大。 **核心公式(LaTeX)** 离散熵:$$H(P)=-\sum_x p(x)\log p(x). $$ **在 ML 中用在哪里?** - 决策树信息增益;语言模型困惑度(perplexity)。 **为什么需要?** - 提供统一的不确定性度量,连接压缩与学习。 ##### 要点速览(3.5.1) - 要点 01: - 要点 02: - 要点 03: - 要点 04: - 要点 05: - 要点 06: - 要点 07: - 要点 08: - 要点 09: - 要点 10: - 要点 11: - 要点 12: - 要点 13: - 要点 14: - 要点 15: - 要点 16: - 要点 17: - 要点 18: - 要点 19: - 要点 20: - 要点 21: - 要点 22: - 要点 23: - 要点 24: - 要点 25: - 要点 26: - 要点 27: - 要点 28: - 要点 29: - 要点 30: - 要点 31: - 要点 32: - 要点 33: - 要点 34: - 要点 35: - 要点 36: - 要点 37: - 要点 38: - 要点 39: - 要点 40: #### 3.5.2 交叉熵(Cross-Entropy) **直觉/定义** 用分布 Q 编码来自 P 的样本所需的平均编码长度;训练分类常用交叉熵损失。 **核心公式(LaTeX)** $$H(P,Q)=-\sum_x p(x)\log q(x). $$ **在 ML 中用在哪里?** - softmax 分类损失;语言模型 NLL。 **为什么需要?** - 把概率预测误差转成可优化的标量损失。 ##### 要点速览(3.5.2) - 要点 01: - 要点 02: - 要点 03: - 要点 04: - 要点 05: - 要点 06: - 要点 07: - 要点 08: - 要点 09: - 要点 10: - 要点 11: - 要点 12: - 要点 13: - 要点 14: - 要点 15: - 要点 16: - 要点 17: - 要点 18: - 要点 19: - 要点 20: - 要点 21: - 要点 22: - 要点 23: - 要点 24: - 要点 25: - 要点 26: - 要点 27: - 要点 28: - 要点 29: - 要点 30: - 要点 31: - 要点 32: - 要点 33: - 要点 34: - 要点 35: - 要点 36: - 要点 37: - 要点 38: - 要点 39: - 要点 40: #### 3.5.3 KL 散度(Kullback–Leibler) **直觉/定义** KL 衡量两个分布差异(非对称)。它等于交叉熵减熵。 **核心公式(LaTeX)** $$D_{\mathrm{KL}}(P\|Q)=\sum_x p(x)\log rac{p(x)}{q(x)}. $$ 关系:$$D_{\mathrm{KL}}(P\|Q)=H(P,Q)-H(P). $$ **在 ML 中用在哪里?** - 变分推断最小化 KL;知识蒸馏;分布匹配与正则。 **为什么需要?** - 作为“分布距离”的核心工具,连接生成建模与推断。 ##### 要点速览(3.5.3) - 要点 01: - 要点 02: - 要点 03: - 要点 04: - 要点 05: - 要点 06: - 要点 07: - 要点 08: - 要点 09: - 要点 10: - 要点 11: - 要点 12: - 要点 13: - 要点 14: - 要点 15: - 要点 16: - 要点 17: - 要点 18: - 要点 19: - 要点 20: - 要点 21: - 要点 22: - 要点 23: - 要点 24: - 要点 25: - 要点 26: - 要点 27: - 要点 28: - 要点 29: - 要点 30: - 要点 31: - 要点 32: - 要点 33: - 要点 34: - 要点 35: - 要点 36: - 要点 37: - 要点 38: - 要点 39: - 要点 40: - 要点 41: - 要点 42: - 要点 43: - 要点 44: - 要点 45: #### 3.5.4 信息论在损失函数和模型评估中的应用 **直觉/定义** 最大似然等价于最小化负对数似然;很多情况下等价于最小化交叉熵/ KL。 **核心公式(LaTeX)** NLL:$$\mathcal{L}( heta)=-\sum_i \log p(x_i| heta). $$ **在 ML 中用在哪里?** - 分类/语言模型训练;生成模型评价;校准。 **为什么需要?** - 给出损失函数的“概率解释”,避免只把它当黑盒。 ##### 要点速览(3.5.4) - 要点 01: - 要点 02: - 要点 03: - 要点 04: - 要点 05: - 要点 06: - 要点 07: - 要点 08: - 要点 09: - 要点 10: - 要点 11: - 要点 12: - 要点 13: - 要点 14: - 要点 15: - 要点 16: - 要点 17: - 要点 18: - 要点 19: - 要点 20: - 要点 21: - 要点 22: - 要点 23: - 要点 24: - 要点 25: - 要点 26: - 要点 27: - 要点 28: - 要点 29: - 要点 30: - 要点 31: - 要点 32: - 要点 33: - 要点 34: - 要点 35: ##### 练习与思考(3.5 信息论基础) > 建议:先手算,再用 NumPy 验证。每题写出「结果 + 一句话解释」。 - 题 01: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 02: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 03: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 04: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 05: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 06: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 07: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 08: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 09: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 10: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 11: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 12: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 13: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 14: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 15: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 16: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 17: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 18: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 19: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 20: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 21: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 22: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 23: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 24: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 25: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 26: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 27: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 28: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 29: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 30: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 31: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 32: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 33: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 34: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 35: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 36: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 37: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 38: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 39: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 40: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 41: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 42: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 43: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 44: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 45: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 46: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 47: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 48: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 49: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 50: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 51: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 52: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 53: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 54: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 55: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 56: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 57: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 58: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 59: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 60: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 61: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 62: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 63: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 64: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 65: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 66: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 67: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 68: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 69: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 70: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 71: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 72: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 73: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 74: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 75: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 76: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 77: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 78: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 79: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: - 题 80: - 问题: - 关键公式: - NumPy 验证: - 在 ML 中的对应场景: --- ## 数学在 ML 中的映射总结 > 下面的大表格把本周核心概念映射到常见 ML 模块/算法位置。 | 数学概念 | 关键对象/公式 | ML中具体用在哪里 | 为什么需要(1句话) | |---|---|---|---| | 向量/矩阵/张量 | $\mathbf{X},\mathbf{W},\mathcal{T}$ | 数据表示、线性层、批量训练 | 统一表示并实现向量化计算 | | 矩阵乘法 | $\mathbf{W}\mathbf{x}$ | 线性回归、神经网络线性层、注意力投影 | 表达线性变换与特征组合 | | 秩/低秩 | $\mathrm{rank}(\mathbf{X})$ | 推荐系统、压缩、LoRA 思想 | 用少量自由度近似高维结构 | | 特征值/特征向量 | $\mathbf{A}\mathbf{v}=\lambda\mathbf{v}$ | PCA、谱聚类、曲率分析 | 找到最重要方向与伸缩尺度 | | SVD | $\mathbf{U}\Sigma\mathbf{V}^ op$ | 压缩/去噪、矩阵分解推荐 | 最佳低秩近似与能量排序 | | 范数/距离 | $\|\cdot\|_p$ | 正则化、kNN、聚类、检索 | 量化误差与复杂度,决定几何偏好 | | 梯度 | $ abla \mathcal{L}$ | 反向传播、优化器更新 | 提供下降方向,训练可扩展 | | 链式法则 | 复合求导 | 自动微分/反传 | 深层模型可训练的数学基础 | | 凸优化/KKT | 最优性条件 | SVM、Lasso、Ridge | 可靠收敛与可解释结构 | | 泰勒/牛顿/Hessian | 二阶近似 | 二阶/预条件优化、曲率分析 | 提升收敛速度与稳定性理解 | | 条件概率/贝叶斯 | $P( heta|\mathcal{D})$ | 朴素贝叶斯、贝叶斯推断 | 融合先验与数据、刻画不确定性 | | MLE/MAP | $\max \log p$ | 模型训练目标、正则化解释 | 把学习转为可优化的目标 | | 熵/交叉熵/KL | $H, H(P,Q), D_{KL}$ | 分类损失、变分推断、蒸馏 | 概率预测误差的统一度量 | ## 时间分配建议 - 3h 线性代数 - 2-3h 微积分 - 2h 概率统计 - 1-2h 复盘 建议节奏(示例): | 时间段 | 任务 | 产出 | |---|---|---| | Day 1 | 线性代数 1.1~1.2 | 跑通矩阵运算与线性变换代码 | | Day 2 | 线性代数 1.3~1.5 | 跑通 PCA/SVD 示例,整理范数与正则直觉 | | Day 3 | 微积分 2.1~2.4 | 手写链式法则与梯度下降小实验 | | Day 4 | 概率统计 3.1~3.5 | 做 CLT 模拟,写出 MLE/MAP/KL 的联系 | | Day 5 | 复盘 | 完成里程碑自检与错题回顾 | ## 里程碑 - 里程碑 1:你能用 NumPy 熟练处理 shape,并写出常见矩阵运算(含 solve)。 - 里程碑 2:你能解释并用代码演示 PCA:协方差→特征分解→投影。 - 里程碑 3:你能从损失函数写出梯度,并实现一个可视化的梯度下降。 - 里程碑 4:你能用仿真实验解释 CLT,并说明它对置信区间/检验的意义。 - 里程碑 5:你能说清交叉熵与 KL 的关系,以及它们为何成为常用损失。 ## 学完你应该能... - 用严谨符号写出:线性模型、损失函数、梯度更新。 - 看到一个矩阵就能判断:它是否对称/正定/低秩,并选合适分解(EVD/SVD/QR/Cholesky)。 - 解释:为什么 PCA 选最大特征值方向;为什么 SVD 可做压缩。 - 解释:为什么 SGD 的噪声可能有益;为什么学习率与曲率相关。 - 解释:MLE/MAP/贝叶斯估计的差异;交叉熵与 KL 的联系。 - 具备把“数学概念”映射到“ML模块”的能力(见上表)。