lec01

机器学习定义与任务分类 (ML Definitions & Tasks)

机器学习是人工智能的一个分支，旨在设计算法，通过输入经验数据 (Empirical data) 来产生模式或预测 (Patterns or predictions) 。

分类	目标	典型算法/任务
监督学习 (Supervised)	学习预测函数 $h : X \to Y$	分类 (Discrete Labels)、回归 (Continuous Labels) +1
无监督学习 (Unsupervised)	学习解释性函数 $f (x)$ ，“无老师学习”	聚类、密度估计、降维 (Dimensionality reduction)
其他任务	针对特定场景优化	半监督学习、主动学习、强化学习 (RL)、迁移学习

K-Nearest Neighbors (K-NN): 一种非参数化 (Non-parametric) 方法。考点在于距离度量 (Distance metric) 的选择对结果至关重要。
支持向量机 (Support Vector Machines, SVM): * 最大间隔原则 (Maximum margin principle): 寻找鲁棒性最强的决策边界。
- 核技巧 (Kernel trick): 将线性不可分问题映射到高维空间处理。
- 通过凸优化 (Convex optimization) 技术高效求解。
朴素贝叶斯 (Naïve Bayes): 基于贝叶斯准则的概率图模型。 $p (y ∣ x) = \frac{p ( y ) p ( x ∣ y )}{p ( x )}$ 其中 $p (y)$ 是先验 (Prior)， $p (x ∣ y)$ 是似然 (Likelihood)， $p (x)$ 是证据 (Evidence) 。

奥卡姆剃刀 (Occam’s Razor): 在解释能力相当时，倾向于简单的模型。
欠拟合 (Underfitting) vs. 过拟合 (Overfitting):
- 欠拟合： 模型太简单，无法捕捉训练数据特征。
- 过拟合： 模型太复杂，过度拟合了训练数据的噪声，导致泛化能力差。
No Free Lunch: 没有一种模型能在所有问题上表现最好。

表示学习 (Representation Learning): 传统机器学习依赖人工特征工程 (Feature extraction)，而深度学习实现了特征提取 + 分类的端到端自动化。
层次化结构 (Hierarchical): 模仿生物视觉系统。从低层（边缘、细节）到中层（纹理、局部），再到高层（物体、语义）的抽象过程。

Hubel & Wiesel (1981 诺贝尔奖): 发现初级视觉皮层 (V1) 的神经元具有感受野，且信息处理具有层级性，这是 CNN 的生物学启发。

作为 2026 年的课程，以下是当前最硬核的研究方向：