分类:预测值是离散值,即预测值可穷举;回归:预测值是连续值,即预测值不可穷举
聚类:将训练集分为若干”簇”,这些自动形成的簇可能对应一些潜在的概念划分。
根据训练数据是否拥有标记信息,将学习任务分为”监督学习”和”无监督学习”两类,分类和回归是前者的代表,聚类是后者的代表。
泛化能力:学得模型适用于新样本的能力
假设空间:形如”$好瓜\leftrightarrow(色泽=?)\wedge(根蒂=?)\wedge(敲声=?)$”的可能取值所形成的假设组成。
- 我们可以把学习过程看作在假设空间中进行搜索的过程,搜索目标是找到与训练集匹配的假设,即能将训练集中的瓜判断正确的假设。
版本空间:可能有多个假设与训练集一致,即存在着一个与训练集一致的”假设集合”。
归纳偏好:机器学习算法在学习过程中对某种类型假设的偏好。
- 算法的归纳偏好是否与问题本身匹配,大多数时候直接决定了算法能否取得好的性能。