吐槽完了,现在把今年学过的东西复习一下,顺便立一个小小的目标——希望明年可以去百度IDG或者达摩院或者腾讯 AI lab 去实习。
一、统计机器学习基础
1、监督学习
输入空间
:输入所有可能的取值的集合。输出空间
:输出所有可能的取值的集合。- 每个具体的输入是一个
实例
,通常由特征向量
表示,这时,所有特征向量存在的空间称为特征空间
。(特征空间有时和输入空间相同,有时则不同,不同的时候就需要将输入空间映射到特征空间。) - 联合概率分布:监督学习假设输入与输出随机变量X和Y服从
联合概率分布P(X,Y)
,X和Y具有联合概率分布的假设就是监督学习关于数据的基本假设。 假设空间
:监督学习的目的在于学习一个由输入到输出的映射,这个映射由模型
表示。模型属于由输入空间到输出空间的映射的集合,这个集合就是假设空间。假设空间的确定即意味着学习范围的确定。监督学习的模型可以是概率模型
或判别模型
,由条件概率分布P(Y|X)或者决策函数Y=f(X)决定。在监督学习中,假设训练数据与测试数据是依联合概率分布P(X,Y)独立同分布的。
more >>