吐槽完了,现在把今年学过的东西复习一下,顺便立一个小小的目标——希望明年可以去百度IDG或者达摩院或者腾讯 AI lab 去实习。
一、统计机器学习基础
1、监督学习
输入空间:输入所有可能的取值的集合。输出空间:输出所有可能的取值的集合。- 每个具体的输入是一个
实例,通常由特征向量表示,这时,所有特征向量存在的空间称为特征空间。(特征空间有时和输入空间相同,有时则不同,不同的时候就需要将输入空间映射到特征空间。) - 联合概率分布:监督学习假设输入与输出随机变量X和Y服从
联合概率分布P(X,Y),X和Y具有联合概率分布的假设就是监督学习关于数据的基本假设。 假设空间:监督学习的目的在于学习一个由输入到输出的映射,这个映射由模型表示。模型属于由输入空间到输出空间的映射的集合,这个集合就是假设空间。假设空间的确定即意味着学习范围的确定。监督学习的模型可以是概率模型或判别模型,由条件概率分布P(Y|X)或者决策函数Y=f(X)决定。在监督学习中,假设训练数据与测试数据是依联合概率分布P(X,Y)独立同分布的。
more >>


