机器学习导论——概念学习

一、概念学习
是指从有关某个布尔函数(是或否)的输入输出训练样例中推断出该布尔函数
二、训练集/训练样例
用来进行训练,也就是产生模型或算法的数据集
三、测试集/测试样例
(通常只知道特征,用来进行预测)用来专门进行测试已经学习好的模型或算法的数据集
四、特征向量
属性的集合,通常用一个向量来表示,附属于一个实例
五、标记:c(x),实例类别的标记
六、分类
目标标记为类别型数据
七、回归
目标标记为连续性数值
八、有监督学习
训练集有类别标记
九、无监督学习
无类别标记
十、半监督学习
有类别标记的训练集+无标记的训练集
十一、机器学习步骤框架
(一)把数据拆分为训练集和测试集
(二)用训练集和训练集的特征向量来训练算法
(三)用学习来的算法运用在测试集上来评估算法(可能要设计到调整参数(parameter turning)–验证集(validation set))
在这里插入图片描述