机器学习算法学习 发表于 2017-03-17 | 分类于 机器学习 | | 总阅读量次 参考链接 十大经典数据挖掘算法 k-近邻(kNN) 算法原理 存在一个每个数据都有标签的训练样本集,即知道样本集中每一数据与所属分类的对于关系。 输入一个没有标签的新数据后,将新数据的每个特征与样本集中数据对于的特征进行比较,然后提取样本集中特征最相似的分类标签。 一般只选取样本数据集中前k个最相似数据,这就是k-近邻算法中k的出处,通常k取不大于20的整数。 最后选择k个最相似数据中出现次数最多的分类,作为新数据的分类 K-Means 参考文档 http://blog.csdn.net/zouxy09/article/details/17589329 (期望最大化算法) 参考文档 http://blog.csdn.net/zouxy09/article/details/8537620 SVMC4.5CARTPageRankAdaBoostNaive BayesApriori