机器学习实战:K-近邻算法 发表于 2017-03-17 | 分类于 机器学习 | | 总阅读量次 参考链接 十大经典数据挖掘算法 简介k-近邻算法(kNN)工作原理如下: 存在一个每个数据都有标签的训练样本集,即知道样本集中每一数据与所属分类的对于关系。 输入一个没有标签的新数据后,将新数据的每个特征与样本集中数据对于的特征进行比较,然后提取样本集中特征最相似的分类标签。 一般只选取样本数据集中前k个最相似数据,这就是k-近邻算法中k的出处,通常k取不大于20的整数。 最后选择k个最相似数据中出现次数最多的分类,作为新数据的分类