说明:双击或选中下面任意单词,将显示该词的音标、读音、翻译等;选中中文或多个词,将显示翻译。
您的位置:首页 -> 词典 -> 重复剪辑近邻法
1)  multi-edit-nearest-neighbor algorithm
重复剪辑近邻法
1.
Mistakenly removing sample thereby increasing the risk in the judgement and the probability misjudgment of the decision tree is a problem with multi-edit-nearest-neighbor algorithm in selecting training samples.
为了克服用重复剪辑近邻法筛选训练样本集产生样本被误剔除进而增大决策树的判决风险和误判概率的问题,提出一种新的方法-引入拒绝阀值的重复剪辑近邻法,并从理论上分析了它降低判决风险和误判概率的原理。
2)  Multiedit Nearest Neighbor
重复剪辑近邻
3)  refusing threshold multi-edit-nearest-neighbor algorithm
引入拒绝阀值的重复剪辑近邻法
1.
For solving this problem,a new algorithm,refusing threshold multi-edit-nearest-neighbor algorithm,is proposed.
为了克服用重复剪辑近邻法筛选训练样本集产生样本被误剔除进而增大决策树的判决风险和误判概率的问题,提出一种新的方法-引入拒绝阀值的重复剪辑近邻法,并从理论上分析了它降低判决风险和误判概率的原理。
2.
Experiments comparing the two algorithms show that the refusing threshold multi-edit-nearest-neighbor algorithm is superior to multi-edit-nearest-neighbor algorithm in reducing the risk of the judgement and probability of misjudgment.
本文对决策树算法中涉及的样本筛选方法和测试属性选择标准进行了深入研究,主要包括以下几个方面的内容:通过分析基于重复剪辑近邻法筛选样本的原理,提出了引入拒绝阀值的重复剪辑近邻法
4)  Editing Nearest Neighbor Algorithm
剪辑近邻法
5)  nearest neighbor resampling
最近邻重复取样
6)  adjacency weights
邻近权重
补充资料:近邻法分类
      对被识别样本某个给定近邻域中的已知类别的学习样本数量进行统计,并以其中数量最多的那一类作为分类结果的分类方法。对 k个被识别样本的近邻学习样本进行计算时,假设离被识别样本最近的5个学习样本中有3个属于某类,就把被识别样本判别为该类。当k等于1时,就是通常所说的最近邻规则,即被识别样本离哪一类的学习样本最近,就把它分到哪一类(见最小距离分类)。设R1,R2...,R0分别是已知类别的c个学习样本集合,每个集合Rj中有uj个特征向量,用x忋表示,k=1,2,...,uj。在用最近邻规则时,可以定义被识别特征向量y与Rj之间的距离为
  
  
   式中‖·‖是给定的一种距离度量。分类器把被识别模式分类到d(y, Rj)值最小的那一类中去。当用欧氏距离作为距离度量时,可以证明这种方法实质上是一种分段线性分类器。理论分析表明,当学习样本无限增加时,用最近邻规则分类的结果,其误识率(错分率)不会超过贝叶斯分类器误识率的两倍。
  

说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条