说明:双击或选中下面任意单词,将显示该词的音标、读音、翻译等;选中中文或多个词,将显示翻译。
您的位置:首页 -> 词典 -> 简单贝叶斯分类
1)  simple bayesian classifier
简单贝叶斯分类
2)  simple bayes classifier
简单贝叶斯分类器
3)  naive Bayes
简单贝叶斯
1.
This method computes the frequency numbers and point scores through the naive Bayes formula, then the dataset can be analyzed and classified visually by the constructed PSPC.
该方法利用简单贝叶斯公式计算各属性值或属性值区间的频数和点得分,最后根据构建的点得分平行坐标即可进行数据集的可视化分析和未知样本的分类。
4)  naive-bayes
简单贝叶斯
1.
Naive-Bayes model can integrate the prior information and the sample information.
简单贝叶斯模型能够很好地综合先验信息和样本信息。
5)  Na?ve-Bayes algorithm
简单贝叶斯算法
6)  Bayesian classification
贝叶斯分类
1.
Study on the Strategy of Bayesian Classification of CSCL Automatic Heterogeneous Group;
基于贝叶斯分类的CSCL自动异质分组策略研究
2.
Research and Implementation of Rule-Learning Model of Intrusion Detection Based on Bayesian Classification;
基于贝叶斯分类的入侵检测规则学习模型的研究与实现
3.
Anti-spam model based on semi-Naive Bayesian classification model
基于不完全朴素贝叶斯分类模型的垃圾邮件分类模型
补充资料:贝叶斯分类器
      在具有模式的完整统计知识条件下,按照贝叶斯决策理论进行设计的一种最优分类器。分类器是对每一个输入模式赋予一个类别名称的软件或硬件装置,而贝叶斯分类器是各种分类器中分类错误概率最小或者在预先给定代价的情况下平均风险最小的分类器。它的设计方法是一种最基本的统计分类方法。
  
  最小错误概率贝叶斯分类器  把代表模式的特征向量x分到c个类别(ω1,ω2,...,ωc)中某一类的最基本方法是计算在 x的条件下,该模式属于各类的概率,用符号P(ω1|x),P(ω2|x),...,P(ωc|x)表示。比较这些条件概率,最大数值所对应的类别ωi就是该模式所属的类。例如表示某个待查细胞的特征向量 x属于正常细胞类的概率是0.2,属于癌变细胞类的概率是0.8,就把它归类为癌变细胞。上述定义的条件概率也称为后验概率,在特征向量为一维的情况下,一般有图中的变化关系。当 x=x*时,P(ω1|x)=P(ω2|x)对于 x>x*的区域,由于P(ω2|x)>P(ω1|x)因此x属ω2类,对于x*的区域,由于P(ω1|x)>P(ω2|x),x属ω1类,x*就相当于区域的分界点。图中的阴影面积就反映了这种方法的错误分类概率,对于以任何其他的 x值作为区域分界点的分类方法都对应一个更大的阴影面积,因此贝叶斯分类器是一种最小错误概率的分类器
  
  
  一般情况下,不能直接得到后验概率而是要通过贝叶斯公式
  
    进行计算。式中的P(x│ωi)为在模式属于ωi类的条件下出现x的概率密度,称为x的类条件概率密度;P(ωi)为在所研究的识别问题中出现ωi类的概率,又称先验概率;P(x)是特征向量x的概率密度。分类器在比较后验概率时,对于确定的输入x,P(x)是常数,因此在实际应用中,通常不是直接用后验概率作为分类器的判决函数gi(x)(见线性判别函数)而采用下面两种形式:
  
  
   
  对所有的c个类计算gi(x)(i=1,2,...,c)。与gi(x)中最大值相对应的类别就是x的所属类别。
  
  最小风险贝叶斯分类器  由于客观事物的复杂性,分类器作出各种判决时的风险是不一样的。例如将癌细胞误判为正常细胞的风险就比将正常细胞误判为癌细胞的风险大。因此,在贝叶斯分类器中引入了风险的概念。在实际应用中根据具体情况决定各种风险的大小,通常用一组系数Cij来表示。Cij表示分类器将被识别样本分类为ωi,而该样本的真正类别为ωj时的风险。设计最小风险分类器的基本思想是用后验概率计算将 x分类为ωi的条件风险
  
  
  
   比较各Ri(x)的大小,与最小值对应的类别是分类的结果。评价这种分类器的标准是平均风险,它的平均风险最小。在实际应用时,后验概率是难以获得的,根据模式类别的多少和Cij的取值方式,可设计出各种分类器,例如模式为两类时,判别函数为
  
  
   如果选择C11和C22为零,C12和C21为1,它就是两类最小错误概率分类器。实际上,最小错误概率分类器是最小风险分类器的一种特殊情况。
  
  设计贝叶斯分类器的关键是要知道样本特征 x的各种概率密度函数。条件概率密度函数为多元正态分布是研究得最多的分布。这是由于它的数学表达式易于分析,在实际应用中也是一种常见的分布形式。经常使用参数方法来设计正态分布的判别函数。
  
  参考书目
   福永圭之介著,陶笃纯译:《统计图形识别导论》,科学出版社,北京,1978。
  

说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条