1) verb semantic Classification tree
动词语义分类树
2) verbal semantic categories
动词语义类
3) semantic classification trees
语义分类树
1.
In this approach,the semantic classification trees which are built by the semantic rules automatically learned from the training data are used to disambiguate key words related to the sentences shallow semantic meaning,and then,a statistical model is used to extract.
本文面向口语自动翻译提出了一种统计和规则相结合的汉语口语理解方法,该方法利用统计方法从训练语料中自动获取语义规则,生成语义分类树,然后利用语义分类树对待解析的汉语句子中与句子浅层语义密切相关的词语进行解析,最后再利用统计理解模型对各个词语的解析结果进行组合,从而获得整个句子的浅层语义领域行为。
4) classification of semantics and syntax of verbs
动词句法语义分类
5) semantic types of verbs
动词语义类型
6) verb phrases categorization
动词短语分类
1.
The SVM categorization model is analyzed,static and dynamic characteristic on Chinese verb phrase is extracted,vector space model on verb phrase is built,and an algorithm to perform Chinese verb phrases categorization using support vector machine is presented.
对SVM分类器进行了分析,提取了汉语动词短语的静态特征和动态特征,构造了动词短语的向量空间模型,提出了基于SVM的汉语动词短语分类算法。
补充资料:树分类器
需要通过多级判别才能确定模式所属类别的一种分类方法。多级判别过程可以用树状结构表示,所以称为树分类器。例如在对0~9十个数字进行识别时,可以先根据某些特征把0,6,8,9,4分成一类(C1),把1,2,3,5,7分成一类(C2),然后根据这些特征或另外一些特征把0,6,8,9,4这一类再分成0,4,8一类 (C3)和4,6,9一类(C4)等,直到最后把各个数字分开为止(见图)。这种树状结构由节点和树枝所组成,它的特点是除了树根C0没有前级节点(父节点)以外,其余节点都有唯一的父节点(例如C的父节点是C,且所有的节点都可以从树根沿树枝所组成的路径达到。没有后继节点(子节点)的节点叫作叶,如C8,C10,C11等,其余的叫作非终止节点。每个非终止节点都只有两个子节点的树分类器,是最常用的一类树分类器,称为二分树分类器。
每个终止节点对应一个类别,为了提高树分类器的正确识别率,允许有几个叶对应同一个类别。非终止节点对应的类别是它的子节点所对应的类别的总和。
树分类器的设计需要解决以下几个问题:
① 确定树的结构。树结构影响正确识别率和平均判别次数,一般根据所研究问题的性质确定某种与正确识别率有联系的目标函数代替正确识别率,作为判断结构是否合理的标准,从树根出发在每个非终止节点寻找使目标函数达到最小(或最大)的子节点和对应的类别配置。
② 对每个非终止节点选择用于判别的特征子集,分枝限界算法能提供选择最佳特征子集的有效方法。
③ 为每个非终止节点确定判别函数,最常用的判别函数是线性判别函数。
由于在每个非终止节点需要判别的类别比较少,在多数情况下,可以用较少的特征和较简单的判别函数(因而较少的计算机时间)以达到总体上比较好的分类效果。
每个终止节点对应一个类别,为了提高树分类器的正确识别率,允许有几个叶对应同一个类别。非终止节点对应的类别是它的子节点所对应的类别的总和。
树分类器的设计需要解决以下几个问题:
① 确定树的结构。树结构影响正确识别率和平均判别次数,一般根据所研究问题的性质确定某种与正确识别率有联系的目标函数代替正确识别率,作为判断结构是否合理的标准,从树根出发在每个非终止节点寻找使目标函数达到最小(或最大)的子节点和对应的类别配置。
② 对每个非终止节点选择用于判别的特征子集,分枝限界算法能提供选择最佳特征子集的有效方法。
③ 为每个非终止节点确定判别函数,最常用的判别函数是线性判别函数。
由于在每个非终止节点需要判别的类别比较少,在多数情况下,可以用较少的特征和较简单的判别函数(因而较少的计算机时间)以达到总体上比较好的分类效果。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条