1) minimum edit distance
最小编辑距离
1.
It also presents and implements a minimum edit distance based approach for Uighur spelling check and correction,integrating the Uighur morphological structure to improve accuracy and speed of the correction ranking.
本文结合维吾尔语的语音和词语结构特点,列出了文本中常见的拼写错误类型,详细分析了解决方法,利用最小编辑距离(minimume ditdistance)算法实现了维吾尔语文本拼写错误分析中的查错和纠错功能,并以此为基础,结合维吾尔语构词规则,进一步提高了建议候选词的准确率和速度。
2.
The minimum edit distance algorithm and a character-matching algorithm are first applied to identify the morphological variants and the abbreviations as the candidate variants for a given term.
首先使用最小编辑距离算法和字符匹配算法从语料中分别获得特定目标词的形态学变体和缩略词,并将其作为候选词变体。
2) edit distance
编辑距离
1.
This paper explores the way to extract string structure, and proposes an edit distance based string structure detect method.
以文字序列为研究对象 ,探索构建结构模式的方法 ,提出一种基于编辑距离的结构模式发现方法。
2.
One is searching similar examples from example set based on measurement of edit distance.
提出在面向数据的英汉机译系统中,组合基于实例的技术实现源语分析的一种方法·其中介绍了基于编辑距离测量检索近似实例,以及根据候选分析得分的评价机制,利用近似实例及其对应分析获取最终源语分析结果的实现过程·实验结果表明,源语分析的测试指标查全率与查准率都比较令人满意
3.
A bio-entity name recognition approach using edit distance and multiple postprocessing methods is presented,which expands dictionary via the abbreviation definitions identifying algorithm and improves the recall rate through the edit distance algorithm.
基于编辑距离和多种后处理的生物医学文献实体名识别方法通过"全称缩写对识别算法"扩充词典,利用编辑距离算法提高识别召回率。
5) tree edit distance
树编辑距离
1.
A new hierarchical clustering algorithm based on tree edit distance;
基于树编辑距离的层次聚类算法
2.
It uses Tree Edit Distance Model and Tree Align algorithm to locate and extract the information records on the dynamic web pages.
它通过树编辑距离模型和树归并算法(Tree Align)分离并抽取出动态网页中的信息项。
3.
This algorithm analyzes the structure similarity of the pages crawled with the ordered labeled rooted tree based on the key HTML tags by the restricted tree edit distance algorithm and restricts the pages for the wrapper crawling by a navigate tree based on the URL similarity and the topology of the Web site.
介绍基于网站和网页结构的信息采集算法,提出一种基于约束树编辑距离的导航树算法。
6) spectral edit distance of graphs
谱编辑距离
补充资料:最小距离分类
按照模式与各类代表样本的距离进行模式分类的一种统计识别方法。在这种方法中,被识别模式与所属模式类别样本的距离最小。假定c 个类别代表模式的特征向量用R1,...,Rc表示,x是被识别模式的特征向量,|x-Ri|是x与Ri(i=1,2,...,c)之间的距离,如果|x-Ri|最小,则把x分为第i类。在更复杂的情况下可以用各类的代表样本集合,而不仅仅是用一个样本作为最小距离分类的基础(见近邻法分类)。进行最小距离分类首先要为每个类别确定它的代表模式的特征向量,这是用这种方法进行分类效果好坏的关键。各类代表特征向量可以根据所研究对象的物理、化学、生物等方面的机理来确定,常用的方法是收集各类样本,用各类样本特征向量的平均向量作为各类代表模式的特征向量。其次要选择一种确定的距离度量以计算被识别模式与各类代表模式特征向量之间的距离。常用的距离有欧几里得距离、绝对值距离等。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条