说明:双击或选中下面任意单词,将显示该词的音标、读音、翻译等;选中中文或多个词,将显示翻译。
您的位置:首页 -> 词典 -> 藏文分词
1)  Tibetan word segmentation
藏文分词
1.
This paper proposes a cascaded written Tibetan word segmentation scheme, which is based on case auxiliary words and continuous features.
初步测试表明 :这一方案在发现和消除切分歧义、解决未登录词问题 ,进而在提高藏文分词精度方面具有很高的实用价值。
2.
In Tibetan information processing,the word is to be treated as the fundamental unit for parsing,the sentence comprehension,the automatic abstract,the automatic classification,the machine translation and so on,Therefore,Tibetan word segmentation is essential for Tibetan information processing.
因此,藏文分词是藏文信息处理的基础。
2)  Tibetan word segmentation
藏语分词
1.
Design of Tibetan word segmentation dictionary with multi-level index
多级索引的藏语分词词典设计
3)  Chinese words segmentation
中文分词
1.
For Chinese words segmentation,a module which is based on word library and uses the positive direction maximum matching algorithm was presented.
在该系统模型中,针对中文分词实现了基于词库的采用正向最大匹配算法的中文分词模块;针对多种格式文档的处理采用接口实现的方式和动态实例化的方法,实现了可以有效地处理txt、xml、html、pdf、doc和rtf等常见格式文档。
4)  chinese participle
中文分词
1.
Chinese WEB documents classification involves to the documents automatic capture, the information processing and the extraction, the automatic sorting and so on, this article realizes a open style Chinese WEB documents automatic sorting system, and has applied several improvement algorithms in the system module, in the main solution present information retrieval involves when Chinese participle .
中文WEB文档的分类涉及到文档的自动抓取、信息加工和提取、自动分类等,本文实现一个开放式的中文WEB文档自动分类系统,并在系统模块中应用了几个改进算法,主要解决目前信息检索中涉及中文分词搜索时所遇到的一些问题。
2.
The computer may very easily understand English word, but Chinese sentence which is composed by the word, which can be understood through Chinese participle technology.
计算机可以很容易地理解英文单词,而对由词组成的中文句子,必须通过中文分词技术才得以理解。
3.
It returned to the first results of the Chinese participle and fully tap its semantic information use CC4 neural networks to judge the he rele-vant web page to re-sort the results,and a good solution integrated search engine does not prevail in the search results accurate information stagnant.
它使用神经网络对检索结果进行优化排序,它先对返回结果进行中文分词,在充分挖掘其语义信息的基础上,利用CC4神经网络对网页的相关性进行判断,对返回结果重新排序,很好地解决了综合性搜索引擎中普遍存在搜索结果不准确、信息滞后等问题。
5)  Chinese phrase segmentation
中文分词
1.
To improve the preprocessing performance for anti-spam and to search for phrases more efficiently, this paper creatively constructed an indexing dictionary based on hash algorithm, and designed a method of Chinese phrase segmentation based on this indexing dictionary aiming at anti-Chinese-spam.
通过实验,表明该方法提高了传统机械分词法的效率和准确率,改善了邮件预处理阶段的性能,并且可以广泛地应用于中文分词领域。
6)  Japanese segmentation
日文分词
补充资料:藏文信息处理标准化


藏文信息处理标准化
Tibetan information processing standardization

  ZOr协帕n xinxi Chuli biaOZhuhua藏文信息处理标准化(皿玩切口i刊ronnation pro-~吨山口血心zation)藏文是藏族使用的文字。它是表音文字,有30个辅音字母和4个元音符号。从左向右横写。有一部分复合声母用宇母上下迭加的方法表示。元音符号加在字母的上面或下面。藏文信息处理是藏文信息操作的系统执行,包括数据处理、藏文通信和办公自动化之类的操作。它的标准化是制定藏文信息处理特需的标准。从1望抖年开始,已制定了藏文的编码宇符集、字型和键盘标准,统一协调解决了藏文信息处理的翰人、交换和抽出问题。《信息技术信息交换用藏文编码字符集基本集》(GBI已巧争一l卯7)是按照国际上最新编码体系的国际标准(信息技术通用多八位编码字符集)( 13洲IECI(冷拓)等同采用制定的国家标准,它规定了l的个藏文字符及其二进制编码表示。《信息技术藏文编码字符集(基本集)解x48点阵字型第1部分:白体》(GBIT 16臾刃.l一1卯7)统一规定了GBI的59中藏文字符的显示和打印输出字型。《信息技术藏文编码字符集(基本集)键盘宇母数字区的布局》(G肠叮17543一1卯8)统一规定了cBI已巧9中藏文字符在键盘上的排列位里。这些标准在发展藏文信息处理系统中有着重要的作用。 (于洪志)
  
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条