1) Chinese lexical analysis
汉语词法分析
1.
Research of applying conditional random fields to Chinese lexical analysis;
应用条件随机场进行汉语词法分析研究
2.
This thesis presents an approach for Chinese lexical analysis using hierarchical hidden Markov model (HHMM), which aims to incorporate Chinese word segmentation, Part-Of-Speech tagging, disambiguation and named entity identification into an integrated theoretical frame.
本文提出了一种基于层次隐马尔可夫模型的汉语词法分析方法,旨在将汉语分词、词性标注、切分排歧和命名实体识别集成到一个完整的理论框架中。
2) Word segmentation\Word attribute\Sentence analysis\Discourse marker
汉语分词\词性\汉语语句分析\关联词语
3) Analysis of Chinese phrase-word
汉语中短语词分析
4) Chinese word segmentation
汉语分词
1.
Optimization of Chinese word segmentation based on neural network;
基于神经网络汉语分词模型的优化
2.
Chinese word segmentation arithmetic based on the degree of combination;
基于组合度的汉语分词决策算法研究
3.
Research of Chinese Word Segmentation with Conditional Random Fields;
基于条件随机场的汉语分词研究
5) Chinese segmentation
汉语分词
1.
CCSS——Case of Chinese Segmentation Solution;
CCSS——一个彻底解决汉语分词的方案
2.
Research on Chinese Segmentation and Unlisted Words Identification for Chinese Information Retrieval;
信息检索用汉语分词与未登录词识别技术研究
3.
Unknown word identification has always been a key and open problem for Chinese segmentation.
未登录词的识别一直是汉语分词研究的焦点和难点,本文通过对各类未登录词的用字频率及上下文进行了详细地分析,提出一种基于混合策略的未登录词识别方法。
6) Chinese parsing
汉语句法分析
1.
Feature selection in the modeling for Chinese parsing is the key problem.
在汉语句法分析建模中,有选择地使用结构消歧特征,有利于把握句法分析的规律,解决数据稀疏问题,提高模型的鲁棒性。
补充资料:汉语拼音正词法
汉语拼音正词法 用汉语拼音字母拼写普通话语词的规则。又称正字法或写法。汉语拼音正词法最主要的原则是分词连写,就是把语言划分为词,并把多音词的各个音节连写在一起成为一个拼写单位。制定分词连写的规则除了参考语法上的词类区分外,还要考虑听觉心理(语感)和视觉心理的要求。因此,汉语拼音的写法和传统语法并不完全一致。汉语拼音正词法的内容还有音译外来词、文言成分、缩略语等的写法,同音同形词的处理方法,声调的标注法,大写字母和标点符号(包括短横)的使用法等等。汉语拼音正词法制定以后,有一个通过群众书写实践并不断修改补充完善的过程,也就是约定俗成的过程。为了使汉语拼音正词法有统一的条例,1982年3月中国文字改革委员会成立汉语拼音正词法委员会,着手制订汉语拼音正词法的基本规则和各种专用规则。经过两年多的研究讨论,并征求各有关部门和专家的意见,最后制订成《汉语拼音正词法基本规则(试用稿)》,于1985年10月发表。 |
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条