1) Word Features
单词特征
2) unigram
单元词特征
1.
In this paper,we adopt unigram features and bigram features,incorporated the position information,and utilized Singular Value Decomposition to reduce the feature space to a low-dimension space and obtain semantic features.
本文首先从句子中得到单元词特征和二元词特征,并且将词在对应句子中的位置信息融入到所选择的特征中,然后利用奇异值分解方法获取特征与特征之间的潜在语义关系,与此同时得到一个低维正交子空间。
3) feature words
特征词
1.
It is an important problem how to choice the feature words which can express the topic exactly,and consequently reduce space dimension and time complexity.
文本分类中通常采用向量空间模型(VSM)来表示文本特征,如何选择最能够表达文本主题的特征词,从而减少特征空间维数,降低时空复杂度,是一个十分重要的问题。
2.
We proposed a clustering computing based on feature words.
文章采用特征词的方法,利用特征词将句子聚类,通过实验达到了比较满意的效果。
3.
Different than stressing genealogical lines as is done by comparing feature words of a Pan-Min nature,the extraction of feature words pertaining to Hainan Min dialect is aimed at revealing its peculiarity.
方言特征词是最具方言特色的词语。
4) characteristic words
特征词
1.
This article uses correlative theory and researched date, whose representative characteristic words are from Binyang dialect, Tingzi Pinghua and Hengxian Pinghua, at the same time, com paring with characteristic words from Characteristic Words in Cantonese whose author is Zhang Shuangqing, to analyse the using situation.
方言特征词,对认识一种方言的面貌,认识相关方言区之间的联系有着重要的意义。
2.
This paper introduces the definition and its extract method of Hakka dialects characteristic words, and lists some examples,then stresses the analysis of modern Chinese words in it in order to show the close relation of Hakka dialects and the modern Chinese.
本文介绍了客家方言特征词的界定及其提取方法 ,并列举了部分例子 ,然后重点分析了其中的近代汉语词 ,以此说明客家方言与近代汉语关系紧密。
3.
With the point of characteristic words, it’s very necessary and important to do the comparison.
方言特征词,对认识一种方言的面貌,认识相关方言区之间的联系有着重要的意义。
5) positive feature words
正特征词
1.
To categorize documents hierarchically according to their topics,the thought of Fisher linear discriminant is utilized to get positive feature words and negative feature words in each category, and the algorithm of a hierarchical document categorization is given based on Fisher linear discriminant (HDCF).
将文档按照主题进行层次分类,利用Fisher线性判别式的思想来提取每一类的正特征词和负特征词,给出基于Fisher线性判别式的层次文档分类算法(HDCF)。
6) negative feature words
负特征词
1.
To categorize documents hierarchically according to their topics,the thought of Fisher linear discriminant is utilized to get positive feature words and negative feature words in each category, and the algorithm of a hierarchical document categorization is given based on Fisher linear discriminant (HDCF).
将文档按照主题进行层次分类,利用Fisher线性判别式的思想来提取每一类的正特征词和负特征词,给出基于Fisher线性判别式的层次文档分类算法(HDCF)。
补充资料:偏微分算子的特征值与特征函数
由边界固定的膜振动引出的拉普拉斯算子的特征值问题:是一个典型的偏微分算子的特征值问题,这里x=(x1,x2);Ω是膜所占据的平面区域。使得问题有非平凡解(非零解)的参数λ的值,称为特征值;相应的解称为特征函数。当Ω有界且边界嬠Ω满足一定的正则条件时,存在可数无穷个特征值,相应的特征函数ψn(x)组成l2(Ω)上的完备正交系。乘以常因子来规范ψn(x),使其l2(Ω)模为1,则Ω上的任意函数??(x)的特征展式可写为:当??可以"源形表达",即??满足边界条件且Δ??平方可积时,展式在Ω一致收敛。当??平方可积时,展式平方平均收敛,且有帕舍伐尔公式:
对膜振动问题的认识还是相当有限的。能够精确地知道特征值的,只限于矩形、圆盘等少数几种非常简单的区域。对椭圆和一般三角形的特征值精确值,还几乎毫无所知。其他情形就更谈不上了。
将不超过 λ的特征值的个数记为N(λ)。特征值的渐近分布由N(λ)对大 λ的渐近式来刻画。这方面最早的结果是(C.H.)H.外尔在1911年得到的(外尔公式):
式中表示Ω的面积。R.库朗将余项改进为。对于多角形区域,又有人将余项改进到。各种情况下改进余项估计的工作至今绵延不绝。外尔猜测有一个更强的结果:式中|嬠Ω|是区域边界之长,但尚未被证出。
与此密切相关的是下面的MP公式:(t→+0)
取一个渐近项时,用陶伯型定理可由它推出N(λ)的外尔公式。第二渐近项与外尔猜想非常相象,但由此证不出外尔猜想。第三项迟至1966年才被M.卡茨导出,后来由H.P.麦基恩与I.M.辛格严格证明,其中h表示鼓膜Ω的洞数。
特征值与膜振动频率有一个直接的换算关系,M.卡茨据此给MP公式一个非常生动的解释:可以"听出"鼓膜的面积|Ω|、周长|嬠Ω|和洞的个数h!由于1-h恰巧是Ω的欧拉-庞加莱示性数,是整体几何中颇受重视的一个不变量,"听出鼓形"或"谱的几何"问题立即引起人们的强烈兴趣,并导致一系列重要的研究。不过一般的特征值反问题,要求从特征值的谱完全恢复Ω,还远远没有解决。
用陶伯型定理得出N(λ)渐近式的方法,由T.卡莱曼于1934年首创,他还得到谱函数的渐近式:(λ→∞),式中δxy当x=y时为1,当x≠y时为0。
上述关于拉普拉斯算子的结果,由L.戈尔丁和F.E.布劳德推广到 Rn的有界区域Ω上的m 阶椭圆算子。尽管推算繁杂,但结果十分简单整齐:;;式中 v(x) 表示集合{ξ||A0(x,ξ)|<1}的勒贝格测度,而是A的最高阶导数项相应的特征形式。特征展开定理亦由L.戈尔丁得出。
对于奇异情形,例如薛定谔方程 的谱问题,可以证明存在谱函数S(x,y,λ),特征展式为。由于可能出现连续谱,S(x,y,λ)一般不一定能写成前述特征函数双线和的形式。判定奇(异)微分算子谱的离散性是很有意义的工作。已经出现各种充分条件。不过关于特征值与特征函数渐近性质的研究,还只是限于少数特例。
在处理‖x‖→∞ 时V(x)→∞的情形,M.卡茨与D.雷等人曾创造了一种系统的概率方法,其中借助数学期望表出格林函数,有效地求出谱函数与特征值的渐近式:
。
当算子A的系数不光滑,或非一致椭圆,或非自共轭,以及边条件带特征参数或带非定域项等等情形,都出现不少研究结果。还有人考察Au=λBu型的特征值问题,这里A、B都是椭圆算子。
除上述问题外,特征展式的收敛性与求和法也一直受到人们的关注。
对膜振动问题的认识还是相当有限的。能够精确地知道特征值的,只限于矩形、圆盘等少数几种非常简单的区域。对椭圆和一般三角形的特征值精确值,还几乎毫无所知。其他情形就更谈不上了。
将不超过 λ的特征值的个数记为N(λ)。特征值的渐近分布由N(λ)对大 λ的渐近式来刻画。这方面最早的结果是(C.H.)H.外尔在1911年得到的(外尔公式):
式中表示Ω的面积。R.库朗将余项改进为。对于多角形区域,又有人将余项改进到。各种情况下改进余项估计的工作至今绵延不绝。外尔猜测有一个更强的结果:式中|嬠Ω|是区域边界之长,但尚未被证出。
与此密切相关的是下面的MP公式:(t→+0)
取一个渐近项时,用陶伯型定理可由它推出N(λ)的外尔公式。第二渐近项与外尔猜想非常相象,但由此证不出外尔猜想。第三项迟至1966年才被M.卡茨导出,后来由H.P.麦基恩与I.M.辛格严格证明,其中h表示鼓膜Ω的洞数。
特征值与膜振动频率有一个直接的换算关系,M.卡茨据此给MP公式一个非常生动的解释:可以"听出"鼓膜的面积|Ω|、周长|嬠Ω|和洞的个数h!由于1-h恰巧是Ω的欧拉-庞加莱示性数,是整体几何中颇受重视的一个不变量,"听出鼓形"或"谱的几何"问题立即引起人们的强烈兴趣,并导致一系列重要的研究。不过一般的特征值反问题,要求从特征值的谱完全恢复Ω,还远远没有解决。
用陶伯型定理得出N(λ)渐近式的方法,由T.卡莱曼于1934年首创,他还得到谱函数的渐近式:(λ→∞),式中δxy当x=y时为1,当x≠y时为0。
上述关于拉普拉斯算子的结果,由L.戈尔丁和F.E.布劳德推广到 Rn的有界区域Ω上的m 阶椭圆算子。尽管推算繁杂,但结果十分简单整齐:;;式中 v(x) 表示集合{ξ||A0(x,ξ)|<1}的勒贝格测度,而是A的最高阶导数项相应的特征形式。特征展开定理亦由L.戈尔丁得出。
对于奇异情形,例如薛定谔方程 的谱问题,可以证明存在谱函数S(x,y,λ),特征展式为。由于可能出现连续谱,S(x,y,λ)一般不一定能写成前述特征函数双线和的形式。判定奇(异)微分算子谱的离散性是很有意义的工作。已经出现各种充分条件。不过关于特征值与特征函数渐近性质的研究,还只是限于少数特例。
在处理‖x‖→∞ 时V(x)→∞的情形,M.卡茨与D.雷等人曾创造了一种系统的概率方法,其中借助数学期望表出格林函数,有效地求出谱函数与特征值的渐近式:
。
当算子A的系数不光滑,或非一致椭圆,或非自共轭,以及边条件带特征参数或带非定域项等等情形,都出现不少研究结果。还有人考察Au=λBu型的特征值问题,这里A、B都是椭圆算子。
除上述问题外,特征展式的收敛性与求和法也一直受到人们的关注。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条