说明:双击或选中下面任意单词,将显示该词的音标、读音、翻译等;选中中文或多个词,将显示翻译。
您的位置:首页 -> 词典 -> 词频
1)  word frequency
词频
1.
Effects of part of speech, word category and word frequency on difficulty and reaction time of Chinese Words Reasoning Test;
语词推理测验的词性、词类和词频对项目难度和反应时间的效应
2.
To design a text-filter experiment, first, the dualistic relevancy of word coexistence frequency should be mined by the word frequency Stat.
设计一个文本过滤实验 ,首先从语料库的词频统计结果中挖掘出词频的二元关联度 ,然后用一个Hop field网络将词频的二元关联关系转化为语境关联关系 ,训练语言单位在整个上下文环境下的权重 ,并建立用户模板 。
3.
Combining with algorithms of statistical word frequency and channels,forgetting algorithm and documents attention algorithm,it can obtain the changes of users interests dynamically and satisfy the regquirement of personalized search.
针对传统搜索引擎的不足,论述了个性化综合倒排索引的基本思想,结合词频渠道奖励算法、遗忘算法和文档关注度算法来动态获取用户兴趣变化,从而满足个性化搜索的需求。
2)  term frequency
词频
1.
Points out the limitations of general text feature extraction method based on TfIdf in problems of text classification,and presents the standpoint that combines the term distribution characteristic,term frequency and document frequency to extract the text feature,thus giving a new method to compute term s weight,and a new way of text classification.
指出基于TfIdf的常用文本特征提取方法在文本分类问题中的缺陷,进而提出使用特征词的分布状态、词频和文本频三者相结合的方式提取文本特征的观点,给出了计算特征词权重的新方法,提出了新的文本分类方法。
2.
The techniques used in the method are discussed,which include selecting the characters of text doc-uments,the constructing the character lexicons as well as the computation of the weights of the term frequency(TF).
提出了根据邮件特征域信息和特征词频进行垃圾邮件过滤的新方法,并介绍在该方法中的文本特征选取、特征词典构造以及基于TF的权值计算等相关技术,以及改进的文本相似度计算概率模型。
3.
They ignore that the term frequency results in the classifier\'s capacity of classification down.
传统的关联规则文本分类一般以规则的置信度作为分类准则,完全忽略了特征词的词频对分类的影响。
3)  frequency [英]['fri:kwənsi]  [美]['frikwənsɪ]
词频
1.
The Affects of Category Size and Frequency on Subliminal Semantic Activation;
刺激集和词频对阈下语义启动效应的作用
2.
There is a significant correlation between frequency and word gain in the multiple - choice test, but not in the blank - filling test.
结果显示:两项测试的词汇附带习得率均为20%左右;在选择测试中,词频与词汇净增百分数有显著性相关,而在填空测试中两者无显著性相关;附带习得一个词所要接触这个词的次数约在14~17左右;受试的词汇量大小与受试两项测试的前测和后测成绩均有显著性相关,而与词汇的增加数没有显著性相关。
3.
What role do word frequency and predictability play in the process of words recognition? Do word frequency and predictability affect the same stage of words recognition? Do word frequency and predictability have an interaction relationship? Many studies have been carried out to explore these questions in alphabetic languages.
在词语识别过程中,词频和可预测性起到什么作用,词频和可预测性是否影响词语识别的同一加工阶段,词频和可预测性是否存在交互作用等,国外学者以拼音文字为阅读材料进行了大量理论和实证研究。
4)  term frequency and inverse document frequency TF-IDF
词频和反向词频
5)  word frequency of internet
网络词频
1.
By analyzing the content characteristics and difficulty of information of Chinese internet,states the extraction ways to extract Chinese similar word frequency of internet based on existing search engine,discusses the characteristics and application of Chinese similar word frequency of internet.
通过对中文互联网的信息内容特点和信息提取难点的分析,阐述了基于现有搜索引擎进行互联网汉语近似网络词频的提取方法,并对汉语近似网络词频的特点和应用进行了初步探讨。
6)  frequent term set
频繁词集
1.
Massive short documents classification method based on frequent term set clustering;
基于频繁词集聚类的海量短文分类方法
2.
huge volume of documents,high dimensional process and understandability of the clustering results,we propose a simple hybrid algorithm called topHDC based on top-k frequent term sets and k-means.
针对上述挑战,本文提出了一个基于top-k频繁词集和k-means的混合聚类算法topHDC。
补充资料:词频分布定律
      关于单词在文献中出现频次的分布规律。亦称省力法则。1948年由美国哈佛大学语言学教授G.K.齐普夫对英语文献中单词出现的频次进行大量统计以检验前人的定量化公式而提出的。该定律指出文章中单词的频次(f)与其排列的序号(r)之间存在着下述定量的关系,齐普夫认为:如果有一个包含n 个词的文章,将这些词按其出现的频次递减地排序,那么序号r和其出现频次f之积fr,将近似地为一个常数,即fr=b,(式中r=1,2,3....),即词频分布定律最普通而又最典型的表达。 此后, 许多工具书大 都采用类似观点和说法 。如英国著名的语言学著作《语言与语言词典》 中的释义是:"(词频分布定律) 是指谈话者或写作者使用的词的分布和频次的总描述。F×R=C,方程式中F=频次,R=序号,即频率表上的位置;C=常数。方程式表示词使用的总次数和词频表上的位置之间有一个固定比率。"但是齐普夫的表达仅适宜于中频词的情况,高频与低频词与该表述偏差较大。于是对词频分布规律又有许多补充和深化的研究。
  
  词频分布规律是有较为丰富内涵的,学术界认为正态分布是描述自然科学的典型分布,而齐普夫分布将成为揭示社会科学规律的典型分布,所以社会科学界一直很重视这个定律。讨论词频分布何以呈现那种特殊的形状,对其成因提出假说,建立适当的理论模型描绘其分布过程是当前研究工作的热点,目前较重要的假说有2个:①"省力法则"假说。提出这一假说的是齐普夫。他认为,在语言交流过程中,"省力法则"同时体现在说话人和听话人身上。说话人希望组成语言的词少,而且一词多义,以节省其精力。听话人认为最好是一词一义,使听到的词与其确切涵义容易匹配,减少他理解的功夫。这2种节省精力的倾向最后平衡的结果,便是词频的那种双曲线型分布。②"成功产生成功"假说。这方面以H.A.西蒙的研究最为著名。西蒙构造了一个概率模型,他所作的一个重要假说是:在文献中,一词使用的次数越多,则再次使用的可能性越大。该模型最后导出的分布与齐普夫分布相当接近,D.J.de S.普赖斯后来建立了一个相类似的模型,又明确地提出了"成功产生成功"的假说。
  
  研究词频分布对编制词表,制定标引规则,进行词汇分析与控制,分析作者著述特征具有一定意义。经验表明,中频词往往是包含大量有检索意义的关键词。而一篇文献全文输入计算机后,计算机是很容易检出中频词的。因此,词频分布也是文献自动分类、自动标引的研究对象。
  

说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条