1) Text Document Similarity
文本文档相似度
3) text similarity
文本相似度
1.
Study of Text Similarity Computing Based on Markov Model;
基于马尔科夫模型的文本相似度研究
2.
The text similarity computing based on word co-occurrence presented in this paper enables users to delete or maintain text collections similar to a certain text in order to improve retrieval efficiency.
本文提出的基于词共现的文本相似度计算,可以让用户选择去掉或保留和某一文本相似的文本集,提高用户检索效率。
3.
An efficient algorithm is proposed in this paper to compute text similarity,which considers both word frequency and words order that appears in a text.
针对传统向量空间模型对文本相似度的计算未考虑词序导致偏差的问题,提出使用马尔可夫模型的状态转移矩阵、两两文本的最长公共子序列以及它们的所有公共子串信息来描述词序信息,在此基础上提出一种将马尔可夫状态转移矩阵、最长公共子序列、公共子串和TF-IDF相结合,兼顾词序和词频信息的文本相似度计算方法,并使用英文TREC-9的部分数据集对基于词序方法的文本相似度计算方法进行了测试。
5) document similarity
文档相似性
1.
As most existing document retrieval models are inefficient in semantic learning and are unable to learn the document similarity in topic level,a topic-based document retrieval model(TDRM) is proposed in this paper.
现有文档检索模型大多缺乏语义学习能力,难以从主题层次上学习文档相似性。
2.
To overcome the incompleteness of modeling document characteristics and the lack of theory for current document similarity models,this paper puts forward to utilize mixture language model(MLM) to evaluate document-to-document similarity.
为了克服现有文档相似性模型对文档特性拟合的不完全性和缺乏理论根据的弱点,本文在统计语言模型的基础上,提出了一种基于混合语言模型(M ixture Language Model,MLM)文档相似性计算模型。
补充资料:CATIA文档管理
*. 同一个档案可由2个以上的User同时开启,以最后存档的人为最后结果,故必需要很注意不然会有不可预知的结果发生
解决方式︰PDM1 模块 or 设定权限
*. 若有甲乙二部计算机中在同样的磁盘中有同样的名称及档名 ex:二部的计算机中皆有 d:\123\1.CATProduct, 2.CATPart, 3.CATPart, 4.CATPart(此为一个组立件互有连结) ,若从甲计算机开启乙计算机中的 1.CATProduct,则会连结到甲计算机的 2.CATPart, 3.CATPart, 4.CATPart 此为连结的错误
解决方式 : 工具/选项/一般/文件/将"储存名称"设定为 [否]
*.另存与另存如新的差别︰
有一组立件为 1.CATProduct, 2.CATPart, 3.CATPart, 4.CATPart
#若将 4.CATPart 另存为 5.CATPart, 此时是 1.CATProduct, 2.CATPart, 3.CATPart, 5.CATPart 有连结关系
#若将 4.CATPart 另存为 5.CATPart而且选取 [另存如新] 选项,则是 1.CATProduct, 2.CATPart, 3.CATPart, 4.CATPart 有连结关系
#若是将 1.CATProduct 另存为 01.CATProduct而且选取 [另存如新] 选项, 则 01.CATProduct 与2.CATPart, 3.CATPart, 4.CATPart 仍有连结关系,若于此时修改其下的 CATPart 则 1.CATProduct亦会有修正
*.若是要建立副本,请用 档案/传送/目录 的功能
基本上转出组立件的话,只要使用 stp214 就可以了,不用一个一个零件转出
若是真的要一个一个转出,目前没有好方法,不过可以用 VB 写个 批次转文件的程序也可以达成!
Publish在设计中是非常有用的,它可以加速后续设计人员对产品的理解,使我们在大装配中方便地查找到自己需要的参考元素,以提高设计效率。其次在装配设计中,使用Publish做定位,可以实现不同部件的替换,而保持起装配关系不变;而在零件设计中,使用仅参考Publish元素可以减少和外部元素的父子关系,避免设计变更时引起的特征失效。
关于做曲面,谈谈一点心得。
我觉得无论是CATIA或则其它软件,做曲面前规划曲面很重要,不能画到哪里是哪里,先构建基面和大过度面等,再添加细微特征和圆角特征等。
我们都会发现一般国外过来的数据都十分轨整,即使打上UV线,UV线的流向都十分整齐,而一般国外的数据都常常保留理论交线,这都是具备完整规划的曲面才可以做出类似“铁线尖角”模型
通常经过规划的曲面模型,其曲面质量肯定是比较好。最忌讳的是利用一个曲面来表现很多特征,无论是数据交换还是曲面质量一定会遇到不少麻烦。
实体也有同样的道理,先规划大轮廓,再做挖取部分,不要想起挖个洞就挖一个洞,想起补一块再补一块。
解决方式︰PDM1 模块 or 设定权限
*. 若有甲乙二部计算机中在同样的磁盘中有同样的名称及档名 ex:二部的计算机中皆有 d:\123\1.CATProduct, 2.CATPart, 3.CATPart, 4.CATPart(此为一个组立件互有连结) ,若从甲计算机开启乙计算机中的 1.CATProduct,则会连结到甲计算机的 2.CATPart, 3.CATPart, 4.CATPart 此为连结的错误
解决方式 : 工具/选项/一般/文件/将"储存名称"设定为 [否]
*.另存与另存如新的差别︰
有一组立件为 1.CATProduct, 2.CATPart, 3.CATPart, 4.CATPart
#若将 4.CATPart 另存为 5.CATPart, 此时是 1.CATProduct, 2.CATPart, 3.CATPart, 5.CATPart 有连结关系
#若将 4.CATPart 另存为 5.CATPart而且选取 [另存如新] 选项,则是 1.CATProduct, 2.CATPart, 3.CATPart, 4.CATPart 有连结关系
#若是将 1.CATProduct 另存为 01.CATProduct而且选取 [另存如新] 选项, 则 01.CATProduct 与2.CATPart, 3.CATPart, 4.CATPart 仍有连结关系,若于此时修改其下的 CATPart 则 1.CATProduct亦会有修正
*.若是要建立副本,请用 档案/传送/目录 的功能
基本上转出组立件的话,只要使用 stp214 就可以了,不用一个一个零件转出
若是真的要一个一个转出,目前没有好方法,不过可以用 VB 写个 批次转文件的程序也可以达成!
Publish在设计中是非常有用的,它可以加速后续设计人员对产品的理解,使我们在大装配中方便地查找到自己需要的参考元素,以提高设计效率。其次在装配设计中,使用Publish做定位,可以实现不同部件的替换,而保持起装配关系不变;而在零件设计中,使用仅参考Publish元素可以减少和外部元素的父子关系,避免设计变更时引起的特征失效。
关于做曲面,谈谈一点心得。
我觉得无论是CATIA或则其它软件,做曲面前规划曲面很重要,不能画到哪里是哪里,先构建基面和大过度面等,再添加细微特征和圆角特征等。
我们都会发现一般国外过来的数据都十分轨整,即使打上UV线,UV线的流向都十分整齐,而一般国外的数据都常常保留理论交线,这都是具备完整规划的曲面才可以做出类似“铁线尖角”模型
通常经过规划的曲面模型,其曲面质量肯定是比较好。最忌讳的是利用一个曲面来表现很多特征,无论是数据交换还是曲面质量一定会遇到不少麻烦。
实体也有同样的道理,先规划大轮廓,再做挖取部分,不要想起挖个洞就挖一个洞,想起补一块再补一块。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条