1) gene datasets classification
基因数据集分类
3) gene expression data classification
基因表达数据分类
1.
This paper aims to improve gene expression data classification method in two aspects,classifica- tion algorithm and feature selection.
从分类算法和特征基因选择两个方面研究基因表达数据的分类,将传统的Support Vector Machines(SVM)算法和K-nearest neighbor(KNN)算法两者结合成为一种应用于基因表达数据分类的算法,并针对基因表达数据分类数据集“样本少,维数高”的特点,提出了一种改进的基于相关性的递归特征消除算法(简称为C-RFE),消除了数据冗余。
4) gene data analysis
基因数据分析
5) cancer gene expression datasets
癌基因表达数据集
1.
New feature - extraction criterion and classification algorithm for cancer gene expression datasets;
适于癌基因表达数据集的新特征提取标准NFEC及其分类新算法研究
补充资料:数据分类
数据分类
data clasification
shuiu fenlei数据分类(data Clasification)根据数据项的属性(性能、特征、参数等),把它们分门别类和有系统地组织起来。 数据分类是根据信息处理的实际需要进行的,其目的是为了便于信息处理与管理。即将信息按某种属性或特征进行逻辑分类。把具某种共同特性、特征的信息分在同一类,按一定次序将这些信息分类排列成一个有机的体系。数据分类能够帮助我们了解信息的需求、结构、处理的顺序、编码及数据存储等。在数据分类的基础上进行数据编码,以达到便于计算机的信息处理和数据库管理的目标。 数据分类需要满足一定的条件:①分类结构在总体上必须具有很大的概括性和包容性,能够容纳这一领域所有的需要和将产生的信息。②分类要反映数据的特征和一定的逻辑顺序。③同位类之间相互排斥,界限清楚,不能交叉、重益,不能相互从属,即内容不能有互相包含。不能出现一个事物在同位类里可以归人这一类也可归于另一类的现象。④分类应该具有相对的稳定性,一个分类体系确定之后,应该保持较长时间的稳定。所以要求选择事物最稳定的属性或特征作为分类的基础;并且使分类体系有一定的柔性,既能满足目前的需要,又能为今后的发展留有扩充和删除之余地。⑤对于线分类系统,每一层级所包含的数据单元数,在同层级的各类之间尽可能均衡。⑥实用性,即分类名称尽量沿用习惯名称,不致于发生概念混淆。 数据分类基本用两种方法:线分法和面分法。线分法也就是层级分类法,串并联形式,树形结构;面分法为组配分类法,将信息按若干个属性、特征,分成彼此间互不依赖,互不相干的若干个面,每个面中又分成许多彼此独立的类目,使用时根据需要,将这些面中的类目组配在一起,形成一个具有类目,有固定次序的并联组合形式。 数据分类标准化是信息处理中的一项重要工作,特别在资源环境信息系统,由于实体复杂,内容广泛,涉及学科多,各学科对同一类的信息的认识和理解不一,所以标准化工作难度大。中国科学家经过多年努力,已经对气象、水文、土壤、植被、地形等多种资源环境实体的信息的分类工作作了系列研究,形成了一定的参考标准。(钟耳顺)
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条