1) group-avarage cluster
类平均聚类分析
2) unweighted pair group average
类平均聚类
4) K-means clustering analysis
K均值聚类分析
1.
Traditional K-means clustering analysis is sensitive to the initial central points.
传统的K均值聚类分析对于初始聚类的中心点比较敏感,借助于遗传算法能够搜索到全局最优解的特点,可以克服传统方法的缺点。
5) cluster analysis
聚类分析
1.
Application of Cluster Analysis in the Judgment of the Aluminum Electrolyzer's Status;
聚类分析在铝电解槽况判断中的应用
2.
Water quality and cluster analysis of Huaihe River Basin in 2004;
2004年淮河流域水质状况和聚类分析
3.
Failure analysis of drill stem based on support vector machine and cluster analysis theory;
基于支持向量机和聚类分析理论的钻具失效分析方法
6) clustering analysis
聚类分析
1.
Fuzzy clustering analysis of body type in 2D non-contacted body measurement system;
二维非接触人体测量中体型的模糊聚类分析
2.
Study on ranking standard of enterprise occupational injury risk based on clustering analysis of SPSS;
基于SPSS聚类分析的企业职业伤害风险分级标准研究
3.
Study on eco-environment quality assessment based on factor and clustering analysis;
基于因子分析和聚类分析的生态环境质量评价
补充资料:聚类分析
研究变量群分类的统计技术。又称 R型聚类分析。社会研究中,一个概念往往要通过一组指标(或变量)来测量。例如,研究婚姻中的择偶标准问题,往往通过一系列的问题或变量,如年龄、文化、专业、爱好、性情、身高、人品、气质、家庭背景等等,来研究人们择偶中的价值观。这些变量不是互不相关的,有些甚至高度相关。因此,可通过聚类分析把众多变量聚合为若干类。聚类分析适合于各种层次的变量。根据聚类的准则不同,聚类分析可分作距离法和相关系数法。
距离法 通过变量间的距离来度量聚类中的相似性。距离愈短,相似性愈佳,愈可合并为一类。在距离法中,变量被看作x 维空间的一个点,常用的欧氏距离是:
式中dij为变量xi和变量xj的距离;xik为第k个个案在变量xi上的观测值;xjk为第k个个案在变量xj上的观测值;x为个案数。
根据计算的距离dij,常采用谱系聚类法把变量间关系理顺成谱。它的基本思想是先把 P个变量各自看作一类,然后选择距离最小的合并为一新类;再计算新类和其他类的距离;再将距离最近的合并为新的一类,这样每次减少一类,直至所有变量成为一类为止。(见图)
相关系数法 通过变量间的相关系数来度量聚类中的相似性。相关系数不限于定距变量的积矩相关系数 r。如果是定类变量,可采用&λ系数或τ系数。根据相关系数作谱系聚类时,与距离法不同,它首先将相关系数最大的合并为一类,然后再逐步合并,直至所有变量成为一类的谱系图。
根据谱系聚类的结果,应划分为n类(或n组),一般用归类系数B来判断:
B应大于 1。也有的社会学家推荐B≥1.30作为分组的准则。
如果研究个案群的聚类,则称Q型聚类分析。这时只须把调查的x个个案,当作x个变量,分析方法与R型聚类分析完全相同。
参考书目
张尧庭、方开泰:《多元统计分析引论》,科学出版社,北京,1980。
距离法 通过变量间的距离来度量聚类中的相似性。距离愈短,相似性愈佳,愈可合并为一类。在距离法中,变量被看作x 维空间的一个点,常用的欧氏距离是:
式中dij为变量xi和变量xj的距离;xik为第k个个案在变量xi上的观测值;xjk为第k个个案在变量xj上的观测值;x为个案数。
根据计算的距离dij,常采用谱系聚类法把变量间关系理顺成谱。它的基本思想是先把 P个变量各自看作一类,然后选择距离最小的合并为一新类;再计算新类和其他类的距离;再将距离最近的合并为新的一类,这样每次减少一类,直至所有变量成为一类为止。(见图)
相关系数法 通过变量间的相关系数来度量聚类中的相似性。相关系数不限于定距变量的积矩相关系数 r。如果是定类变量,可采用&λ系数或τ系数。根据相关系数作谱系聚类时,与距离法不同,它首先将相关系数最大的合并为一类,然后再逐步合并,直至所有变量成为一类的谱系图。
根据谱系聚类的结果,应划分为n类(或n组),一般用归类系数B来判断:
B应大于 1。也有的社会学家推荐B≥1.30作为分组的准则。
如果研究个案群的聚类,则称Q型聚类分析。这时只须把调查的x个个案,当作x个变量,分析方法与R型聚类分析完全相同。
参考书目
张尧庭、方开泰:《多元统计分析引论》,科学出版社,北京,1980。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条