1) access path analysis
频繁路径分析
2) Distributed Frequency Paths
分布频繁路径
3) frequent path
频繁路径
1.
Based on the analysis on the procedure and algorithm of Web frequent access pattern mining, the more general incremental updating algorithms of local frequent paths (LFP) and global frequent paths (GFP) in a distributed database system based on DWLMS are proposed for discovering the frequent access paths.
根据对挖掘过程及算法进行分析,提出了一种基于DWLMS的局部频繁路径的更新算法LFP和全局频繁路径的更新算法GFP,较好地解决了Web访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难。
4) Frequent Path Tree
频繁路径树
1.
(b) From Frequency Path Tree, mining Frequent Path Tree which is user’s query model.
技术要点是:(a)提取用户查询记录文档生成频度路径树,(b)根据频度路径树挖掘频繁路径树(即用户查询模式),(c)利用用户查询模式对源XML文件进行投影,生成缓存。
5) common frequent path
最大频繁路径
1.
The algorithm can be modified a little to generate FrePathMiner algorithm and FreTreeMiner algorithm,which can be respectively used to mine common frequent path and common frequent tree.
首先介绍一种挖掘XML文档中所有嵌入频繁子树的算法SSTMiner,对SSTMiner算法进行修改,得到FrePathMiner算法和FreTreeMiner算法,分别用于挖掘XML文档中最大频繁路径和最大频繁子树,在此基础上,提出一种凝聚的层次聚类算法XMLCluster,分别以最大频繁路径和最大频繁子树作为XML文档的特征,对文档进行聚类。
6) frequent access paths
频繁访问路径
1.
Similar customer groups, relevant Web pages and frequent access paths can be discovered by analyzing Web log files.
通过对Web服务器日志文件进行分析,可以发现相似客户群体、相关Web页面和频繁访问路径。
2.
Similar customer groups ,relevant WEB pages and frequent access paths can be discovered by analyzing of WEB log files.
通过对WEB服务器日志文件进行分析,可以发现相似的客户群体、相关WEB页面以及频繁访问路径。
3.
Similar customer groups, relevant Web pages, and frequent access paths can be discovered by analyzing of Web log files and customer database.
通过对 Web服务器日志文件和客户交易数据进行分析 ,可以发现相似客户群体、相关 Web页面和频繁访问路径 。
补充资料:路径分析
一种研究多个变量之间多层因果关系及其相关强度的方法。由美国遗传学家S.赖特于1921年首创,后被引入社会学的研究中,并发展成为社会学的主要分析方法之一。路径分析的主要目的是检验一个假想的因果模型的准确和可靠程度,测量变量间因果关系的强弱,回答下述问题:①模型中两变量xj与xi间是否存在相关关系;②若存在相关关系,则进一步研究两者间是否有因果关系;③若xj影响xi,那么xj是直接影响xi,还是通过中介变量间接影响或两种情况都有;④直接影响与间接影响两者大小如何。
路径分析的主要步骤是:①选择变量和建立因果关系模型。这是路径分析的前提。研究人员多用路径图形象地将变量的层次,变量间因果关系的路径、类型、结构等,表述为所建立的因果模型。下图是5个变量因果关系的路径。
图中带箭头的直线"→"连接的是具有因果关系的两个变量,箭头的方向与因果的方向相同;当两变量只有相关关系而无因果关系时,用弧线双向箭头表示。图中变量分为:a.外生变量。因果模型中只扮演因,从不扮演果的变量,是不受模型中其他变量影响的独立变量,如x1与 x2。b.内生变量。模型中既可为因又可为果的变量,其变化受模型中其他变量的影响,如x3、x4与x5。c.残差变量。来自因果模型之外的影响因变量的所有变量的总称,如e3、e4、e5。
若变量间的关系是线性可加的,则图中的因果模型可用3个标准化多元线性回归方程表示:
pij 称为由xj到xi的路径系数,它表示xj与xi间因果关系的强弱,即当其他变量均保持不变时,变量xj对变量xi的直接作用力的大小。称为残差路径系数,它表示所有自变量所不能解释的因变量的变异部分,其大小对于因果模型的确定有重要作用。
②检验假设。路径分析要以下列假定为前提:a.变量间的因果关系是单向的,不具有反馈性,又称递归模型;b.变量间具有线性可加关系;c.变量具有等距以上测量尺度;d.所有误差均为随机的,外生变量无测量误差;e.所有内生变量的误差变量间及与内生变量有因果关系的所有自变量间无相关。当某些假定,如递归性或变量的测量尺度不满足时,要做适当的处理才能应用路径分析。
③估计参数。首先计算路径系数与残差路径系数,然后计算两变量间相关系数rji。此外,要计算两变量间总因果作用力,包括变量xj对xi的直接作用力、xj经中间变量而对xi的间接作用力两部分。例如,上图的因果模型中,x1对x5的总作用力由直接作用力p51和间接作用力构成。这两部分作用力的大小可由两变量间的相关系数rij的分解得到。最后还要计算决定系数嵀,它表示所有作用于xi的自变量所能解释xi变异量的比例。公式是:
④评估因果模型。评估的主要指标是:a. 嵀,若嵀太小,则要考虑是否需要增加新的自变量,以保证模型精度。b.,一个理想的因果模型应当很小,当它很大时,则有必要重新估计此因果路径,也可由公式计算。c.进行F检验。
式中Q为残差平方和,U为回归平方和,N为样本数,K为变量数,检验不显著时要修改模型。
路径分析是多元回归分析的延伸,与后者不同的是:①路径分析间的因果关系是多层次的,因果变量之间加入了中介变量,使路径分析模型较一般回归模型对于现实因果关系的描述更丰富有力。②路径分析不是运用一个而是一组回归方程,在分析时更应注意保证各方程式所含意义的一致性。
路径分析的主要步骤是:①选择变量和建立因果关系模型。这是路径分析的前提。研究人员多用路径图形象地将变量的层次,变量间因果关系的路径、类型、结构等,表述为所建立的因果模型。下图是5个变量因果关系的路径。
图中带箭头的直线"→"连接的是具有因果关系的两个变量,箭头的方向与因果的方向相同;当两变量只有相关关系而无因果关系时,用弧线双向箭头表示。图中变量分为:a.外生变量。因果模型中只扮演因,从不扮演果的变量,是不受模型中其他变量影响的独立变量,如x1与 x2。b.内生变量。模型中既可为因又可为果的变量,其变化受模型中其他变量的影响,如x3、x4与x5。c.残差变量。来自因果模型之外的影响因变量的所有变量的总称,如e3、e4、e5。
若变量间的关系是线性可加的,则图中的因果模型可用3个标准化多元线性回归方程表示:
pij 称为由xj到xi的路径系数,它表示xj与xi间因果关系的强弱,即当其他变量均保持不变时,变量xj对变量xi的直接作用力的大小。称为残差路径系数,它表示所有自变量所不能解释的因变量的变异部分,其大小对于因果模型的确定有重要作用。
②检验假设。路径分析要以下列假定为前提:a.变量间的因果关系是单向的,不具有反馈性,又称递归模型;b.变量间具有线性可加关系;c.变量具有等距以上测量尺度;d.所有误差均为随机的,外生变量无测量误差;e.所有内生变量的误差变量间及与内生变量有因果关系的所有自变量间无相关。当某些假定,如递归性或变量的测量尺度不满足时,要做适当的处理才能应用路径分析。
③估计参数。首先计算路径系数与残差路径系数,然后计算两变量间相关系数rji。此外,要计算两变量间总因果作用力,包括变量xj对xi的直接作用力、xj经中间变量而对xi的间接作用力两部分。例如,上图的因果模型中,x1对x5的总作用力由直接作用力p51和间接作用力构成。这两部分作用力的大小可由两变量间的相关系数rij的分解得到。最后还要计算决定系数嵀,它表示所有作用于xi的自变量所能解释xi变异量的比例。公式是:
④评估因果模型。评估的主要指标是:a. 嵀,若嵀太小,则要考虑是否需要增加新的自变量,以保证模型精度。b.,一个理想的因果模型应当很小,当它很大时,则有必要重新估计此因果路径,也可由公式计算。c.进行F检验。
式中Q为残差平方和,U为回归平方和,N为样本数,K为变量数,检验不显著时要修改模型。
路径分析是多元回归分析的延伸,与后者不同的是:①路径分析间的因果关系是多层次的,因果变量之间加入了中介变量,使路径分析模型较一般回归模型对于现实因果关系的描述更丰富有力。②路径分析不是运用一个而是一组回归方程,在分析时更应注意保证各方程式所含意义的一致性。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条