1) Web page structure tree
网页结构树
1.
This paper proposes an algorithm that is used to construct the Web structure tree and a Web information extraction method based on Web page structure tree.
提出了网页结构树提取算法及基于网页结构树的Web信息抽取方法。
2) structure of web page
网页结构
1.
Also, the useful contents are retrieved using the structure of web page and saved into database.
该搜索代理以搜索引擎技术为核心,结合用户反馈信息和专业领域词汇,对特定领域进行划分,同时利用网页结构特征信息剖析有价值内容,并将提取的信息置于数据库中,以进行广泛应用。
4) tree-network structure
树网结构
1.
It also proposes the pattern of tree-network structure of urban green space based on the advantage and flaw of tree-type structure and network-type structure.
结合树型结构和网络结构的自身优势与缺陷,提出了城市绿地树网型结构模式,并对城市绿地树网结构的特征、优势和研究方向提出了建议。
5) Mining structures of Web pages
网页结构挖掘
6) replica detection
网页链接结构
补充资料:树结构
树结构
tree
s协明份got;树结构(t ree)由n(n异0)个结点的有限集合所构成的一种数据结构。当n~。时称为空树,非空树递归定义如下:①有且仅有一个称为根的结点;②其余结点可分为二(。)0)个互不相交的子集,其中每一个子集本身又是一棵树,称为根的子树。树结构在客观世界中广泛存在,也是程序设计中各种信息的重要组织~一。 树中的结点包含一个数据元素及若于指向其子树的分支。结点拥有的子树数(分支数)称为该结点的度,用石表示。度为o的结点称为叶或终端结点;度不为O的结点称为分支结点或非终端结点。树中各结点的度的最大值称为树的度。树是一种层次结构,结点的层次从根开始定义,根为第一层,若某结点在第艺层,则其子树的根为第i+1层。树中结点的最大层次称为树的深度或高度。若树中各结点的子树之间在逻辑上存在顺序关系的,则称该树为有序树;否则,称为无序树。 在计算机中,通常采用多链式存储结构来表示树结构。对树的操作有:①检索树中的结点;②遍历树中各结点,即按某种规则巡访树中每个结点,使得每个结点被访问一次且仅访问一次;③添加子树;④删除子树等。 在程序设计中较广泛使用的树结构有: (1)二叉树:度k毛2的有序树。二叉树与一般树(度龙>2的k叉树)之间存在一种一一对应的转换算法。在通常采用的用同构(等长)的多链式存储结构表示的树吟二叉树的密度最高·因此,二叉树除了本身有着广泛的用途外,还可以用作一般树的存储结构。 (2)霍夫曼(Huffman)树:带权路径长度最短的二叉树。带权路径长度是从根到树中所有带权叶子之间的路径长度与树的乘积之和。根据给定的一组权值,构造一棵相应的Huffman树的算法,称为Huffman算法。Huf如an树有着广泛的应用,如在解决某些判定问题时,利用Huffman树可以得到最佳的判定算法;在快速远距离通信中,可以得到编码长度最短的编码。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条