1) HTML tree
HTML树
1.
A new web page analysis method is proposed,which can recognize web page content according to the number of Chinese punctuations and HTML tree structure.
基于此提出了一种将中文标点符号和HTML树结构作为识别网页正文内容重要特征的网页分析方法,通过统计中文标点符号确定部分正文信息,然后根据正文信息在结构上的相似性确定其他正文信息内容。
2) HTML structure tree
HTML结构树
1.
Firstly, a method based on HTML structure tree was proposed aiming at the difficulty of detecting list information and the bother of extracting single list information.
首先,针对具有各种不同标记的列表信息定位困难与单条列表信息提取繁琐问题,提出了基于HTML结构树的一体化解决方案。
3) tree Walking
HTML DB
6) HTML/XML parsing
HTML/XML解析
补充资料:[3-(aminosulfonyl)-4-chloro-N-(2.3-dihydro-2-methyl-1H-indol-1-yl)benzamide]
分子式:C16H16ClN3O3S
分子量:365.5
CAS号:26807-65-8
性质:暂无
制备方法:暂无
用途:用于轻、中度原发性高血压。
分子量:365.5
CAS号:26807-65-8
性质:暂无
制备方法:暂无
用途:用于轻、中度原发性高血压。
说明:补充资料仅用于学习参考,请勿用于其它任何用途。
参考词条