它被设计的小,快速,灵活而且独立。HtmlCleaner也可用在Java代码中,当命令行工具或Ant任务。解析后编程轻量级文档对象,能够很容易的被转换到DOM或者JDom标准文档,或者通过各种方式(压缩,打印)连续输出XML。手机锁屏软件下载-滑动解锁(滑动锁屏软件)3.3 安卓最新版【手机锁屏软件】
写一个测试用的html文件:html-clean-demo.html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd " >
< html xmlns = "http://www.w3.org/1999/xhtml " xml:lang = "zh-CN" dir = "ltr" >
< head >
< meta http-equiv = "Content-Type" content = "text/html; charset=GBK" />
< meta http-equiv = "Content-Language" content = "zh-CN" />
< title > html clean demo </ title >
</ head >
< body >
< div class = "d_1" >
< ul >
< li > bar </ li >
< li > foo </ li >
< li > gzz </ li >
</ ul >
</ div >
< div >
< ul >
< li > < a name = "my_href" href = "1.html" > text-1 </ a > </ li >
< li > < a name = "my_href" href = "2.html" > text-2 </ a > </ li >
< li > < a name = "my_href" href = "3.html" > text-3 </ a > </ li >
< li > < a name = "my_href" href = "4.html" > text-4 </ a > </ li >
</ ul >
</ div >
</ body >
</ html >
Html代码
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="zh-CN" dir="ltr">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=GBK"/>
<meta http-equiv="Content-Language" content="zh-CN"/>
<title>html clean demo</title>
</head>
<body>
<div class="d_1">
<ul>
<li>bar</li>
<li>foo</li>
<li>gzz</li>
</ul>
</div>
<div>
<ul>
<li><a name="my_href" href="1.html">text-1</a></li>
<li><a name="my_href" href="2.html">text-2</a></li>
<li><a name="my_href" href="3.html">text-3</a></li>
<li><a name="my_href" href="4.html">text-4</a></li>
</ul>
</div>
</body>
</html>
模拟需求:取出title,name="my_href"的链接,div的class="d_1"下的所有li内容。下面用htmlcleaner写代码,HtmlCleanerDemo.java
package com.chenlb;
import java.io.File;
import org.htmlcleaner.HtmlCleaner;
import org.htmlcleaner.TagNode;
/**
* htmlcleaner 使用示例.
*
* @author chenlb 2008-11-26 下午02:12:02
*/
public class HtmlCleanerDemo {
public static void main(String[] args) throws Exception {
HtmlCleaner cleaner = new HtmlCleaner();
TagNode node = cleaner.clean(new File( "html/html-clean-demo.html" ), "GBK" );
//按tag取.
Object[] ns = node.getElementsByName("title" , true ); //标题
if (ns.length > 0 ) {
System.out.println("title=" +((TagNode)ns[ 0 ]).getText());
}
System.out.println("ul/li:" );
//按xpath取
ns = node.evaluateXPath("//div[@class='d_1']//li" );
for (Object on : ns) {
TagNode n = (TagNode) on;
System.out.println(" text=" +n.getText());
}
System.out.println("a:" );
//按属性值取
ns = node.getElementsByAttValue("name" , "my_href" , true , true );
for (Object on : ns) {
TagNode n = (TagNode) on;
System.out.println(" href=" +n.getAttributeByName( "href" )+ ", text=" +n.getText());
}
}
}
Java代码
package com.chenlb;
import java.io.File;
import org.htmlcleaner.HtmlCleaner;
import org.htmlcleaner.TagNode;
/**
* htmlcleaner 使用示例.
*
* @author chenlb 2008-11-26 下午02:12:02
*/
public class HtmlCleanerDemo {
public static void main(String[] args) throws Exception {
HtmlCleaner cleaner = new HtmlCleaner();
TagNode node = cleaner.clean(new File("html/html-clean-demo.html"), "GBK");
//按tag取.
Object[] ns = node.getElementsByName("title", true); //标题
if(ns.length > 0) {
System.out.println("title="+((TagNode)ns[0]).getText());
}
System.out.println("ul/li:");
//按xpath取
ns = node.evaluateXPath("//div[@class='d_1']//li");
for(Object on : ns) {
TagNode n = (TagNode) on;
System.out.println(" text="+n.getText());
}
System.out.println("a:");
//按属性值取
ns = node.getElementsByAttValue("name", "my_href", true, true);
for(Object on : ns) {
TagNode n = (TagNode) on;
System.out.println(" href="+n.getAttributeByName("href")+", text="+n.getText());
}
}
}
cleaner.clean()中的参数,可以是文件,可以是url,可以是字符串内容。个人认为:比较常用的应该是evaluateXPath、getElementsByAttValue、getElementsByName方法了。另外说明下,htmlcleaner对不规范的html兼容性比较好。
1.HtmlCleaner的文档对象模型拥有了一些函数,处理节点和属性,所以在序列化之前搜索或者编辑是非常容易的。
2.提供基本HtmlCleanerDOM的XPath支持
3.使用XML配置文件让创建定制tag变得更加容易
4.修复多个bug以及API改进
HtmlCleaner是一个免费开源的适用范围广的Java语言Html文档解析器,它能重新整理HTML文档的每个元素并生成结构良好(Well-Formed)的HTML文档。默认它遵循的规则是类似于大部份web浏览器为创文档对象模型所使用的规则,户可以提供自定义tag和规则组来进行过滤和匹配。
ag系列怎么选 世界杯买球贵吗 白岩松谈体育 体育颂的作者是 体育足球英超展开内容
XDA助手下载-XDA助手2.3.2 官方最新版
遗失的音符ios下载-遗失的音符1.0苹果版
手机测量米数软件下载-尺規(米数测量仪手机版)3.32最新版
大发农场app1.3.3 安卓版
跑跑面包人游戏下载-跑跑面包人(Bread Run)1.0.1 安卓版
97剧迷app下载安装-97剧迷app1.5.5.9 官方正版
公主的新生宝宝游戏下载-公主的新生宝宝游戏2.1最新版
猎杀像素鸟手游1.4 安卓版
侠客短视频解析下载-侠客短视频解析app4.1.7 最新版
tplink安防系统app下载-TP-LINK安防(TPLINK物联)5.11.5.1736 官方版
像样儿教师端软件1.0 安卓版
永夜幻想纯享版手游下载-永夜幻想最新版1.0内购版
末日方舟下载-末日方舟手机版1.0.9965 官方版
圈子账本记账app下载-圈子账本记账手机版4.9.1 安卓最新版
中泰证券期权宝模拟系统下载-中泰证券期权宝软件2.9.1.2.0 最新版
9.5/1,833.0M
梦仙是一款经典仙侠手游,上古唯美的仙侠景象,引人入胜的仙侠故事,快来感受热血竞技的乐趣!梦仙特色:1、激情畅快的连招技能,多种技能搭配,体验最刺激的连击,一连到...
8.9/1,755.2M
逍遥春秋飞升版国风唯美意境的仙侠美景,每一帧的画面都十分精美,令人如痴如醉,精彩有趣的多样副本任务,与BOSS展开一场燃情激斗,获胜得丰厚大奖。逍遥春秋飞升版亮...
ZOODomino(动物园连连看看)v1.0 绿色便携破解版
9.1/1,383.6M
一款老少咸宜的动物连连看游戏,界面豪华漂亮,绿色便携。游戏中,玩家要通过对动物方块的相同匹配,去解救即将落入变色龙口中的小昆虫。玩家要做出快速的消除才能阻止昆虫...
9.2/922.0M
MMA格斗是一款社区类型的软件,你可以在上面找到众多格斗的比赛事项,可以与志同道合的朋友们一起交流,当然了你也可以寻找到众多的短视频应用!MMA格斗怎么使用下载...
7.7/1,952.3M
搜罗南北特色菜,边开餐厅边闯关,快来试一试!阳光餐厅官方正版下载提现版,真的可以玩游戏来赚钱的小游戏,这里你只要点点点就可以完成游戏李曼的任务得到红包奖励了,快...
7.8/1,361.1M
家居一周年庆典psd海报素材大小是32.462MB,尺寸为2953x3543。格式是psd,适用于家具行业的庆典,适用于各种宣传海报,可以说十分精准,喜欢就来下...
鲸看Pro安卓版下载-鲸看Pro正版官方下载2.1.1 最新版
8.6/1,983.3M
这是一款免费无广的聚合影视安卓版本资源,支持手机免费在线搜索一级高清观看自己喜欢的最新的热门影视资源,随便打开就可以开始追剧了,院线大片,精彩剧集,还有国外欧美...
9.4/404.2M
电击枪恶搞软件是一款好玩的手机恶搞软件,让你的手机变成恶搞电击枪,用户只需要触摸屏幕就可以控制电击枪震动,发出声音几闪光,出其不意的拿到朋友面前一定会吓他一跳的...
9.9/587.7M
精品数据恢复软件注册机是一款专业数据恢复水准的文件恢复软件,电脑上不管是什么原因造成的数据丢失,都可以通过此软件找回,有需要的朋友赶紧下载吧软件介绍精品数据恢复...
滴答滴答双人故事中文下载-滴答滴答双人故事十八汉化版0.1.1 安卓手机版
8.1/1,703.5M
需要两人配合来体验的解谜游戏,滴答滴答双人故事十八汉化版是由十八汉化组完整汉化,游戏的剧情做的非常好,要两人协作完成,很有创意的设计,画风优美,很有特色。汉化说...
弹跳英雄ios下载-弹跳英雄手游苹果版(Bouncy Hero)1.1.8 苹果官方版
10.0/1,081.1M
弹跳英雄手游苹果版也是一款不一样带有沙盒类型的跑酷类型的手游,有需要的用户现在就可以来直接的免费下载,应该还是非常的不错以及好玩的!弹跳英雄手游苹果版玩法攻略在...
8.5/256.8M
《风之大陆》手游在美术方面表现出色,画风、画面、建模甚至音乐都堪称手游市场上一流的存在。然而,在游戏性方面则表现中规中矩,没有太大的亮点也没有明显的缺陷。对于喜...
8.4/1,162.9M
蝙蝠侠系列一直都是ACT的典范,动作非常到位,打斗爽快。此款修改器是为蝙蝠侠阿卡姆之城年度版制作,对应游戏版本v1.03,有五项修改功能,解压即可使用。游戏简介...
秦时明月世界内测下载ios-秦时明月世界手游下载ios1.0.637苹果版
8.1/1,548.9M
腾讯自研大秦世界MMO《秦时明月世界》手游正式与各位少侠见面!这是一款由腾讯研发,根据很多小伙伴都喜爱的动漫《秦时明月》的背景以及人物角色设定的来玩的新的手游,...
8.3/1,624.0M
飞车人生2是一款激情四射的赛车竞速手游,在巴音布鲁克赛道,也就是中国最顶级的拉力赛道,玩家选择好赛车之后与来自世界各地的赛车大神同场竞速,感受最极致的赛车竞技,...
iphone桌面下载中文版-安卓变iphone桌面下载8.6.9 安卓版
8.0/774.4M
安卓变iphone桌面下载是一款能将安卓手机桌面变成苹果桌面的软件,不管你用的是哪一款安卓智能手机,使用这款软件,你都能将桌面一秒变为苹果,连带操作方式也是如此...
9.6/782.8M
西游界是一款西游降魔题材的冒险手游,这是缤纷多彩的西游世界,千年的羁绊在这里展开,化身强者在这里闯出自己的天地!游戏特点:1、收集众多的西游神将陪你一起西天之行...
7.6/1,597.7M
贝塔书友会app是一款拥有海量小说资源的书籍阅读工具,这里用有各种类型的小说可供选择,包括玄幻、仙侠、都市、科幻、穿越等,手工排版,为你提供舒心的阅读感受,想要...
9.5/1,359.8M
无线徐州是一款徐州当地的资讯,通过这款软件可以让大家在手机上解决很多的事情,非常的方便。无线徐州软件功能1、让用户可以通过这款软件来进行了解徐州的事情,可以在手...
9.6/332.1M
云译通知识产权版是云译通软件中的一种,它的页面简洁友好,功能强大,专门针对知识产权类名词翻译,拥有专业的知识产权语料库,支持文档翻译,非常的方便,可以翻译多种语...
济宁公交app最新下载-济宁公交app1.4.1 官方安卓版
7.5/1,194.3M
济宁公交app是济宁市民出行必备软件,app上涵盖了本市所有的公交线路信息,并且能够显示公交车的具体位置,方便用户出门不等待,到站即上车,极大的缩短了用户出行的...
屏幕录像专家2014破解版-屏幕录像专家2014破解版附注册机Build0618 完美破解版
7.5/1,849.4M
想必很多人都知道屏幕录像专家是一款非常专业的屏幕录像制作软件,本次东坡小编为各位带来的是屏幕录像专家2014最新破解版附注册机,可以完美破解屏幕录像专家2014...
捣蛋大鹅模拟器下载正版-捣蛋大鹅模拟器手机版下载1.1.0 安卓版
8.7/951.7M
奇葩搞怪的大鹅模拟器,在大城市或乡村农场追逐人,粉碎物体和野生动物。成为松散的炮弹或疯狂的鹅,乐趣永无止境。可以击中任何农用拖拉机并在空中飞行,也可以击中任何非...
9.2/1,417.2M
狂飙地带2是一款汽车竞速手游,模拟真实赛车引擎,在汽车里驾驶,和现实中汽车里面的内饰一样,可以自由的切换驾驶的视角,在各种场景中奔驰。狂飙地带2...
平底锅的战场手游下载-平底锅的战场(Fry Pan Battleground)1.1.2 安卓版
7.5/791.1M
平底锅的战场(FryPanBattleground)是一款冒险生存游戏,在一个岛上,玩家需要用各种武器去击杀敌人,操作比较灵活,和敌人进行战斗。游戏玩法进入游戏...