您现在的位置:首页 >> 前端 >> 内容

HTMLParseer 获取标签内容

时间:2015/2/9 11:17:51 点击:

  核心提示:Parser parser = Parser.createParser(content,'utf-8') ; HtmlPage nowpage = new HtmlPage(parser); try ...
Parser parser = Parser.createParser(content,"utf-8") ;
	HtmlPage nowpage = new HtmlPage(parser);
	try
	{ 
		parser.visitAllNodesWith(nowpage);
		}
	catch (ParserException e1)	{
		e1 = null;
		}
	NodeList nodelist = nowpage.getBody();
	System.out.println(nodelist) ;
	NodeFilter filter = new TagNameFilter("Meta");
	nodelist = nodelist.extractAllNodesThatMatch(filter, true);
	System.out.println(nodelist.size() + "***");
	for (int i = 0; i < nodelist.size(); i++)
	{
	LinkTag link=(LinkTag) nodelist.elementAt(i);
	System.out.println(link.getAttribute("keywords") + "***");
	}

Tags:HT TM ML LP 
作者:网络 来源:水慕清风