java htmlparser 获取网页title
一直以来,编程始终是我的爱好。也使用python写了几个实用的工具。java的高性能是出了名的,作为SEO人员,如果能够从零开始实现一个搜索引擎,对以后的SEO工作肯定有很大的帮助。搜索引擎爬虫要收录一个网页,首先不就是获取网页内容来进行处理的嘛。
package htmlparserTest;
// 下载 htmlparser库并导入
import org.htmlparser.Parser;
import org.htmlparser.visitors.HtmlPage;
public class GetTitle {
public static void main(String[] args) throws Exception {
new GetTitle().getTitle("https://www.yangshengliang.com");
}
private void getTitle(String url) throws Exception
{
Parser parser = new Parser(url);
//编码
parser.setEncoding(parser.getEncoding());
// 获取页面
HtmlPage htmlpage = new HtmlPage(parser);
parser.visitAllNodesWith(htmlpage);
// 获取 title
String title = htmlpage.getTitle();
// 输出title
System.out.println(title);
}
}
程序经测试是没有问题的,使用的环境是java8,其他版本的java 下未做测试。
更多阅读
- 宇秀搜索引擎下拉与相关搜索营销系统升级6.08 增加渠道控制标签【功能添加】
- 宇秀下拉 2024-8-2号下拉更新案例
- 做SEO需要什么技能?十大技能提升SEO技术
- electron 报错 Error: Electron failed to install correctly, please delete node_modulees/electron and try installing again
- 百度竞价采集与排名查询助手2.5.6
- drupal 7判断用户是否已登陆 附代码
- Linux (gvim:6883): Gtk-WARNING **: Invalid input string错误解决
- 宇秀搜索引擎下拉与相关搜索营销系统 6.457 更新发布
- 宇秀下拉 2020-11-3下拉更新案例
- 网站没有快照 点击百度快照直接进入源网站了,是什么原因?

qq:1535604235


QQ
微信
商店