java获取当前网页代码，java获取浏览器的地址

小程序：扫一扫查出行
【扫一扫了解最新限行尾号】
复制小程序

java得到请求来的页面HTML

页面：body form action=/。。

步骤：使用java.net包下的URL类，可以将一个网页（链接）封装成一个URL对象。

jsoup 是一款 Java 的HTML 解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于JQuery的操作方法来取出和操作数据。据说它是基于MIT协议发布的。

要求：要求能够实现给出任意带table表格的html文件，生成与表格相同内容的excel文件，附件可以作为测试文件，提供给定的roster.html文件，通过java代码，实现生成与html页面的table相同样式的roster.xls文件。

File input = new File(/tmp/input.html)；Document doc = Jsoup.parse(input， UTF-8， IP)；看看这个代码，调用 doc.text() 方法即可。

用 document.write()或者(#id).html= 的方式写到页面中，这个时候用浏览器查看源码是看不到数据的。

以下是一种常见的实现方式：导入相关的库：在Java项目中，可以使用Jsoup等第三方库来处理HTML页面，获取页面内容。发送HTTP请求：使用Java的网络请求库，如HttpClient或HttpURLConnection，发送HTTP请求获取网页内容。

步骤：使用java.net包下的URL类，可以将一个网页（链接）封装成一个URL对象。

根据java网络编程相关的内容，使用jdk提供的相关类可以得到url对应网页的html页面代码。针对得到的html代码，通过使用正则表达式即可得到我们想要的内容。

Java访问网络url，获取网页的html代码方式一：一是使用URL类的openStream()方法：openStream()方法与制定的URL建立连接并返回InputStream类的对象，以从这一连接中读取数据；openStream()方法只能读取网络资源。

在获取到的页面内容是字符串，这里解析有两个办法，一是通过dom4j把字符串转化为dom进行解析，这样最好，但是对方的页面未必规范，符合dom结构。二是通过解析字符串过滤你想要的内容，该方法比较繁琐，需要一些技巧。

java内部编码使用utf-16，需要先用网页的编码解析从网页获取的bytes数组，例如如果网页用gbk，转换可以写成new String(bytes，gbk)。

在Java中，使用HttpURLConnection即可连接URL，随后可以使用InputStreamReader获取网页内容文本。然后，使用正则表达式解析网页内容文本，找到所有的标签即实现需求。

不知道你是不是要实现抓取别人的页面进行输出……是的话，你可以试用下面的代码。本人不会Perl，就用java的servlet实现了。

最没有效率的判断方法就是使用inputStreamReader先把正页的html源码读取出来，之后截取charset后面编码。得到编码之后重新再读取一遍。但是效率很低。

关于java获取当前网页代码和java获取浏览器的地址的介绍到此就结束了，不知道你从中找到你需要的信息了吗？如果你还想了解更多这方面的信息，记得收藏关注本站。