jsp“抓”网页代码的程序

2016-01-29 12:48 6 1 收藏

jsp“抓”网页代码的程序,jsp“抓”网页代码的程序

【 tulaoshi.com - Java 】

<%@ page contentType="text/html;charset=gb2312"%
<%

String sCurrentLine;

String sTotalString;

sCurrentLine="";

sTotalString="";

java.io.InputStream l_urlStream;

java.net.URL l_url = new java.net.URL("http://www.163.net/");

(本文来源于图老师网站,更多请访问http://www.tulaoshi.com/java/)

java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url.openConnection();

(本文来源于图老师网站,更多请访问http://www.tulaoshi.com/java/)

l_connection.connect();

l_urlStream = l_connection.getInputStream();

java.io.BufferedReader l_reader = new java.io.BufferedReader(new java.io.InputStreamReader(l_urlStream));

while ((sCurrentLine = l_reader.readLine()) != null)

{

sTotalString+=sCurrentLine;

}

out.println(sTotalString);

%

后记

  虽然代码比较简单,但是,我认为根据这个,可以实现“网络爬虫”的功能,比如从页面找href连接,然后再得到那个连接,然后再“抓”,不停止地(当然可以限定层数),这样,可以实现“网页搜索”功能。

来源:http://www.tulaoshi.com/n/20160129/1487625.html

延伸阅读
标签: Java JAVA基础
  <!-- JSP-Hitcounter counts sessions. Copyright (C) 2000 Jesper Schmitz Mouridsen. Visit www.webappcabaret/jsm2/webapps.jsp?find=jsphcs for more info. This program is free software; you can redistribute it and/or modify it under the terms of the GNU General Public License as published by the Free Software...
标签: Web开发
  生成有4个随机数字和杂乱背景的图片,数字和背景颜色会改变,服务器端刷新(用history.go(-1)也会变)     原型参考ALIBABA  http://china.alibaba.com/member/showimage     产生验证码图片的文件-----image.jsp     %@ page contentType="image/jpeg" import="java.awt.*,jav...
标签: Web开发
请问如何去掉主页右面的滚动条? body scroll="no" body style="overflow-y:hidden" ******************************** 怎样不使用页面的缓存?即每一次打开页面时不是调用缓存中的东西 META HTTP-EQUIV="Pragma" CONTENT="no-cache" ******************************** 请问如何忽视右键? body oncont...
标签: Web开发
ZZzzz~ may wind Iframe src="/URL" width="x" height="x" scrolling="[OPTION]" frameborder="x"/iframe src:文件的路径,既可是HTML文件,也可以是文本、ASP等; width、height:"画中画"区域的宽与高; scrolling:当SRC的指定的HTML文件在指定的区域不显不完时,滚动选项,如果设置为NO,则不出现滚动条;如...
标签: Web开发
1. 打开新的窗口并传送参数:  传送参数: response.write("<script>window.open('*.aspx?id="+this.DropDownList1.SelectIndex+"&id1="+...+"')</script>") 接收参数: string a = Request.QueryString("id"); string b = Request.QueryString("id1"); 2.为按钮添加对话框 Button1....

经验教程

537

收藏

23
微博分享 QQ分享 QQ空间 手机页面 收藏网站 回到头部