-5

我正在开发一个项目,我有一个模块,我需要在其中编写一个 Java 程序来读取 html 页面并将其 HTML 代码保存在文本文件中。请任何人都可以提供上述程序.......

4

2 回答 2

4

看看http://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html 你甚至不需要外部库。将此与 Bufferedwriter 结合使用:

import java.net.*;
import java.io.*;
import java.util.*;

public class URLReader {

    public static void main(String[] args) throws Exception {

        URL oracle = new URL("http://www.oracle.com/");
        BufferedReader in = new BufferedReader(
        new InputStreamReader(oracle.openStream()));
        BufferedWriter writer = new BufferedWriter(new FileWriter("outputfile.txt"));

        String inputLine;
        while ((inputLine = in.readLine()) != null){
            try{
                writer.write(inputLine);
            }
            catch(IOException e){
                e.printStackTrace();
                return;
            }
        }
        in.close();
        writer.close();
    }
}
于 2012-11-01T11:59:05.287 回答
0

您可以使用 HTMLParser 完成此任务,请在此处阅读

于 2012-11-01T11:58:09.327 回答