2

我正在尝试从 http://aula.au.dk/main/document/document.php?action=download&id=%2F%D8velsesvejledning+2012.pdf下载文件, 但它似乎不是 pdf,当我尝试使用此代码下载它时

import java.io.*;
import java.net.*;

public class DownloadFile {

public static void download(String address, String localFileName) throws IOException {
    URL url1 = new URL(address);

    byte[] ba1 = new byte[1024];
    int baLength;
    FileOutputStream fos1 = new FileOutputStream(localFileName);

    try {
        // Contacting the URL
        System.out.print("Connecting to " + url1.toString() + " ... ");
        URLConnection urlConn = url1.openConnection();

        // Checking whether the URL contains a PDF
        if (!urlConn.getContentType().equalsIgnoreCase("application/pdf")) {
            System.out.println("FAILED.\n[Sorry. This is not a PDF.]");
        } else {
            try {

                // Read the PDF from the URL and save to a local file
                InputStream is1 = url1.openStream();
                while ((baLength = is1.read(ba1)) != -1) {
                    fos1.write(ba1, 0, baLength);
                }
                fos1.flush();
                fos1.close();
                is1.close();


            } catch (ConnectException ce) {
                System.out.println("FAILED.\n[" + ce.getMessage() + "]\n");
            }
        }

    } catch (NullPointerException npe) {
        System.out.println("FAILED.\n[" + npe.getMessage() + "]\n");
    }
}
}

你能帮帮我吗?

4

3 回答 3

1

http://aula.au.dk/main/document/document.php?action=download&id=%2F%D8velsesvejledning+2012.pdf不是pdf。该网站给出了一个错误,这就是脚本不起作用的原因:

第 70 行文件 /data/htdocs/dokeos184/www/main/inc/tool_navigation_menu.inc.php 中的 SQL 错误

于 2012-10-18T23:15:12.823 回答
0

2 个库的 2 步过程。

// 1. Use Jsoup to get the response.
Response response= Jsoup.connect(location)
                   .ignoreContentType(true)
                   // more method calls like user agent, referer, timeout 
                   .execute();

// 2. Use Apache Commons to write the file 
FileUtils.writeByteArrayToFile(new File(path), response.bodyAsBytes());
于 2013-11-29T11:19:16.333 回答
0

正如 Marti 所说,问题的根本原因是脚本失败。我在一个有效的 pdf 链接上测试了你的程序,它工作得很好。

在这种情况下,这对您没有帮助,但是HttpURLConnection是 URLConnection 的一个特殊子类,它使与 http 服务器的通信变得更加容易 - 例如直接访问错误代码等。

HttpURLConnection urlConn = (HttpURLConnection) url1.openConnection();
// check the responsecode for e.g. errors (4xx or 5xx) 
int responseCode = urlConn.getResponseCode();
于 2012-10-18T23:08:20.483 回答