2

我正在尝试在 Java 应用程序中创建一个代理,它允许我修改 HTTP 请求的某些方面。

为此,我在端口 8080 上打开一个 ServerSocket,在 Mozilla Firefox 中在该端口上配置一个代理,并且对于每个连接,在单独的线程中执行 ServerSocket 的 accept() 方法。到目前为止一切正常。

为了将请求从浏览器发送到相应的网站,我使用了 Java 11 中包含的 HttpClient 库。这是我使用该库的一段代码:

private void obtainResponse(Socket socket, IHttpRequest req, String uri) {

        HttpClient client = null;
        if (req.isSSL()) {
            SSLContext sslContext = ((SecureConnectionHandler)connHandler).createSSLContext( req.getHost() );
            client = HttpClient.newBuilder()
                    .connectTimeout(Duration.ofSeconds(30))
                    .priority(1)
                    .version(HttpClient.Version.HTTP_2)
                    .followRedirects(Redirect.NORMAL)
                    .sslContext( sslContext )
                    .build();
        }
        else
            client = HttpClient.newBuilder()
                    .connectTimeout(Duration.ofSeconds(30))
                    .priority(1)
                    .version(HttpClient.Version.HTTP_2)
                    .followRedirects(Redirect.NORMAL)
                    .build();

        String protocolAndHost = ((req.isSSL()) ? "https://" : "http://") + req.getHost();

        if (uri == null)
            uri = protocolAndHost + req.getRequestedResource();
        else {
            if (uri.startsWith("/"))
                uri = protocolAndHost + uri;
            System.out.println("Aqui:" + uri);
        }

        HttpRequest.Builder preRequest=null;
        if (req.getMethod().equalsIgnoreCase("GET")) {
            preRequest = HttpRequest.newBuilder()  // GET request!
                .uri(URI.create( uri ))
                .GET();
        }
        else if (req.getMethod().equalsIgnoreCase("POST")) {
            preRequest = HttpRequest.newBuilder()  // POST request!
            .uri(URI.create( uri ))
            .POST(BodyPublishers.ofString(req.getBody()));
        }

        for (Header header : req.getHeaders()) {
            if (!header.getKey().equalsIgnoreCase("Host") &&
                !header.getKey().equalsIgnoreCase("Connection") &&
                !header.getKey().equalsIgnoreCase("Content-Length") &&
                !header.getKey().equalsIgnoreCase("Upgrade") ) 
            {
                preRequest.setHeader(header.getKey(), header.getValues());
            }
        }
        HttpRequest request = preRequest.build();

        System.err.println("Request to: " + uri);

        HttpResponse<byte[]> response;
        try {
            response = client.sendAsync(request, BodyHandlers.ofByteArray())
                             .join();   
        } catch (CompletionException ce) {
            System.err.println("Address " + uri + " is unreachable!");
            return ;
        }

        HttpHeaders httpHeaders = response.headers();

        Optional<String> locationHeader = httpHeaders.firstValue("Location"); // When resource has been permanently moved

        if ( !locationHeader.isEmpty() ) {
            System.out.println("Moved permanently to " + locationHeader.get());
            obtainResponse( socket, req, locationHeader.get() );
        }
        else {
            Map<String, List<String>> headers = httpHeaders.map();

            String protocol = response.version().toString().replace("_", ".").replaceFirst("\\.", "/");

            int code = response.statusCode();

            String reasonPhrase = HttpStatus.getStatusText( code );

            var crlf = "\r\n";

            var responseString = protocol + " " + code + " " + reasonPhrase + crlf;

            for (String key : headers.keySet()) {
                responseString += key + ":";
                for (String valor : headers.get(key)) {
                    responseString += " " + valor;
                }
                responseString += crlf;
            }

            responseString += crlf; // espacio cabeceras y cuerpo

            writeResponse(socket, response.body(), responseString);
        }
    }


private void writeResponse(Socket socket, byte[] streamResponse, String responseHeaders) {
        OutputStream outputStream = null;
        try {
            outputStream = socket.getOutputStream(); 

            outputStream.write(responseHeaders.getBytes());
            outputStream.write(streamResponse);
            outputStream.flush();

        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        } finally {
            try {
                if (!socket.isOutputShutdown()) {
                    socket.shutdownOutput();
                }
                outputStream.close();
            } catch (IOException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            }

        }
    }

注意:IHttpRequest 是我创建的一个类,其中包含从套接字收集的所有信息(目标主机、标头、正文(如果存在)等)

到目前为止,我已经成功拦截了所有指向 HTTP 网站的请求。但是,我遇到了问题,例如https://www.google.com/,它实现了 HTTP / 2 协议并使用 TLS。当我运行 Java 应用程序并访问上一个 Google 页面时,它没有向我显示网站,而是在浏览器中显示以下内容(忽略标题之间的空白):

HTTP/2 200 正常

:状态:200

alt-svc: quic = ":443"; 马 = 2592000; v = "46,43,39"

缓存控制:私有

内容编码:gzip

内容长度:46058

内容类型:文本/html;字符集 = UTF-8

日期:2019 年 9 月 3 日星期二 09:47:34 GMT

到期:星期二,2019 年 9 月 3 日 09:47:34 GMT

p3p: CP = “这不是 P3P 政策!有关更多信息,请参见 g.co/p3phelp。”

服务器:gws

设置cookie:1P_JAR = 2019-09-03-09;过期 = 格林威治标准时间 2019 年 10 月 3 日星期四 09:47:34;路径 = /; 域 = .google.com;SameSite = none NID = 188 = XOJkffugf5G8rxNLov_iqqxo-Cq5RCvhwJPNu9tvtzLesZ4q8CE0IDVt9VgCEHZsw-AV0EYaaL8D4d_2Qwb6jXCcss7RydfV9PqQFemN_Ezz0kUjyseDDbJXfrHpmqPR6GIQCnR7bjukfasxg883K9fjnhAaqz6IpUYxoguZx-vazWc; 过期 = 格林威治标准时间 2020 年 3 月 4 日星期三 09:47:34;路径 = /; 域 = .google.com;HttpOnly 同意 = WP.27dd1a; 过期 = 格林威治标准时间 2038 年 1 月 1 日星期五 00:00:00;路径 = /; 域 = .google.com

x 框架选项:SAMEORIGIN

x-xss-保护:0

(↓↓身体↓↓)

‹������ ÿÔ½ézâȲ (ú¿Ÿ‚ ¢ örÁ²À 或 PªÚ ° çyÜÞ¾ © $ Æ.ÞåžG¸ßýwþ® »™ š ¶« »× ùöíê ¢ ¤T '' '' ™ 'ß¿ († l / Æj ¢ 或 õ ßñ7¡ “QOLªV ÞU ¢ üø> Tm' ûÄ´T [L ^] îd * I7Õ Ùê Rçšb ÷ EE i²š¡ / ÜP ié0cÉDWE!ËsCò I ™ ZªI_ ‰) ## ™ '* & gš: ¦½ÒŽê¸ oŒ ‚™» † 9 $ vFQmU¶5c´Rˆ (Š © ZÖï 1L§ Üì ¦ÚUMS5W² Û $ # K'¶êæí FOWWrniCÒS-ò + Ú¨ · Åòõ¶ „÷ ñɲá 1 • 'ÙÐ

<< 还有更多字节形式的信息>>

你在我的代码中看到什么奇怪的东西吗?我知道 HTTP / 2 压缩帧中的标头,但我认为 HTTPClient 是在内部完成的......

如果您需要更多信息,请告诉我:)

先感谢您。

4

1 回答 1

0

HTTP/2 协议是二进制协议。您发送回浏览器的是 HTTP/1.1 响应(即使 HttpClient 用于获取响应的协议是 HTTP/2)。

然而 - 您的状态行是HTTP/2 200 OK您的浏览器无法理解的。您需要将响应作为格式正确的 HTTP/1.1 响应发送。这包括过滤掉键以 ':' 开头的标头 - 例如 ':status',因为这些是 HTTP/2 特定的响应标头。同样,在不理解它们的情况下转发所有响应标头可能根本行不通:编写一个完整的 HTTP 代理很困难。

于 2019-09-03T10:45:29.400 回答