我正在尝试在 Java 应用程序中创建一个代理,它允许我修改 HTTP 请求的某些方面。
为此,我在端口 8080 上打开一个 ServerSocket,在 Mozilla Firefox 中在该端口上配置一个代理,并且对于每个连接,在单独的线程中执行 ServerSocket 的 accept() 方法。到目前为止一切正常。
为了将请求从浏览器发送到相应的网站,我使用了 Java 11 中包含的 HttpClient 库。这是我使用该库的一段代码:
private void obtainResponse(Socket socket, IHttpRequest req, String uri) {
HttpClient client = null;
if (req.isSSL()) {
SSLContext sslContext = ((SecureConnectionHandler)connHandler).createSSLContext( req.getHost() );
client = HttpClient.newBuilder()
.connectTimeout(Duration.ofSeconds(30))
.priority(1)
.version(HttpClient.Version.HTTP_2)
.followRedirects(Redirect.NORMAL)
.sslContext( sslContext )
.build();
}
else
client = HttpClient.newBuilder()
.connectTimeout(Duration.ofSeconds(30))
.priority(1)
.version(HttpClient.Version.HTTP_2)
.followRedirects(Redirect.NORMAL)
.build();
String protocolAndHost = ((req.isSSL()) ? "https://" : "http://") + req.getHost();
if (uri == null)
uri = protocolAndHost + req.getRequestedResource();
else {
if (uri.startsWith("/"))
uri = protocolAndHost + uri;
System.out.println("Aqui:" + uri);
}
HttpRequest.Builder preRequest=null;
if (req.getMethod().equalsIgnoreCase("GET")) {
preRequest = HttpRequest.newBuilder() // GET request!
.uri(URI.create( uri ))
.GET();
}
else if (req.getMethod().equalsIgnoreCase("POST")) {
preRequest = HttpRequest.newBuilder() // POST request!
.uri(URI.create( uri ))
.POST(BodyPublishers.ofString(req.getBody()));
}
for (Header header : req.getHeaders()) {
if (!header.getKey().equalsIgnoreCase("Host") &&
!header.getKey().equalsIgnoreCase("Connection") &&
!header.getKey().equalsIgnoreCase("Content-Length") &&
!header.getKey().equalsIgnoreCase("Upgrade") )
{
preRequest.setHeader(header.getKey(), header.getValues());
}
}
HttpRequest request = preRequest.build();
System.err.println("Request to: " + uri);
HttpResponse<byte[]> response;
try {
response = client.sendAsync(request, BodyHandlers.ofByteArray())
.join();
} catch (CompletionException ce) {
System.err.println("Address " + uri + " is unreachable!");
return ;
}
HttpHeaders httpHeaders = response.headers();
Optional<String> locationHeader = httpHeaders.firstValue("Location"); // When resource has been permanently moved
if ( !locationHeader.isEmpty() ) {
System.out.println("Moved permanently to " + locationHeader.get());
obtainResponse( socket, req, locationHeader.get() );
}
else {
Map<String, List<String>> headers = httpHeaders.map();
String protocol = response.version().toString().replace("_", ".").replaceFirst("\\.", "/");
int code = response.statusCode();
String reasonPhrase = HttpStatus.getStatusText( code );
var crlf = "\r\n";
var responseString = protocol + " " + code + " " + reasonPhrase + crlf;
for (String key : headers.keySet()) {
responseString += key + ":";
for (String valor : headers.get(key)) {
responseString += " " + valor;
}
responseString += crlf;
}
responseString += crlf; // espacio cabeceras y cuerpo
writeResponse(socket, response.body(), responseString);
}
}
private void writeResponse(Socket socket, byte[] streamResponse, String responseHeaders) {
OutputStream outputStream = null;
try {
outputStream = socket.getOutputStream();
outputStream.write(responseHeaders.getBytes());
outputStream.write(streamResponse);
outputStream.flush();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} finally {
try {
if (!socket.isOutputShutdown()) {
socket.shutdownOutput();
}
outputStream.close();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
注意:IHttpRequest 是我创建的一个类,其中包含从套接字收集的所有信息(目标主机、标头、正文(如果存在)等)
到目前为止,我已经成功拦截了所有指向 HTTP 网站的请求。但是,我遇到了问题,例如https://www.google.com/,它实现了 HTTP / 2 协议并使用 TLS。当我运行 Java 应用程序并访问上一个 Google 页面时,它没有向我显示网站,而是在浏览器中显示以下内容(忽略标题之间的空白):
HTTP/2 200 正常
:状态:200
alt-svc: quic = ":443"; 马 = 2592000; v = "46,43,39"
缓存控制:私有
内容编码:gzip
内容长度:46058
内容类型:文本/html;字符集 = UTF-8
日期:2019 年 9 月 3 日星期二 09:47:34 GMT
到期:星期二,2019 年 9 月 3 日 09:47:34 GMT
p3p: CP = “这不是 P3P 政策!有关更多信息,请参见 g.co/p3phelp。”
服务器:gws
设置cookie:1P_JAR = 2019-09-03-09;过期 = 格林威治标准时间 2019 年 10 月 3 日星期四 09:47:34;路径 = /; 域 = .google.com;SameSite = none NID = 188 = XOJkffugf5G8rxNLov_iqqxo-Cq5RCvhwJPNu9tvtzLesZ4q8CE0IDVt9VgCEHZsw-AV0EYaaL8D4d_2Qwb6jXCcss7RydfV9PqQFemN_Ezz0kUjyseDDbJXfrHpmqPR6GIQCnR7bjukfasxg883K9fjnhAaqz6IpUYxoguZx-vazWc; 过期 = 格林威治标准时间 2020 年 3 月 4 日星期三 09:47:34;路径 = /; 域 = .google.com;HttpOnly 同意 = WP.27dd1a; 过期 = 格林威治标准时间 2038 年 1 月 1 日星期五 00:00:00;路径 = /; 域 = .google.com
x 框架选项:SAMEORIGIN
x-xss-保护:0
(↓↓身体↓↓)
‹������ ÿÔ½ézâȲ (ú¿Ÿ‚ ¢ örÁ²À 或 PªÚ ° çyÜÞ¾ © $ Æ.ÞåžG¸ßýwþ® »™ š ¶« »× ùöíê ¢ ¤T '' '' ™ 'ß¿ († l / Æj ¢ 或 õ ßñ7¡ “QOLªV ÞU ¢ üø> Tm' ûÄ´T [L ^] îd * I7Õ Ùê Rçšb ÷ EE i²š¡ / ÜP ié0cÉDWE!ËsCò I ™ ZªI_ ‰) ## ™ '* & gš: ¦½ÒŽê¸ oŒ ‚™» † 9 $ vFQmU¶5c´Rˆ (Š © ZÖï 1L§ Üì ¦ÚUMS5W² Û $ # K'¶êæí FOWWrniCÒS-ò + Ú¨ · Åòõ¶ „÷ ñɲá 1 • 'ÙÐ
<< 还有更多字节形式的信息>>
你在我的代码中看到什么奇怪的东西吗?我知道 HTTP / 2 压缩帧中的标头,但我认为 HTTPClient 是在内部完成的......
如果您需要更多信息,请告诉我:)
先感谢您。