专栏名称: 脚本之家
脚本之家(jb51.net)是国内专业的网站建设资源、脚本编程学习类网站,以后将为大家分享更多有用的信息,希望大家多多支持宣传。
目录
相关文章推荐
最高人民法院  ·  政府工作报告(全文) ·  昨天  
最高人民法院  ·  代表热议“两高”报告 ·  2 天前  
天同诉讼圈  ·  那些生孩子的女律师都怎么样了?| 下午茶 ·  5 天前  
最高人民法院  ·  全国人大代表热议最高法院工作报告(十六) ·  2 天前  
中国法律评论  ·  今年“两会”中的法学家,在关心什么? ·  3 天前  
51好读  ›  专栏  ›  脚本之家

给 JDK 报了一个 P4 的 Bug,结果居然……

脚本之家  · 公众号  ·  · 2020-09-24 17:00

正文

关注
脚本之家
,与百万开发者在一起

图 by:石头@北京-望京

关于作者: 程序猿石头(ID: tangleithu),现任阿里巴巴技术专家,清华学渣,前大疆后端 Leader。 欢迎关注,交流和指导!

背景

分享一下之前踩的一个坑,背景是这样的:

我们的项目依赖于一个外部服务,该外部服务提供 REST 接口供我方调用,这是很 常见 的一个场景。本地和测试环境测试都没有问题,一切就绪上了生产后,程序调用接口就总是网络不通。

需要说明的是本地、测试环境、生产环境通过不同的域名访问该外部服务。生产程序调用不通,神奇的是在生产环境通过 curl 等命令却能够正常调用对方接口。

What??

这 TM 就神奇了,唯一不同的就是发起 HTTP 请求的客户端了,估计就是 http客户端有问题了?通过最后排查发现,居然发现了一枚 “JDK 的 bug”,然后石头就提交到了 JDK 的官网……

下面我们就来重现一下这个问题。

server 端准备

这里用 Nginx 模拟了一下 上文提到的 REST 服务,假设调用正常返回 "Hello, World\n" ,Nginx 配置如下:

server {
listen    80;
server_name test_1.tanglei.name;
location /testurl {
add_header Content-Type 'text/plain; charset=utf-8' ;
return 200 "Hello, World\n" ;
}
}

不同的 client 请求

下面用不同的 Http client (分别用命令行 curl ,python的 requests 包,和 Java 的 URL 等尝试)去请求。

  • curl 请求,正常。
[root@VM_77_245_centos vhost] # curl -i "http://test_1.tanglei.name/testurl"
HTTP/1.1 200 OK
Server: nginx
Content-Length: 13
Connection: keep-alive
Content-Type: text/plain; charset=utf-8

Hello, World
[root@VM_77_245_centos vhost] #
  • python requests 正常。
>>> import requests
>>> r = requests.get( "http://test_1.tanglei.name/testurl" )
>>> r.text
u'Hello, World\n'
  • Java 的 java.net.URLConnection 同样正常。
static String getContent (java.net.URL url) throws Exception {
java.net.URLConnection conn = url.openConnection();
java.io.InputStreamReader in = new java.io.InputStreamReader(conn.getInputStream(), "utf-8" );
java.io.BufferedReader reader = new java.io.BufferedReader(in);
StringBuilder sb = new StringBuilder();
int c = - 1 ;
while ((c = reader.read()) != - 1 ) {
sb.append(( char )c);
}
reader.close();
in.close();
String response = sb.toString();
return response;
}

上面的这个方法 String getContent(java.net.URL url) 传入一个构造好的 java.net.URL 然后 get 请求,并以 String 方式返回 response。

String srcUrl = "http://test_1.tanglei.name/testurl" ;
java.net.URL url = new java.net.URL(srcUrl);
System.out.println( "\nurl result:\n" + getContent(url)); // OK

上面的语句输出正常,结果如下:

url result:
Hello, World

这就尼玛神奇了吧。看看我们程序中用的 httpclient 的实现,结果发现是有用 java.net.URI ,心想,这不至于吧,用 URI 就不行了么。

java.net.URI 试试? (这里不展开讲URL和URI的区别联系了,可以简单的认为URL是URI的一个子集, 详细的可参考 URI、URL 和 URN [1] , wiki URI [2]

直接通过 java.net.URI 构造,再调用 URI.toURL 得到 URL ,调用同样正常。

关键的来了,httpclient 源码中用的构造函数是另外一个:

URI(String scheme, String host, String path, String fragment)
Constructs a hierarchical URI from the given components.

我用这个方法构造 URI ,会构造失败:

new java.net.URI(uri.getScheme(), uri.getHost(), uri.getPath(), null ) error: protocol = http host = null
new java.net.URI(url.getProtocol(), url.getHost(), url.getPath(), null ) error: Illegal character in hostname at index 11 : http: //test_1.tanglei.name/testurl

所以问题发现了,我们的项目中依赖的第三方 httpclient包底层用到了 java.net.URI ,恰好在 java.net.URI 中是不允许以下划线( _ )作为 hostname 字段的。

uri.getHost() uri.toURL().getHost() 居然能不相等。

这是 JDK 的 Bug 吧?

有理由怀疑,这是 JDK 的 Bug 吧?

从官网上还真找到了关于包含下划线作为hostname的bug提交issue,戳这里 JDK-8132508 : Bug JDK-8029354 reproduces with underscore in hostname[3],然后发现该 "bug" reporter 的情况貌似跟我的差不多,只不过引爆bug的点不一样。

该 "bug" reviewer 最后以 "Not an Issue" 关闭,给出的理由是:

RFC 952 disallows _ underscores in hostnames. So, this is not a bug.

确实, rfc952 [4] 明确 明确说了域名只能由 字母 (A-Z) 、 数字 (0-9) 、 减号 (-) 和 点 (.) 组成。

那 OK 吧,既然明确规定了 hostname 不能包含下划线,为啥 java.net.URL 确允许呢?

造成 java.net.URI java.net.URL 在处理 hostname 时的标准不一致,且本身 java.net.URI 在构造的时候也带了 "有色"







请到「今天看啥」查看全文


推荐文章
最高人民法院  ·  政府工作报告(全文)
昨天
最高人民法院  ·  代表热议“两高”报告
2 天前
中国法律评论  ·  今年“两会”中的法学家,在关心什么?
3 天前
笑的合不拢嘴  ·  年底要账实拍,太现实!
8 年前
肌肉男训练营  ·  辣眼睛!熊孩子们的逆天运动瞬间!
8 年前
腻腻的小世界ninitalk  ·  内衣外露太尴尬?其实是你没穿对bra
7 年前