前言
我们平时编码过程中,可能很少去查看 Java 文件编译后的字节码指令。但是,不管你是因为对技术非常热爱,喜欢刨根问底,还是想在别人面前装X 。我认为,都非常有必要了解一下常见的字节码指令。这对于我们理解代码的运行原理也会很有帮助。
注释会被执行吗?
比如,最近我就看到了二哥(沉默王二)的一篇文章,非常有意思,也让我涨了见识了。且看代码,可能会让你怀疑人生~
public class TestAnno { public static void main (String[] args) { String str = "张三" ; // \u000d str="李四"; System.out.println(str); } }
可以猜一下最终打印结果是什么。我来告诉你,结果是:“李四”。What?这是什么神仙操作。为何会这样,这被注释的代码还能执行?
别光顾着吃惊,我们来看一下为什么打印结果跟我们想象中的略有偏差。
仔细查看,发现注释行中,有一个 \u000d 。这是一个 unicode 码,它代表的是一个换行符。因此,在执行后,就会把
str="李四"
这行代码换行到下一行,从而导致了它也被编译执行。
有的小伙伴就说了,我怎么知道你说的是真是假呢,你这不是瞎说呢吗,一点说服力都没有啊。
好吧,这就需要我们看一下编译后的字节码了,编译器总不能骗我们吧。
查看字节码的两种方式
我们知道,通过 javac 命令,可以把 java 文件编译成 class 文件。然后,想看它的字节码指令,需要用到 javap -c 反编译一下。
但是,每次都通过命令行,还是有一些麻烦。因此,懒人福利来了。这里我提供两种方式,直接在 idea 中就可以查看,非常的方便(果然,懒惰才是促使科技进步的原动力啊)。
配置 External Tools
这种方式,其实就是先配置一下,JDK 中 javap 命令的位置,然后让 idea 帮我们自动执行 javap 命令。
找到 idea 的菜单栏,File --> Settings 。然后找到 External Tools 。
点击加号,添加一个 tool ,里边的配置项,如下,
Name,就给当前 tool 起一个名字好了,用于使用时,在右键菜单选项中展示。
Decriptions,描述此功能,别到时候你自己都忘了当前配置这个东西是用来干嘛的了。
Program:电脑本机 javap 命令的绝对路径。
Arguments:填写 -c $FileNameWithoutExtension$.class 就可以,代表编译的class文件。
Working directory:填写 $OutputPath$/$FileDirRelativeToSourcepath$ ,代表class文件的工作目录。
配置完成了,可以在idea中,直接右键,选择配置中 Name 对应的选项。
此时 ,就可以打印出当前类编译后的字节码指令。
我们稍后再来分析里边的具体含义。下边,还有另外一种使用插件的方式,来查看字节码。而且功能更加强大。
jclasslib bytecode viewer 插件
同上,在 idea 的 setting 菜单,找到 Plugins 插件项,然后搜索这个插件。
安装之后,并重启 idea ,就可以生效了。
使用的时候,在 View 菜单,找到 show bytecode with jclasslib。
它可以查看基本信息,常量池,接口,属性,方法等信息。如下,找到我们对应的 main 方法。
这个插件还有一个好处,就是当我们不知道某个指令是什么意思的时候,直接鼠标在指令上边单击,就可以链接到官方的解释。如,不知道第一行 ldc 什么意思,直接单击 ldc 就可以跳转到 oracle 官网对应命令的解释。这非常有利用我们学习此命令。
常用字节码指令
以上两种方式,都挺方便的,根据自己喜好自由选择就好了。
相信你肯定也被很多字节码指令搞的一头雾水过,接下来,我们就一起学习下常用的指令都有哪些吧。之后,再来看上边的例子就轻松很多了。
数据类型
我们知道 Java 是强类型语言,在使用之前肯定已经确定了它的类型。而数据类型,无非就是基本数据类型和引用类型。它们对应的字节码,其实就是用它们的对应类型的英文首字母来表示的。(引用类型除外)
例如,s 代表 short , i 代表 int, l 代表 long ,f 代表 float,d 代表 double,b 代表 byte(不包括boolean),c 代表 char,a 代表 reference 引用。
加载和存储指令
我们知道,一个方法的运行,会在栈的栈帧中执行。方法中的变量称为局部变量,数的操作需要用到操作数栈。因此,加载和存储指令,就是数据在局部变量表和操作数栈中来回传输。
将一个局部变量加载到操作数栈:如 iload、iload_ 。表示加载的是 int 类型变量。
iload_ 后边带数字代表第几个 int 型变量。例如 iload_0 代表把第一个 int 型局部变量加载到操作数栈。
其他类型变量同上:lload ,fload ,dload,aload 。
将一个数值存储到局部变量表:istore,istore_,lstore,lstore_,fstore,fstore_,dstore,dstore_,astore,astore_ 。
将一个常量加载到操作数栈:aconst_null,iconst_m1,iconst_,lconst_,fconst_,dconst_ ,bipush,sipush。
ldc 代表把 int、float、String类型常量从常量池中加载到操作数栈。ldc_w 代表宽索引。
ldc2_w 代表把 long 或 double 类型常量从常量池中加载到操作数栈。(宽索引)
这里需要说的是,int 类型根据数值的取值范围不同,而采用不同的字节码指令。
iconst_m1 代表 -1 ,iconst_ 代表 0~5 。bipush 代表 -128~127(byte取值范围), sipush 代表 -32768~32767(short取值范围),ldc 在 int 中代表 -2147483648~2147483647(int取值范围)。
public class TestByteCode { public static void main (String[] args) { int a = -1 ; int b = 0 ; int c = 1 ; int d = 2 ; int e = 3 ; int f = 4 ; int g = 5 ; int h = 127 ; int i = 32767 ; int j = 2147483647 ; } }
其字节码为:
0 iconst_m1 1 istore_1 2 iconst_0 3 istore_2 4 iconst_1 5 istore_3 6 iconst_2 7 istore 4 9 iconst_3 10 istore 5 12 iconst_4 13 istore 6 15 iconst_5 16 istore 7 18 bipush 127 20 istore 8 22 sipush 32767 25 istore 9 27 ldc #2 <2147483647> 29 istore 10 31 return
访问指令
访问类字段:getstatic,putstatic
访问类实例字段:getfield,putfield
方法调用和返回
invokevirtual :用于调用对象的实例方法。
invokespecial:用于调用一些特殊的方法,如父类构造方法,实例初始化方法,私有方法。
方法返回是跟返回类型相关,根据不同的返回类型,有不同的指令。
ireturn:注意,这个不止返回 int ,返回 boolean,byte,char,short 也用这个指令。其实,很多指令都没有直接支持 byte,char,short和 boolean,而是用 int 类型代替。这是因为,虚拟机的操作码长度只有一个字节,只能表示有限个数的指令。(我们这里所提到的所有指令,都只是方便我们记忆的助记符,而在计算机内部肯定还是一个字节,即 8 个 bit 位的二进制)
其余字节码指令
上边介绍的指令只是很少一部分字节码指令。但是,麻雀虽小,五脏俱全,也包括了最基本的变量定义,调用方法,和方法返回这些最基本的功能。同时,也足够我们去解释上边的问题,为什么注释行会被执行了。
更多的字节码指令可以参考《深入理解Java虚拟机》这本书的 6.4 节,和最后的附录字节码指令表。需要这本书的,可以在公众号后台回复“Java虚拟机”获取。
由于字节码指令太多,比如还有运算指令,包括加减乘除、位运算,比较指令等,if 等控制指令,类型强转指令,还有多线程用到的同步锁。And so on ~
不可能把它们全部记住背会,但是,其实都是由规律可循的,很多都是见名知意,用各种英文首字母简写代表。比如,int类型的加法运算,就是 iadd,double 类型的减法运算是 dsub。等等。
因此,我这里只是给了一个引子,重要的还是需要自己去寻找方法,不断的实践探索 ~
另外,官方文档才是最好的学习途径:https://docs.oracle.com/javase/specs/jvms/se8/html/jvms-6.html
注释行字节码
最后,学以致用,实践出真知。我们一起看一下开头抛出的问题吧,为什么注释行会被执行。看一下它的字节码指令就知道了。