前几天重新看 《阿里巴巴Java开发手册》有一条这样的规约:
出于好奇,打算研究一下!,强迫症,没办法!
我们先用一个案例测试一下:
public class Test {
public static void main(String[] args) {
String param = null;
switch (param) {
case "null":
System.out.println("匹配null字符串");
break;
default:
System.out.println("进入default");
}
}
}
显而易见,如果switch传入空值,会抛空指针!
看到这,我们先可以思考下面几个问题:
下面开始对上面的问题进行分析
首先参考官方文档对swtich 语句相关描述。
翻译如下:
switch 的表达式必须是 char, byte, short, int, Character, Byte, Short, Integer, String, 或者 enum 类型,否则会发生编译错误
同时switch 语句必须满足以下条件,否则会出现编译错误:
翻译如下:
switch 语句执行的时候,首先将执行 switch 的表达式。如果表达式为 null, 则会抛出 NullPointerException,整个 switch 语句的执行将被中断。
另外从《Java虚拟机规范》这本书,我们可以学习到:
总结一下就是:
1.编译器使用 tableswitch 和 lookupswitch 指令生成 switch 语句的编译代码。
2.Java 虚拟机的 tableswitch 和 lookupswitch 指令只能支持 int 类型的条件值。如果 swich 中使用其他类型的值,那么就必须转化为 int 类型。
所以可以了解到空指针出现的根源在于:虚拟机为了实现 switch 的语法,将参数表达式转换成 int。而这里的参数为 null, 从而造成了空指针异常。
下面对官方文档的内容采用反汇编方式进一步分析下
不熟悉字节码的,推荐看看美团的这篇文章:https://tech.meituan.com/2019/09/05/java-bytecode-enhancement.html
下面开始硬货!
一个例子:
public class Test {
public static void main(String[] args) {
String param = "月伴飞鱼";
switch (param) {
case "月伴飞鱼1":
System.out.println("月伴飞鱼1");
break;
case "月伴飞鱼2":
System.out.println("月伴飞鱼2");
break;
case "月伴飞鱼3":
System.out.println("月伴飞鱼3");
break;
default:
System.out.println("default");
}
}
}
反汇编代码得到:
Compiled from "Test.java"
public class com.zhou.Test {
public zhou.Test();
Code:
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: return
public static void main(java.lang.String[]);
Code:
0: ldc #2 // String 月伴飞鱼
2: astore_1
3: aload_1
4: astore_2
5: iconst_m1
6: istore_3
7: aload_2
8: invokevirtual #3 // Method java/lang/String.hashCode:()I
11: tableswitch { // -768121881 to -768121879
-768121881: 36
-768121880: 50
-768121879: 64
default: 75
}
36: aload_2
37: ldc #4 // String 月伴飞鱼1
39: invokevirtual #5 // Method java/lang/String.equals:(Ljava/lang/Object;)Z
42: ifeq 75
45: iconst_0
46: istore_3
47: goto 75
50: aload_2
51: ldc #6 // String 月伴飞鱼2
53: invokevirtual #5 // Method java/lang/String.equals:(Ljava/lang/Object;)Z
56: ifeq 75
59: iconst_1
60: istore_3
61: goto 75
64: aload_2
65: ldc #7 // String 月伴飞鱼3
67: invokevirtual #5 // Method java/lang/String.equals:(Ljava/lang/Object;)Z
70: ifeq 75
73: iconst_2
74: istore_3
75: iload_3
76: tableswitch { // 0 to 2
0: 104
1: 115
2: 126
default: 137
}
104: getstatic #8 // Field java/lang/System.out:Ljava/io/PrintStream;
107: ldc #4 // String 月伴飞鱼1
109: invokevirtual #9 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
112: goto 145
115: getstatic #8 // Field java/lang/System.out:Ljava/io/PrintStream;
118: ldc #6 // String 月伴飞鱼2
120: invokevirtual #9 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
123: goto 145
126: getstatic #8 // Field java/lang/System.out:Ljava/io/PrintStream;
129: ldc #7 // String 月伴飞鱼3
131: invokevirtual #9 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
134: goto 145
137: getstatic #8 // Field java/lang/System.out:Ljava/io/PrintStream;
140: ldc #10 // String default
142: invokevirtual #9 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
145: return
}
先介绍一下下面会用到的字节码指令
invokevirtual:调用实例方法
istore_0 将int类型值存入局部变量0
istore_1 将int类型值存入局部变量1
istore_2 将int类型值存入局部变量2
istore_3 将int类型值存入局部变量3
aload_0 从局部变量0中装载引用类型值
aload_1 从局部变量1中装载引用类型值
aload_2 从局部变量2中装载引用类型值
更详细的指令集大全关注我公众号,加我微信发你哈!
我们继续看汇编代码:
先看偏移为 8 的指令,调用了参数的 hashCode() 函数来获取字符串 "月伴飞鱼" 的哈希值。
8: invokevirtual #3 // Method java/lang/String.hashCode:()I
接下来我们看偏移为 11 的指令处:
tableswitch 是跳转引用列表, 如果值小于其中的最小值-768121881 或者大于其中的最大值-768121879,跳转到 default 语句。
11: tableswitch { // -768121881 to -768121879
-768121881: 36
-768121880: 50
-768121879: 64
default: 75
}
其中 -768121881 为键,36 为对应的目标语句偏移量。
hashCode 和 tableswitch 的键相等,则跳转到对应的目标偏移量,"月伴飞鱼"的哈希值806505866不在最小值-768121881和最大值-768121879之间,因此跳转到 default 对应的语句行(即偏移量为 75 的指令处执行)。
月伴飞鱼的hash值计算:("月伴飞鱼").hashCode();
从 36 到 75 行,根据哈希值相等跳转到判断是否相等的指令。
然后调用java.lang.String#equals
判断 switch 的字符串是否和对应的 case 的字符串相等。
如果相等则分别根据第几个条件得到条件的索引,然后每个索引对应下一个指定的代码行数。
继续从偏移量75行往下看:
76: tableswitch { // 0 to 2
0: 104
1: 115
2: 126
default: 137
}
default 语句对应 137 行,打印 “default” 字符串,然后执行 145 行 return 命令返回。
通过 tableswitch 判断执行哪一行打印语句。
总结就是整个流程是先计算字符串参数的哈希值,判断哈希值的范围,然后哈希值相等再判断对象是否相等,然后执行对应的代码块。
这种先判断 hash 值是否相等(有可能是同一个对象/两个对象有可能相等),再通过 equals 比较 对象是否相等 的做法,在 Java 的很多 JDK 源码中和其他框架中也非常常见的。
反汇编前言中的代码:
public class Test {
public static void main(String[] args) {
String param = null;
switch (param) {
case "null":
System.out.println("匹配null字符串");
break;
default:
System.out.println("进入default");
}
}
}
public class com.zhou.Test {
public com.zhou.Test();
Code:
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: return
public static void main(java.lang.String[]);
Code:
0: aconst_null
1: astore_1
2: aload_1
3: astore_2
4: iconst_m1
5: istore_3
6: aload_2
7: invokevirtual #2 // Method java/lang/String.hashCode:()I
10: lookupswitch { // 1
3392903: 28
default: 39
}
28: aload_2
29: ldc #3 // String null
31: invokevirtual #4 // Method java/lang/String.equals:(Ljava/lang/Object;)Z
34: ifeq 39
37: iconst_0
38: istore_3
39: iload_3
40: lookupswitch { // 1
0: 60
default: 71
}
60: getstatic #5 // Field java/lang/System.out:Ljava/io/PrintStream;
63: ldc #6 // String 匹配null字符串
65: invokevirtual #7 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
68: goto 79
71: getstatic #5 // Field java/lang/System.out:Ljava/io/PrintStream;
74: ldc #8 // String 进入default
76: invokevirtual #7 // Method java/io/PrintStream.println:(Ljava/lang/String;)V
79: return
}
可以猜测3392903 应该是 "null" 字符串的哈希值。
10: lookupswitch { // 1
3392903: 28
default: 39
}
我们可以打印其哈希值去印证:System.out.println(("null").hashCode());
总结整体流程:
String param = null;
int hashCode = param.hashCode();
if(hashCode == ("null").hashCode() && param.equals("null")){
System.out.println("null");
}else{
System.out.println("default");
}
因此空指针的原因就一目了然了:调用了 null 对象的实例方法。
网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。
添加我为好友,拉您入交流群!
请使用微信扫一扫!