[英]Determining in the bytecode where is the super() method call all constructors must do on the JVM
我想知道在分析构造函数的字节码时是否有一种明显而快速的方法,以确定super()
代码的结束位置。
更具体地说,与Java形成鲜明对比的是,构造函数中对任何super()
构造函数方法的调用是可选的(或者更确切地说,当不存在时 - 隐式),在字节码世界中总是需要它。
出于黑魔法的目的,我需要通过字节码分析和最简单的方法来了解什么是与Java世界的super()
调用相对应的INVOKESPECIAL
调用。
我会带着一个很难的例子离开这里:
public static class A {
public A(Object o, Object b) {
}
}
public static class B extends A {
public B() {
//the below super is in bold just to signal that's the one
//I'm looking for
SUPER(new A(new Object(), new Integer(2)), new Integer(1));
System.out.println(new A(new Object(), new Integer(2)));
}
}
使用相应的字节码:
实际上,字节码构造函数的规则比Java的规则要宽松得多。
唯一的规则是必须在任何正常返回的路径上调用一个构造函数,如果构造函数调用抛出异常,那么您也必须抛出异常。
除此之外,这意味着构造函数可能包含对其他构造函数的多个调用或根本不包含任何构造函数。
无论如何,确定给定的invokespecial
调用是否正在初始化当前对象的唯一保证方法是进行数据流分析,因为可以初始化同一类的其他对象,这会混淆一个天真的检测器。
编辑:这是一个完全有效的类(使用Krakatau汇编语法)的示例,显示了您可能遇到的一些问题。 除此之外,它还调用同一个类中的其他构造函数,构造函数的递归调用,以及在构造函数中构造同一个类的其他对象。
.class public ctors
.super java/lang/Object
; A normal constructor
.method public <init> : ()V
.limit locals 1
.limit stack 1
aload_0
invokespecial java/lang/Object <init> ()V
return
.end method
; A weird constructor
.method public <init> : (I)V
.limit locals 2
.limit stack 5
iload_1
ifne LREST
aload_0
invokespecial ctors <init> ()V
return
LREST:
aload_0
new ctors
iinc 1 -1
iload_1
LFAKE_START:
invokespecial ctors <init> (I)V
LFAKE_END:
iconst_0
invokespecial ctors <init> (I)V
return
.catch [0] from LFAKE_START to LFAKE_END using LCATCH
LCATCH:
aload_0
invokespecial java/lang/Object <init> ()V
return
.end method
.method public static main : ([Ljava/lang/String;)V
.limit locals 1
.limit stack 2
new ctors
iconst_5
invokespecial ctors <init> (I)V
return
.end method
一个简单的解决方案是计算new A
对象的数量和A.<init>
的数量A.<init>
当有多个init
不是new
你调用了超级构造函数。 如果调用this(...)
则必须对new B
和B.<init>
执行相同的检查B.<init>
。
您必须找出哪个调用操作码操作数堆栈包含this
引用, this
引用将用作第一个参数。 为此,您只需要了解不同操作码对操作数堆栈的影响。 在你的例子中,你从aload_0
(这是this
引用)开始,然后在this
引用之上做一些魔术(一直更新操作数堆栈)。 过了一会儿,你正在寻找的调用操作码就在那里,它会使用this
引用(以及参数的一些引用)。 这就是super
电话。
super()调用的答案是行号。 31。
我通过eclipse的类文件编辑器发现它很容易。 看看下面附带的按扣。
这里要记住的一件事是,前缀'a'表示操作码正在操纵对象引用。 前缀'i'表示操作码正在操纵整数。
那么,逐行解释如下,
12 new java.lang.Integer //Create a new java.lang.Integer
15 dup //Make a extra reference to the same Integer
16 iconst_2 // this means opcode is manipulating Integer as Integer(2)
17 invokespecial java.lang.Integer(int) //Integer(2) is invoked
20 invokespecial A(java.lang.Object, java.lang.Object) //new A(new Object(), new Integer(2) is invoked
23 new java.lang.Integer //Create a new java.lang.Integer
26 dup //Make a extra reference to the same Integer
27 iconst_1 // this means opcode is manipulating Integer as Integer(1)
28 invokespecial java.lang.Integer(int) //Integer(1) is invoked
31 invokespecial A(java.lang.Object, java.lang.Object) **//super(new A(new Object(), new Integer(2)), new Integer(1)) is invoked**
我希望后者很容易理解。 :)
56 - this invoke is for the sysout related A(object,object) invocation.
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.