最近抽时间分析了一下java.lang.instrument包的使用方式,记录下来写成一篇的文章。
Instrumentation简介
java.lang.instrument包的结构如下:
java.lang.instrument
- ClassDefinition
- ClassFileTransformer
- IllegalClassFormatException
- Instrumentation
- UnmodifiableClassException
- UnmodifiableModuleException
其中,核心功能由接口java.lang.instrument.Instrumentation提供,这里可以通过Instrumentation类的API注释来理解一下什么是instrument:
Instrumentation类提供控制Java语言程序代码的服务。Instrumentation可以实现在方法插入额外的字节码从而达到收集使用中的数据到指定工具的目的。由于插入的字节码是附加的,这些更变不会修改原来程序的状态或者行为。通过这种方式实现的良性工具包括监控代理、分析器、覆盖分析程序和事件日志记录程序等等。
也就是说,java.lang.instrument包的最大功能就是可以在已有的类上附加(修改)字节码来实现增强的逻辑,如果良性使用当然不会影响程序的正常行为,如果恶性使用就可能产生一些负面的影响(其实很多商用Java程序如IntelliJ IDEA的License的破解都可以基于Instrumentation的功能实现,前提是找到程序认证License的入口)。
Instrumentation原理简介
Instrument的底层实现依赖于JVMTI,也就是JVM Tool Interface,它是JVM暴露出来的一些供用户扩展的接口集合,JVMTI是基于事件驱动的,JVM每执行到一定的逻辑就会调用一些事件的回调接口(如果有的话),这些接口可以供开发者去扩展自己的逻辑。JVMTIAgent是一个利用JVMTI暴露出来的接口提供了代理启动时加载(agent on load)、代理通过运行时附加形式加载(agent on attach)和代理卸载(agent on unload)功能的动态库。而instrument agent可以理解为一类JVMTIAgent动态库,别名是JPLISAgent(Java Programming Language Instrumentation Services Agent),也就是专门为java语言编写的插桩服务提供支持的代理。

其中,VM启动时加载Agent可以使用命令行参数-javaagent:yourAgent.jar的形式实现。
Instrumentation接口详解
void addTransformer(ClassFileTransformer transformer, boolean canRetransform)
//注册ClassFileTransformer实例,注册多个会按照注册顺序进行调用。所有的类被加载完毕之后会调用ClassFileTransformer实例,相当于它们通过了redefineClasses方法进行重定义。布尔值参数canRetransform决定这里被重定义的类是否能够通过retransformClasses方法进行回滚。
void addTransformer(ClassFileTransformer transformer)
//相当于addTransformer(transformer, false),也就是通过ClassFileTransformer实例重定义的类不能进行回滚。
boolean removeTransformer(ClassFileTransformer transformer)
//移除(反注册)ClassFileTransformer实例。
boolean isRetransformClassesSupported()
//返回当前JVM配置是否支持类重新转换的特性。
void retransformClasses(Class<?>... classes) throws UnmodifiableClassException
//已加载类进行重新转换的方法,重新转换的类会被回调到ClassFileTransformer的列表中进行处理,想深入理解建议阅读API注释。
boolean isRedefineClassesSupported()
//返回当前JVM配置是否支持重定义类(修改类的字节码)的特性。
void redefineClasses(ClassDefinition... definitions) throws ClassNotFoundException, UnmodifiableClassException
//重定义类,也就是对已经加载的类进行重定义,ClassDefinition类型的入参包括了对应的类型Class<?>对象和字节码文件对应的字节数组。
boolean isModifiableClass(Class<?> theClass)
//判断对应类是否被修改过。
Class[] getAllLoadedClasses()
//获取所有已经被加载的类。
Class[] getInitiatedClasses(ClassLoader loader)
//获取所有已经被初始化过了的类。
long getObjectSize(Object objectToSize)
//获取某个对象的(字节)大小,注意嵌套对象或者对象中的属性引用需要另外单独计算。
void appendToBootstrapClassLoaderSearch(JarFile jarfile)
//将某个jar加入到Bootstrap Classpath里优先其他jar被加载。
void appendToSystemClassLoaderSearch(JarFile jarfile)
//将某个jar加入到Classpath里供AppClassloard去加载。
void setNativeMethodPrefix(ClassFileTransformer transformer, String prefix)
//设置某些native方法的前缀,主要在找native方法的时候做规则匹配。
boolean isNativeMethodPrefixSupported()
//是否支持设置native方法的前缀。
void redefineModule(...)
//重定义Module。
boolean isModifiableModule(Module module)
//判断指定Module是否重定义过。
如何使用Instrumentation
Instrumentation类在API注释中有十分简洁的使用方式描述:
有两种方式可以获取Instrumentation接口的实例:
- JVM在指定代理的方式下启动,此时Instrumentation实例会传递到代理类的premain方法。
- JVM提供一种在启动之后的某个时刻启动代理的机制,此时Instrumentation实例会传递到代理类代码的agentmain方法。
首先我们知道Instrumentation的实现类是sun.instrument.InstrumentationImpl,在JDK9之后,由于模块权限控制,不可能通过反射构造其实例,一般情况下反射做不到的东西只能通过JVM实现。而且根据上面简洁的API注释我们是无法得知如何使用Instrumentation。其实,premain对应的就是VM启动时的Instrument Agent加载,也就是上文提到的agent on load,而agentmain对应的是VM运行时的Instrument Agent加载,也就是上文提到的agent on attach。两种加载形式所加载的Instrument Agent都关注同一个JVMTI事件 —— ClassFileLoadHook事件,而这个事件是在读取字节码文件之后回调时用。换言之,premain和agentmain方式的回调时机都是类文件字节码读取之后(或者说是类加载之后)。
实际上,premain和agentmain两种方式最终的目的都是为了回调Instrumentation实例并且激活sun.instrument.InstrumentationImpl#transform()从而回调注册到Instrumentation中的ClassFileTransformer实现字节码修改,本质功能上没有很大区别。两者的非本质功能的区别如下:
premain需要通过命令行使用外部代理jar包;而agentmain则可以通过attach机制直接附着到目标VM中加载代理,也就是使用agentmain方式下,操作attach的程序和被代理的程序可以是完全不同的两个程序。premain方式回调到ClassFileTransformer中的类是虚拟机加载的所有类,这个是由于代理加载的顺序比较靠前决定的,在开发者逻辑看来就是:所有类首次加载并且进入程序main()方法之前,premain方法会被激活,然后所有被加载的类都会执行ClassFileTransformer列表中的回调。agentmain方式由于是采用attach机制,被代理的目标程序VM有可能很早之前已经启动,当然其所有类已经被加载完成,这个时候需要借助Instrumentation#retransformClasses(Class<?>... classes)让对应的类可以重新转换,从而激活重新转换的类执行ClassFileTransformer列表中的回调。premain方式是JDK1.5引入的,而agentmain方式是JDK1.6引入的,也就是JDK1.6之后可以自行选择使用premain或者agentmain。
premain使用方式
premain方式依赖独立的javaagent,也就是单独建立一个项目编写好代码之后打成jar包供另一个使用程序通过代理形式引入。简单的步骤如下:
- 编写premain函数,也就是编写一个普通的Java类,包含下面两个方法的其中之一。
public static void premain(String agentArgs, Instrumentation inst); //[1]
public static void premain(String agentArgs); //[2]
- 通过指定Agent运行。
java -javaagent:代理Jar包的路径 [=传入premain的参数] yourTarget.jar
agentmain使用方式
agentmain的使用方式和permain十分相似,包括编写MANIFEST.MF和生成代理Jar包。但是,它并不需要通过-javaagent命令行形式引入代理Jar,而是在运行时通过attach工具激活指定代理即可。简单的步骤如下:
- 编写
premain函数,也就是编写一个普通的Java类,包含下面两个方法的其中之一。
public static void agentmain(String agentArgs, Instrumentation inst); //[1]
public static void agentmain(String agentArgs); //[2]
[1]的回调优先级会比[2]高,也就是[1]和[2]同时存在的情况下,只有[1]会被回调。而agentArgs是agentmain函数得到的程序参数,通过com.sun.tools.attach.VirtualMachine#loadAgent(var1,var2)中的var2传入,var1就是代理Jar的绝对路径。
- 代理服务打包为Jar。
Agent一般是一个普通的Java服务,只是需要编写agentmain函数,并且该Jar包的manifest(也就是MANIFEST.MF文件)属性中需要加入Agent-Class来指定步骤1中编写好agentmain函数的那个Java类。
- 通过attach工具直接加载
Agent,执行attach的程序和需要被代理的程序可以是两个完全不同的程序。
// 列出所有VM实例
List<VirtualMachineDescriptor> list = VirtualMachine.list();
// attach目标VM
VirtualMachine.attach(descriptor.id());
// 目标VM加载Agent
VirtualMachine#loadAgent("代理Jar路径","命令参数");
Instrumentation的局限性
大多数情况下,我们使用Instrumentation都是使用其字节码插桩的功能,或者笼统说就是类重定义(Class Redefine)的功能,但是有以下的局限性:
premain和agentmain两种方式修改字节码的时机都是类文件加载之后,也就是说必须要带有Class类型的参数,不能通过字节码文件和自定义的类名重新定义一个本来不存在的类。类的字节码修改称为类转换(
Class Transform),类转换其实最终都回归到类重定义Instrumentation#redefineClasses()方法,此方法有以下限制:新类和老类的父类必须相同。
新类和老类实现的接口数也要相同,并且是相同的接口。
新类和老类访问符必须一致。
新类和老类字段数和字段名要一致。
新类和老类新增或删除的方法必须是
private static/final修饰的。可以修改方法体。
除了上面的方式,如果想要重新定义一个类,可以考虑基于类加载器隔离的方式:创建一个新的自定义类加载器去通过新的字节码去定义一个全新的类,不过也存在只能通过反射调用该全新类的局限性。