Tomcat文件上传面绕waf（流量层）

遵守法律法规，文章旨在提高安全软件的应变策略，严禁非法使用。

写在前面

无意中看到ch1ng的文章觉得很有趣，不得不感叹太厉害了，但我一看那长篇的函数总觉得会有更骚的东西，所幸还真的有，借此机会就发出来一探究竟，同时也不得不感慨下RFC文档的妙处，当然本文针对的技术也仅仅只是在流量层面上waf的绕过。

Pre

很神奇对吧，当然这不是终点,接下来我们就来一探究竟。

前置

这里简单说一下师傅的思路

部署与处理上传war的servlet是 org.apache.catalina.manager.HTMLManagerServlet

在文件上传时最终会通过处理 org.apache.catalina.manager.HTMLManagerServlet#upload

调用的是其子类实现类org.apache.catalina.core.ApplicationPart#getSubmittedFileName

这里获取filename的时候的处理很有趣

看到这段注释，发现在RFC 6266文档当中也提出这点

 Avoid including the "\" character in the quoted-string form of the filename parameter, as escaping is not implemented by some user agents, and "\" can be considered an illegal path character.

那么我们的tomcat是如何处理的嘞？这里它通过函数HttpParser.unquote去进行处理。

public static String unquote(String input) {
        if (input==null || input.length() < 2) {
            return input;
        }


        int start;
        int end;


        // Skip surrounding quotes if there are any
        if (input.charAt(0)=='"') {
            start=1;
            end=input.length() - 1;
        } else {
            start=0;
            end=input.length();
        }


        StringBuilder result=new StringBuilder();
        for (int i=start ; i < end; i++) {
            char c=input.charAt(i);
            if (input.charAt(i)=='\\') {
                i++;
                result.append(input.charAt(i));
            } else {
                result.append(c);
            }
        }
        return result.toString();
    }

简单做个总结。

如果首位是"(前提条件是里面有\字符)，那么就会去掉跳过从第二个字符开始，并且末尾也会往前移动一位，同时会忽略字符\，师傅只提到了类似test.\war这样的例子。

但其实根据这个我们还可以进一步构造一些看着比较恶心的比如 filename=""y.\w\arK" 。

深入

还是在 org.apache.catalina.core.ApplicationPart#getSubmittedFileName当中，一看到这个将字符串转换成map的操作总觉得里面会有更骚的东西(这里先是解析传入的参数再获取，如果解析过程有利用点那么也会影响到后面参数获取)，不扯远继续回到正题

首先它会获取header参数Content-Disposition当中的值，如果以form-data或者attachment开头就会进行我们的解析操作，跟进去一看果不其然，看到RFC2231Utility瞬间不困了

后面这一坨就不必多说了，相信大家已经很熟悉啦支持QP编码，忘了的可以考古看看我之前写的文章Java文件上传大杀器-绕waf(针对commons-fileupload组件)，这里就不再重复这个啦，我们重点看三元运算符前面的这段

既然如此，我们先来看看这个hasEncodedValue判断标准是什么，字符串末尾是否带*

1   public static boolean hasEncodedValue(final String paramName) {2     if (paramName !=null) {3       return paramName.lastIndexOf('*')==(paramName.length() - 1);4     }5     return false;6   }

在看解密函数之前我们可以先看看RFC 2231文档当中对此的描述，英文倒是很简单不懂的可以在线翻一下，这里就不贴中文了

Asterisks ("*") are reused to provide the indicator that language and character set 2   information is present and encoding is being used. A single quote ("'") is used to delimit the character set and language information at the beginning of the parameter value. Percent signs ("%") are used as the encoding flag, which agrees with RFC 2047.Specifically, an asterisk at the end of a parameter name acts as an indicator that character set and language information may appear at  the beginning of the parameter value. A single quote is used to separate the character set, language, and actual value information in the parameter value string, and an percent sign is used to flag octets encoded in hexadecimal.  For example:Content-Type: application/x-stuff;         title*=us-ascii'en-us'This%20is%20%2A%2A%2Afun%2A%2A%2A

接下来回到正题，我们继续看看这个解码做了些什么

public static String decodeText(final String encodedText) throws UnsupportedEncodingException {  final int langDelimitStart=encodedText.indexOf('\'');  if (langDelimitStart==-1) {    // missing charset    return encodedText;  }  final String mimeCharset=encodedText.substring(0, langDelimitStart);  final int langDelimitEnd=encodedText.indexOf('\'', langDelimitStart + 1);  if (langDelimitEnd==-1) {    // missing language    return encodedText;  }  final byte[] bytes=fromHex(encodedText.substring(langDelimitEnd + 1));  return new String(bytes, getJavaCharset(mimeCharset));}

结合注释可以看到标准格式@param encodedText - Text to be decoded has a format of {@code <charset>'<language>'<encoded_value>},分别是编码，语言和待解码的字符串，同时这里还适配了对url编码的解码，也就是fromHex函数,具体代码如下，其实就是url解码

private static byte[] fromHex(final String text) {  final int shift=4;  final ByteArrayOutputStream out=new ByteArrayOutputStream(text.length());  for (int i=0; i < text.length();) {    final char c=text.charAt(i++);    if (c=='%') {      if (i > text.length() - 2) {        break; // unterminated sequence      }      final byte b1=HEX_DECODE[text.charAt(i++) & MASK];      final byte b2=HEX_DECODE[text.charAt(i++) & MASK];      out.write((b1 << shift) | b2);    } else {      out.write((byte) c);    }  }  return out.toByteArray();}

因此我们将值当中值得注意的点梳理一下

支持编码的解码
值当中可以进行url编码
@code<charset>'<language>'<encoded_value> 中间这位language可以随便写，代码里没有用到这个的处理

既然如此那么我们首先就可以排出掉utf-8，毕竟这个解码后就直接是明文，从Java标准库当中的charsets.jar可以看出，支持的编码有很多

同时通过简单的代码也可以输出

Locale locale=Locale.getDefault();
Map<String, Charset> maps=Charset.availableCharsets();
StringBuilder sb=new StringBuilder();
sb.append("{");
for (Map.Entry<String, Charset> entry : maps.entrySet()) {
  String key=entry.getKey();
  Charset value=entry.getValue();
  sb.append("\"" + key + "\",");
}
sb.deleteCharAt(sb.length() - 1);
sb.append("}");
System.out.println(sb.toString());

运行输出

//res{"Big5","Big5-HKSCS","CESU-8","EUC-JP","EUC-KR","GB18030","GB2312","GBK","IBM-Thai","IBM00858","IBM01140","IBM01141","IBM01142","IBM01143","IBM01144","IBM01145","IBM01146","IBM01147","IBM01148","IBM01149","IBM037","IBM1026","IBM1047","IBM273","IBM277","IBM278","IBM280","IBM284","IBM285","IBM290","IBM297","IBM420","IBM424","IBM437","IBM500","IBM775","IBM850","IBM852","IBM855","IBM857","IBM860","IBM861","IBM862","IBM863","IBM864","IBM865","IBM866","IBM868","IBM869","IBM870","IBM871","IBM918","ISO-2022-CN","ISO-2022-JP","ISO-2022-JP-2","ISO-2022-KR","ISO-8859-1","ISO-8859-13","ISO-8859-15","ISO-8859-2","ISO-8859-3","ISO-8859-4","ISO-8859-5","ISO-8859-6","ISO-8859-7","ISO-8859-8","ISO-8859-9","JIS_X0201","JIS_X0212-1990","KOI8-R","KOI8-U","Shift_JIS","TIS-620","US-ASCII","UTF-16","UTF-16BE","UTF-16LE","UTF-32","UTF-32BE","UTF-32LE","UTF-8","windows-1250","windows-1251","windows-1252","windows-1253","windows-1254","windows-1255","windows-1256","windows-1257","windows-1258","windows-31j","x-Big5-HKSCS-2001","x-Big5-Solaris","x-COMPOUND_TEXT","x-euc-jp-linux","x-EUC-TW","x-eucJP-Open","x-IBM1006","x-IBM1025","x-IBM1046","x-IBM1097","x-IBM1098","x-IBM1112","x-IBM1122","x-IBM1123","x-IBM1124","x-IBM1166","x-IBM1364","x-IBM1381","x-IBM1383","x-IBM300","x-IBM33722","x-IBM737","x-IBM833","x-IBM834","x-IBM856","x-IBM874","x-IBM875","x-IBM921","x-IBM922","x-IBM930","x-IBM933","x-IBM935","x-IBM937","x-IBM939","x-IBM942","x-IBM942C","x-IBM943","x-IBM943C","x-IBM948","x-IBM949","x-IBM949C","x-IBM950","x-IBM964","x-IBM970","x-ISCII91","x-ISO-2022-CN-CNS","x-ISO-2022-CN-GB","x-iso-8859-11","x-JIS0208","x-JISAutoDetect","x-Johab","x-MacArabic","x-MacCentralEurope","x-MacCroatian","x-MacCyrillic","x-MacDingbat","x-MacGreek","x-MacHebrew","x-MacIceland","x-MacRoman","x-MacRomania","x-MacSymbol","x-MacThai","x-MacTurkish","x-MacUkraine","x-MS932_0213","x-MS950-HKSCS","x-MS950-HKSCS-XP","x-mswin-936","x-PCK","x-SJIS_0213","x-UTF-16LE-BOM","X-UTF-32BE-BOM","X-UTF-32LE-BOM","x-windows-50220","x-windows-50221","x-windows-874","x-windows-949","x-windows-950","x-windows-iso2022jp"}

这里作为掩饰我就随便选一个了UTF-16BE

同样的我们也可以进行套娃结合上面的filename=""y.\w\arK"改成filename="UTF-16BE'Y4tacker'%00%22%00y%00%5C%004%00.%00%5C%00w%00%5C%00a%00r%00K"

接下来处理点小加强，可以看到在这里分隔符无限加，而且加了号的字符之后也会去除一个号

因此我们最终可以得到如下payload，此时仅仅基于正则的waf规则就很有可能会失效

------WebKitFormBoundaryQKTY1MomsixvN8vXContent-Disposition: form-data*;;;;;;;;;;name*="UTF-16BE'Y4tacker'%00d%00e%00p%00l%00o%00y%00W%00a%00r";;;;;;;;filename*="UTF-16BE'Y4tacker'%00%22%00y%00%5C%004%00.%00%5C%00w%00%5C%00a%00r%00K"Content-Type: application/octet-stream123------WebKitFormBoundaryQKTY1MomsixvN8vX--

可以看见成功上传

变形更新2022-06-20

这里测试版本是Tomcat8.5.72，这里也不想再测其他版本差异了只是提供一种思路

在此基础上我发现还可以做一些新的东西，其实就是对org.apache.tomcat.util.http.fileupload.ParameterParser#parse(char[], int, int, char)函数进行深入分析

在获取值的时候paramValue=parseQuotedToken(new char[] {separator });，其实是按照分隔符;分割，因此我们不难想到前面的东西其实可以不用"进行包裹，在parseQuotedToken最后返回调用的是return getToken(true);，这个函数也很简单就不必多解释

private String getToken(final boolean quoted) {        // Trim leading white spaces        while ((i1 < i2) && (Character.isWhitespace(chars[i1]))) {            i1++;        }        // Trim trailing white spaces        while ((i2 > i1) && (Character.isWhitespace(chars[i2 - 1]))) {            i2--;        }        // Strip away quotation marks if necessary        if (quoted            && ((i2 - i1) >=2)            && (chars[i1]=='"')            && (chars[i2 - 1]=='"')) {            i1++;            i2--;        }        String result=null;        if (i2 > i1) {            result=new String(chars, i1, i2 - i1);        }        return result;    }

可以看到这里也是成功识别的

既然调用parse解析参数时可以不被包裹，结合getToken函数我们可以知道在最后一个参数其实就不必要加;了，并且解析完通过params.get("filename")获取到参数后还会调用到org.apache.tomcat.util.http.parser.HttpParser#unquote那也可以基于此再次变形

为了直观这里就直接明文了，是不是也很神奇

扩大利用面

现在只是war包的场景，多多少少影响性被降低，但我们这串代码其实抽象出来就一个关键

Part warPart=request.getPart("deployWar");
String filename=warPart.getSubmittedFileName();

通过查询官方文档，可以发现从Servlet3.1开始，tomcat新增了对此的支持，也就意味着简单通过javax.servlet.http.HttpServletRequest#getParts即可，简化了我们文件上传的代码负担(如果我是开发人员，我肯定首选也会使用，谁不想当懒狗呢)

getSubmittedFileName
String getSubmittedFileName()
Gets the file name specified by the client
Returns:
the submitted file name
Since:
Servlet 3.1

更新Spring 2022-06-20

早上起床想着昨晚和陈师的碰撞，起床后又看了下陈师的星球，看到这个不妨再试试Spring是否也按照了RFC的实现呢（毕竟Spring内置了Tomcat，可能会有类似的呢）

Spring为我们提供了处理文件上传MultipartFile的接口

public interface MultipartFile extends InputStreamSource {    String getName(); //获取参数名    @Nullable    String getOriginalFilename();//原始的文件名    @Nullable    String getContentType();//内容类型    boolean isEmpty();    long getSize(); //大小    byte[] getBytes() throws IOException;// 获取字节数组    InputStream getInputStream() throws IOException;//以流方式进行读取    default Resource getResource() {        return new MultipartFileResource(this);    }    // 将上传的文件写入文件系统    void transferTo(File var1) throws IOException, IllegalStateException;  // 写入指定path    default void transferTo(Path dest) throws IOException, IllegalStateException {        FileCopyUtils.copy(this.getInputStream(), Files.newOutputStream(dest));    }}

而spring处理文件上传逻辑的具体关键逻辑在org.springframework.web.multipart.support.StandardMultipartHttpServletRequest#parseRequest，抄个文件上传demo来进行测试分析

Spring4

这里我测试了springboot1.5.20.RELEASE内置Spring4.3.23，具体小版本之间是否有差异这里就不再探究

其中关于org.springframework.web.multipart.support.StandardMultipartHttpServletRequest#parseRequest的调用也有些不同

private void parseRequest(HttpServletRequest request) {    try {        Collection<Part> parts=request.getParts();        this.multipartParameterNames=new LinkedHashSet(parts.size());        MultiValueMap<String, MultipartFile> files=new LinkedMultiValueMap(parts.size());        Iterator var4=parts.iterator();        while(var4.hasNext()) {            Part part=(Part)var4.next();            String disposition=part.getHeader("content-disposition");            String filename=this.extractFilename(disposition);            if (filename==null) {                filename=this.extractFilenameWithCharset(disposition);            }            if (filename !=null) {                files.add(part.getName(), new StandardMultipartHttpServletRequest.StandardMultipartFile(part, filename));            } else {                this.multipartParameterNames.add(part.getName());            }        }        this.setMultipartFiles(files);    } catch (Throwable var8) {        throw new MultipartException("Could not parse multipart servlet request", var8);    }}

简单看了下和tomcat之前的分析很像，这里Spring4当中同时也是支持filename*格式的

看看具体逻辑

private String extractFilename(String contentDisposition, String key) {        if (contentDisposition==null) {            return null;        } else {            int startIndex=contentDisposition.indexOf(key);            if (startIndex==-1) {                return null;            } else {                //截取filename=后面的内容                String filename=contentDisposition.substring(startIndex + key.length());                int endIndex;                //如果后面开头是“则截取”“之间的内容                if (filename.startsWith("\"")) {                    endIndex=filename.indexOf("\"", 1);                    if (endIndex !=-1) {                        return filename.substring(1, endIndex);                    }                } else {                  //可以看到如果没有“”包裹其实也可以，这和当时陈师分享的其中一个trick是符合的                    endIndex=filename.indexOf(";");                    if (endIndex !=-1) {                        return filename.substring(0, endIndex);                    }                }                return filename;            }        }    }

简单测试一波，与心中结果一致

同时由于indexof默认取第一位，因此我们还可以加一些干扰字符尝试突破waf逻辑

如果filename*开头但是spring4当中没有关于url解码的部分

没有这部分会出现什么呢？我们只能自己发包前解码，这样的话如果出现00字节就会报错，报错后

看起来是spring框架解析header的原因，但是这里报错信息也很有趣将项目地址的绝对路径抛出了，感觉不失为信息收集的一种方式

Spring5

也是随便来个新的springboot2.6.4的，来看看spring5的，小版本间差异不测了，经过测试发现spring5和spring4之间也是有版本差异处理也有些不同，同样是在parseRequest

private void parseRequest(HttpServletRequest request) {        try {            Collection<Part> parts=request.getParts();            this.multipartParameterNames=new LinkedHashSet(parts.size());            MultiValueMap<String, MultipartFile> files=new LinkedMultiValueMap(parts.size());            Iterator var4=parts.iterator();            while(var4.hasNext()) {                Part part=(Part)var4.next();                String headerValue=part.getHeader("Content-Disposition");                ContentDisposition disposition=ContentDisposition.parse(headerValue);                String filename=disposition.getFilename();                if (filename !=null) {                    if (filename.startsWith("=?") && filename.endsWith("?=")) {                        filename=StandardMultipartHttpServletRequest.MimeDelegate.decode(filename);                    }                    files.add(part.getName(), new StandardMultipartHttpServletRequest.StandardMultipartFile(part, filename));                } else {                    this.multipartParameterNames.add(part.getName());                }            }            this.setMultipartFiles(files);        } catch (Throwable var9) {            this.handleParseFailure(var9);        }    }

很明显可以看到这一行filename.startsWith("=?") && filename.endsWith("?=")，可以看出Spring对文件名也是支持QP编码

在上面能看到还调用了一个解析的方法org.springframework.http.ContentDisposition#parse

，多半就是这里了,那么继续深入下

可以看到一方面是QP编码，另一方面也是支持filename*,同样获取值是截取"之间的或者没找到就直接截取=后面的部分

如果是filename*后面的处理逻辑就是else分之，可以看出和我们上面分析spring4还是有点区别就是这里只支持UTF-8/ISO-8859-1/US_ASCII，编码受限制

int idx1=value.indexOf(39);int idx2=value.indexOf(39, idx1 + 1);if (idx1 !=-1 && idx2 !=-1) {  charset=Charset.forName(value.substring(0, idx1).trim());  Assert.isTrue(StandardCharsets.UTF_8.equals(charset) || StandardCharsets.ISO_8859_1.equals(charset), "Charset should be UTF-8 or ISO-8859-1");  filename=decodeFilename(value.substring(idx2 + 1), charset);} else {  filename=decodeFilename(value, StandardCharsets.US_ASCII);}

但其实仔细想这个结果是符合RFC文档要求的

接着我们继续后面会继续执行decodeFilename

代码逻辑很清晰字符串的解码,如果字符串是否在RFC 5987文档规定的Header字符就直接调用baos.write写入

attr-char=ALPHA / DIGIT
                  / "!" / "#" / "$" / "&" / "+" / "-" / "."
                  / "^" / "_" / "`" / "|" / "~"
                  ; token except ( "*" / "'" / "%" )

如果不在要求这一位必须是%然后16进制解码后两位，其实就是url解码，简单测试即可

参考文章

习总目标

本次学习目标

第一章 HTML&CSS

1. Web基本概念

1.1 服务器和客户端的概念

1.1.1 客户端的作用

与用户进行交互，用于接收用户的输入(操作)、展示服务器端的数据以及向服务器传递数据

1.1.2 常见的客户端

PC端网页
移动端
Iot设备

1.1.3 服务器的作用

与客户端进行交互，接收客户端的数据、处理具体的业务逻辑、传递给客户端其需要的数据

1.1.4 服务器的概念

“服务器”是一个非常宽泛的概念，从硬件而言:服务器是计算机的一种，它比普通计算机运行更快、负载更高、价格更贵。服务器在网络中为其它客户机（如PC机、智能手机、ATM等终端甚至是火车系统等大型设备）提供计算或者应用服务。从软件而言:服务器其实就是安装在计算机上的一个软件，根据其作用的不同又可以分为各种不同的服务器，例如应用服务器、数据库服务器、Redis服务器、DNS服务器、ftp服务器等等

综上所述:用我们自己的话来总结的话，服务器其实就是一台(或者一个集群)安装了服务器软件的高性能计算机

1.1.5 常见的服务器硬件设备

刀片服务器
塔式服务器
机房

1.1.6 常见的服务器操作系统

服务器是一台计算机，它必须安装操作系统之后才能够安装使用服务器软件

Linux系统: 使用最多的服务器系统，安全稳定、性能强劲、开源免费（或少许费用）。
Unix系统: 和硬件服务器捆绑销售，版权不公开，用法和Linux一样。
Windows Server系统: 源代码不开放，费用高昂，漏洞较多，性能较差，运维成本高。

1.1.7 常见的服务器软件

硬件服务器装好系统，就可以安装应用软件了，像我们熟知的Tomcat、MySQL、Redis、FastDFS、ElasticSearch等等都是服务器应用软件。它们分别提供自己特定的服务器功能。如果一台服务器上安装了Tomcat，我们会就会把这台服务器叫做Tomcat服务器；如果装了MySQL，就叫做MySQL服务器。很显然，开发过程中需要很多这样的服务器。

1.1.8 虚拟机服务器

VMWare虚拟机

通常来说VMWare用于开发人员在本地电脑上搭建一个模拟的服务器环境，或自己装一些东西测试，不是团队共同使用的正式环境。

弹性云服务器

使用弹性云服务器最大的好处就是弹性伸缩。什么是弹性伸缩呢？我现在的服务器是20G内存，因为访问量暴涨我需要把内存扩容到80G，要是物理的硬件服务器就需要买来新的内存条插入主板上的内存插槽。而弹性云服务器只需要改一下内存容量的参数就行了，非常方便。等访问量下降了，再把内存容量调回来就可以，不仅方便，而且可以精准的在访问高峰期提高服务器配置而不是一直维持高配，节约成本。

1.2 服务器端应用程序

服务器端应用程序就是运行在应用服务器软件上，用于处理具体业务功能的一个应用程序，而我们学习JavaEE开发的目的就是编写服务器端应用程序。例如: 淘宝、滴滴、京东等等项目都是服务器端应用程序

1.3 业务

业务就是服务器应用程序中的各个功能，例如商城里面的: 注册、登录、添加购物车、提交订单、结算订单等等都称之为业务

1.4 请求和响应

1.4.1 请求

请求是从客户端发送给服务器，主要用于将客户端的数据传递给服务器

1.4.2 响应

响应是从服务器发送给客户端，主要用于将服务器的数据传递给客户端

2. 本阶段技术体系

2.1 本阶段技术体系

2.1.1 客户端技术

HTML、CSS、JavaScript、Vue、Ajax、Axios

2.1.2 服务器端技术

Tomcat、Servlet、Request、Response、Cookie、Session、Filter、Listener、Thymeleaf

2.1.3 持久层技术(数据库技术已学)

MySql、JDBC、连接池、DBUtils

2.1.4 图解

明：本栏目所使用的素材都是凯哥学堂VIP学员所写，学员有权匿名，对文章有最终解释权；凯哥学堂旨在促进VIP学员互相学习的基础上公开笔记。

Html5-网页编程

跑马灯：<marquee>标签 direction属性：移动方向 loop属性：循环次数 behavior属性：出发点 scrollamount属性：移动速度

标记针对网页进行一个分区

样式其实就是标签中的style的属性内容，页面的美化布局都是由这些属性来控制的，在标记中找到的属性是有限的。如果都是在style属性中去写样式内容，那么每个都得去写，势必就会有许多的代码的重复，所以这个时候就引入了css样式表，去统一的、综合的管理这些style属性里的内容。

样式表就是标记属性配置。

内部样式表：head标记之间写一个 style 标记即可

外部样式表：head标记之间写一个 link 标记引入外部样式文件

样式选择器：

如何给样式表起名字，能概括那些标记。

标记样式：直接写标记名称可以设置整个页面此标记的样式。只要网页中出现这个标记，那么就全部映对这个样式。不太推荐

标记名称：

ID名称设置

注意：标记名称样式大于id名称样式，id名称样式会覆盖标记名称样式

. class属性样式，这种样式需要你在标记中写 class属性才可以引入

id 和 class 的区别:

id 是标记的起个名字，这个名字是全局唯一

class 引入样式表可以重复引入也可以多引入

在线咨询

上一篇：弹出层插件 jqgrid的使用
下一篇：javascript操作cookie

您的项目需求

*请认真填写需求信息，我们会在24小时内与您取得联系。

整合营销服务商