透彻分析和解决一切javaWeb项目乱码问题

言

乱码是我们在程序开发中经常碰到且让人头疼的一件事，尤其是我们在做javaweb开发，如果我们没有清楚乱码产生的原理，碰到乱码问题了就容易摸不着头脑，无从下手。

乱码主要出现在两部分，如下：

第一，浏览器通过表单提交到后台，如果表单内容有中文，那么后台收到的数据可能会出现乱码。

第二，后端服务器需要返回给浏览器数据，如果数据中带有中文，那么浏览器上可能会显示乱码。

接下来我们逐一分析乱码产生的原因，以及如何解决乱码问题。

一、后端收到浏览器提交的中文乱码

这里又分为get请求和post请求。

get请求

get请求，请求参数中带有中文，后台接收会出现乱码，原因是tomcat默认编码是“ISO-8859-1”，所以tomcat会使用“ISO-8859-1”对中文进行编码，该编码不支持中文，所以后台接收到就乱码了。解决方式有两种。

param = new String(param.getBytes("ISO-8859-1"),"utf-8");
修改tomcat编码为"utf-8"，不建议使用这种方式。

post请求

post请求，出现乱码的原因同get请求，解决方式比较简单，如下：

request.setCharacterEncoding("utf-8");

设置请求参数的编码格式为“utf-8”，这样就不会有问题了。

二、后端返回中文给浏览器发生乱码

后端返回数据给浏览器，一般也有两种形式，一种是response.getOutputStream()，一种是response.getWriter()。

两者区别以及使用规则

getOutputStream()就是得到了OutputStream，用来向客户端（浏览器）输出任何数据，如果输出的是字符，会被转换成二进制输出，如果字符中出现中文，那么会出现“java.io.CharConversionException:Not an ISO 8859-1 character:”异常
getWriter()是对outputStream进行了包装,用来输出字符用的。

因此，调用requonse.getWriter()方法时可实现文本字符串数据输出，调用response.getOutputStream()方法可现实字节流数据的输出。所以，如果要输出图片等二进制数据时，需要使用response.getOutputStream。

注意，getOutputStream()和getWriter()不能同时使用，否则会抛出”getWriter() has already been called for this response“异常。

区别讲完了，下面我们主要还是通过实践分析下乱码产生的原理。

response.getOutputStream().print()

返回英文数据就不说了，没什么问题，看下返回中文是什么效果；

@RequestMapping("/helloworld.do")
public void helloworld(HttpServletRequest request, HttpServletResponse response) throws IOException {
    String str = "中国加油，武汉加油";
    response.getOutputStream().print(str);
}

结果如下：

分析：

OutPutStream是输出二进制数据的，所以需要对字符串改成二进制输出，Tomcat使用的是"ISO8859-1"编码对其进行转换，而中文对”ISO859-1“不支持，所以就抛异常了。

response.getOutputStream.write()

同样的，我们再来看下输出中文会怎么样。

@RequestMapping("/helloworld.do")
public void helloworld(HttpServletRequest request, HttpServletResponse response) throws IOException {
    String str = "中国加油，武汉加油";
    response.getOutputStream().write(str.getBytes());
}

页面输出结果如下：

涓浗鍔犳补锛屾姹夊姞娌�

分析：

在java中,String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组，我电脑的系统是macos，默认编码格式是utf-8，返回给浏览器是utf-8编码格式的字节数组，但是浏览器默认是"gbk"编码解析，所以就乱码了。

既然这样，那我们换成“gb2312”编码（gb2312编码是gbk编码的一种）试试呢？

@RequestMapping("/helloworld.do")
public void helloworld(HttpServletRequest request, HttpServletResponse response) throws IOException {
    String str = "中国加油，武汉加油";
    response.getOutputStream().write(str.getBytes());
}

页面输出：

中国加油，武汉加油

原理我们弄清楚了，但是在项目开发中，我们需要编码统一，最常用的就是中文字符编码"UTF-8"，可是按照我们的理解，如果我们直接response.getOutputStream().write(str.getBytes("utf-8"));肯定会乱码，我们需要用某种方式，告诉浏览器，你要用我指定的“utf-8”编码接受我返回的中文。response.setContentType("text/html;charset=UTF-8")这样就完事了，看看效果吧。

@RequestMapping("/helloworld.do")
public void helloworld(HttpServletRequest request, HttpServletResponse response) throws IOException {
    String str = "中国加油，武汉加油";
    response.setContentType("text/html;charset=utf-8");
    response.getOutputStream().write(str.getBytes("utf-8"));
}

页面输出：

中国加油，武汉加油

response.getWriter()

前面已经总结过了，response.getWriter()跟response.getOutputStream()不一样，outputStream是输出二进制的，writer是输出字符串的。response.getWriter()输出也有两种方法，一种是print()，一种是write()，其实两者在处理乱码这一块没有什么区别，就不分开讲述了。

示例：

@RequestMapping("/helloworld.do")
public void helloworld(HttpServletRequest request, HttpServletResponse response) throws IOException {
    String str = "中国加油，武汉加油";
    response.getWriter().print(str);
}

页面输出：

?????????

分析：

同样的，Tomcat默认的编码是ISO 8859-1，当我们输出中文数据的时候，Tomcat会依据ISO 8859-1码表给我们的数据编码，中文不支持这个码表呀，所以出现了乱码。

这个时候response.setContentType("text/html;charset=UTF-8")又派上用场了。

@RequestMapping("/helloworld.do")
public void helloworld(HttpServletRequest request, HttpServletResponse response) throws IOException {
    String str = "中国加油，武汉加油";
    response.setContentType("text/html;charset=utf-8");
    response.getWriter().print(str);
}

页面输出：

中国加油，武汉加油

在这里，response.setContentType("text/html;charset=UTF-8")做了两件事，response.setCharacterEncoding("UTF-8");和response.setHeader("Content-Type", "text/html;charset=UTF-8");具体就是，第一，输出中文”中国加油，武汉加油“的时候，对中文进行”utf-8“编码；第二，告诉浏览器，你也要用"utf-8"来显示我返回的中文。

最后

对于springMVC项目，如何解决乱码问题呢？项目中一般会在web.xml中配置编码过滤器。配置如下：

  <filter>
    <filter-name>encodingFilter</filter-name>
    <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class>
    <init-param>
      <param-name>encoding</param-name>
      <param-value>UTF-8</param-value>
    </init-param>
    <init-param>
      <param-name>forceEncoding</param-name>
      <param-value>true</param-value>
    </init-param>
  </filter>
  <filter-mapping>
    <filter-name>encodingFilter</filter-name>
    <url-pattern>/*</url-pattern>
  </filter-mapping>

这样能保证请求的参数按照指定的编码格式进行编码，简单翻看下过滤器源码如下：

@Override
    protected void doFilterInternal(
            HttpServletRequest request, HttpServletResponse response, FilterChain filterChain)
            throws ServletException, IOException {

        if (this.encoding != null && (this.forceEncoding || request.getCharacterEncoding() == null)) {
            request.setCharacterEncoding(this.encoding);
            if (this.forceEncoding) {
                response.setCharacterEncoding(this.encoding);
            }
        }
        filterChain.doFilter(request, response);
    }

代码中有两处重要的地方值得注意，分别是request.setCharacterEncoding(this.encoding);和response.setCharacterEncoding(this.encoding);前者表示我们对请求过来的参数使用指定的"utf-8"进行编码，后者便是，返回给浏览器时，后端返回字符的编码是“utf-8”。

好了，经过以上分析是不是乱码也没有那么可怕了。只要明白其中的缘由，解决起来就是一行代码或者几行配置的事儿了，如果大家觉得有帮助，不妨点赞支持一下？

文乱码问题是比较常见和烦人的问题，本文通过一个小程序介绍了如何通过Servlet从上一个页面获取参数，

方法很简单：调用request.getParameter(String s)方法。

解决中文乱码问题的方法是：

首先要设置response响应的格式：response.setContextType("text/html;charSet=GBK");

然后在加上request.setCharacterEncoding("GBK")

需要注意的是这是解决post方式提交的内容的中文乱码问题。

解决get方式提交内容的中文乱码问题的方法：

在Tomcat->conf文件夹->server.xml-->connecter标签里加上：

URIEncoding="GBK"(注意：在xml里面“=”两边不要有空格）

关于Post和Get之间的区别可以看我转载的另一篇博文：

HTTP POST GET 本质区别详解

例子：

1.threeparams.html

<html>
<body>
<form method="post" action="Threeparams">
<table>
<tr>
<td>
param1
</td>
<td>
<input name="p1" type="text"/>
</td>
</tr>
<tr>
<td>
param2
</td>
<td><input name="p2" type="text"/>
</td>
</tr>
<tr>
<td>
param3
</td>
<td><input name="p3" type="text"/>
</td>
</tr>
<td><input type="submit" value="submit">
</td>
</tr>
</table>
</form>
</body>
</html>

2.ThreeParams.java

import java.io.*;
import javax.servlet.ServletException;
import javax.servlet.http.*;
public class ThreeParams extends HttpServlet{
@Override
protected void doGet(HttpServletRequest req, HttpServletResponse resp)
throws ServletException, IOException {
doPost(req,resp);
}
@Override
protected void doPost(HttpServletRequest req, HttpServletResponse resp)
throws ServletException, IOException {
resp.setContentType("text/html;charset=GBK");
//解决post方式提交内容的中文乱码
//一定要卸载存取第一个参数之前
//不要调用resp.setCharacterEncoding("GBK");
req.setCharacterEncoding("GBK");
//解决get方式乱码问题：修改server.xml中的connector标签-->URIEncoding="GBK"
PrintWriter out = resp.getWriter();
out.println(req.getParameter("p1"));
out.println("</br>");
out.println(req.getParameter("p2"));
out.println("</br>");
out.println(req.getParameter("p3"));
out.println("</br>");
}
}

补充：

上面的这个例子.html中每个name都不一样，如果有多个一样的name时，可以按如下的方法来获取：

1）Enumeration paramNames = request.getParameterNames()

调用此方法获得所有参数的名字，返回一个Enumeration

2) while(paramNames.hasMoreElements()){

String paramName = (String)paramNames.nextElement();

String[] paramValues = request.getParameterValues(paramName);

...

html是什么？html文档基本结构

html（hyper text markup language）：超文本标记语言.它不是一种编程语言,而是一种标记语言,它有一套标记标签(markup tag).html使用标记标签来描述网页.html文档也叫web页面

你可以使用html来建立自己的web站点.

网页主要由3部分组成:

■html:结构(structure)

■css:表现(presentation)

■javascript：行为(behavior)

html实例:

<!doctype html>

<html>

<body>

<h1>我是第一个标题</h2>

<p>我是第一个段落</p>

</body>

</html>

●<html>元素定义了整个html文档,这个元素有个开始标签<html>,有个结束标签</html>

●<head>元素必须包含文档的标题(title),可以包含脚本,样式,meta信息以及其他更多的信息

●<body>元素定义文档的主体,<body>元素包含文档的所有内容(比如文本,超链接,图像,表格和列表等等)

二创建你的第一个html页面

html文件是文本文件,因此你可以使用任何文本编辑器来创建你的第一个网页.

给大家推荐几款常用的编辑器:

●Notepad++

●Sublime Text

●HBuilder

●EditPlus

在编辑器中输入:

<html>

<head>

</head>

<body>

<p>我的第一个段落.</p>

</body>

</html>

保存为first.html(后缀名也可以是.htm,推荐使用.html)

注意:对于中文网页需要使用<meta charset="utf-8">声明编码,否则会出现乱码.有些浏览器会设置GBK为默认编码,则你需要设置为<meta charset="gbk">

<title>标签定义了html文档的标题,在所有html文档中是必需的

<title>元素:

●定义浏览器工具栏中的标题

●提供页面被添加到收藏夹时的标题

●显示在搜索引擎结果的页面标题

<html>

<head>

<title>我的第一个页面</title>

</head>

<body>

<p>我的第一个段落.</p>

</body>

</html>

在editplus中运行的结果:

在线咨询

上一篇：JS合并拼接字符串的5种方法
下一篇：正则表达式以及正则在JS表单校验中的应用

您的项目需求

*请认真填写需求信息，我们会在24小时内与您取得联系。

整合营销服务商

透彻分析和解决一切javaWeb项目乱码问题

言

一、后端收到浏览器提交的中文乱码

二、后端返回中文给浏览器发生乱码

最后

您的项目需求