【JSP】中文乱码问题

 

以前老是碰到JSP页面乱码的问题,每次都是如今网上搜,而后胡乱改,改完也不明白缘由。apache

此次正好做下总结,中文乱码就是由于编码不符,可能出现乱码有四个地方:tomcat

1 JSP编码乱码服务器

2 HTML编码乱码cookie

3 request获取数据乱码jsp

4 response输出信息乱码ui

5 Cookie致使的编码问题编码

下面将会对上面几种状况进行介绍:url


  JSP乱码

  这种是最多见的,设置编码的位置位于JSP的第一行,若是在Eclipse中新建一个JSP默认是下面这种:

<%@ page language="java" contentType="text/html; charset=ISO-8859-1" pageEncoding="ISO-8859-1"%>

  能够看到它默认的页面编码和传输编码都是ISO-8859-1,这是用于欧洲国家的编码。

  能够经过设置Eclipse中JSP的编码格式,来修改默认生成的编码格式。

  若是想要支持中文,可使用UTF-八、GB23十二、GBK等,其中UTF-8是国际化的,哪一个国家的都支持,因此推荐使用这个。

  再来讲说上面涉及到编码的两个地方:charset 和 pageEncoding

  charset是指服务器发往客户端展示时的编码;

  pageEncoding用于设置JSP页面自己的编码。

 

  JSP在部署后提供给用户使用,会通过三个阶段

  1 JSP生成java文件:这个阶段会使用pageEncoding所定义的编码格式进行转换

  2 java文件生成class文件:这个阶段由服务器tomcat自动使用utf-8编码把java文件转换成字节码class文件  

  3 经过读取class文件展示给用户:这个阶段由tomcat服务器获取字节码内容,经过使用contentType所定义的编码格式展示给用户。

  大体过程以下图:

  这样设置好JSP中的第一行代码,就能够保证基本的JSP展示没有乱码了!

<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%>

  HTML乱码

  由于JSP中也包含html的内容,HTML自己也是有编码格式的。

复制代码
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<title>Insert title here</title>
</head>
<body>

</body>
</html>
复制代码

  若是这部分编码出现问题,那么html中标签的中文命名就会出现乱码。

  html中由于只涉及到表现层,因此只有一个属性content中charset,这个编码格式设置对了,就没问题了。

  request中文乱码

  有时候在作jsp逻辑处理时,好比提交表单,从前台注册的页面提交了一部分的数据,可是后面处理的JSP页面经过 request.getParameter 调用时,获取到的是一堆乱码。

  这是由于虽然前面JSP设置了编码格式,却没有在当前的JSP中设置读取数据的编码格式。

  使用下面的代码,就能够是设置request获取请求内容的数据编码:

request.setCharacterEncoding("utf-8");

  

  须要注意的是,这种方式对 URL传参这种JSP请求 是没有做用的。好比:

<a href="jspRequest.jsp?username=lisi">url test request(en)</a>
<a href="jspRequest.jsp?username=李四">url test request(zh)</a>

  这种状况仍然会出现乱码,这种URL传参的方式,只能修改服务器tomcat的传输编码格式。

  修改tomcat安装文件 apache-tomcat-6.0.43\conf 目录下的server.xml

  添加 URIEncoding="UTF-8" ,就能够处理URL传递参数形成的中文乱码问题了。

  response输出中文乱码

  可能如今已经没有多少使用这种方式输出页面的了,可是仍是有必要说一下,response输出页面元素内容时,也会出现乱码。

  使用下面代码就能够设置response输出的编码格式:

response.setContentType("text/html;charset=utf-8");

  cookie形成的中文乱码

  Cookie因为须要保存在客户端中,所以使用过程当中都须要编码以及转码:

  在保存Cookie数据前

  首先引入java.net.*,该包中包含URLEncoder类;

  保证response与request的编码正确;

  使用URLEncoder进行转码,并保存。

复制代码
<%@ page language="java" contentType="text/html; charset=utf-8"
    import="java.net.*"
    pageEncoding="utf-8"%>
<%
//保证request以及response的编码 
request.setCharacterEncoding("utf-8");
response.setContentType("text/html;charset=utf-8");

//使用URLEncoder解决cookie中中文问题
String username = URLEncoder.encode(request.getParameter("username"),"utf-8");
String password = URLEncoder.encode(request.getParameter("password"),"utf-8");
            
Cookie usernameCookie = new Cookie("username",username);
Cookie passwordCookie = new Cookie("password",password);
usernameCookie.setMaxAge(864000);
passwordCookie.setMaxAge(864000);
            
response.addCookie(usernameCookie);
response.addCookie(passwordCookie);
%>
复制代码

  在使用Cookie数据前

  依然要注意导入必备的包:java.net.*

  注意request的编码;

  使用URLDecoder进行解码

复制代码
<%@ page language="java" import="java.util.*,java.io.*,java.net.*" contentType="text/html; charset=utf-8"%>
<% request.setCharacterEncoding("utf-8"); String username = ""; String password = ""; Cookie[] cookies = request.getCookies(); if(cookies!=null && cookies.length>0){ for(Cookie c:cookies){ if(c.getName().equals("username")){ username = URLDecoder.decode(c.getValue(),"utf-8"); System.out.println(username); } if(c.getName().equals("password")){ password = URLDecoder.decode(c.getValue(),"utf-8"); } } } %>
复制代码

 

  参考

  【1】JSP中pageEncoding与ContentType的区别:http://blog.csdn.net/dragon4s/article/details/6604624