中文乱码01

什么叫编码,什么叫解码。

String  --->bytes[]   编码:将看得懂的变成看不懂的。

bytes[]  ----> String    解码:将看不懂的变成能看懂的。


首先分清使用的模块,

浏览器通过JSP显示编码和服务器response(响应的数据),

服务器采用URIEncoding或者URIDecoding处理get数据,

数据库使用数据库字符集与外界交互,


html页面:(静态页面)

浏览器会根据<http header:content-type=text/html; charset=”UTF-8”>的值来决定用编码集,

离线的本地html要在meta标签中指定,不指定会采用默认的编码。     

<meta http-equiv=”Content-Type” content=”text/html”; charset=”UTF-8”>。

 

Request :request.setCharacterEncoding(“UTF-8”)应用于通过getParameter()获取字符串,只对POST有效。必须设置在servlet中getParameter()方法被调用之前,原因是:只有在第一次调用getParameter()方法时会查询encoding编码格式,后续的getParameter将不再查询编码格式。

对于GET提交,get提交的内容存在URI中,需在Tomcat的server.xml设置,在文档的43行左右,Connector标签中设置生成URI时的编码格式 URIEncoding=”UTF-8”(针对URI类型数据,在server中统一设置编码格式,使用统一的解码方式,避免了乱码的发生)。默认为ISO8859-1。过滤器解决不了 get提交,get提交只能通过 tomcat中设置URIEncoding=”UTF-8”解决。


Response :response.setContentType(“text/html”;charset=”UTF-8”)是指定浏览器(JSP)的显示编码,在浏览器端解决问题,显示编码不一定在JSP中有效果,因为JSP中设置的编码格式优先级更高。

response.setCharacterEncoding(“UTF-8”)的作用是设置HTTP的响应编码,在servlet端解决问题。设置应在getWriter和response被提交之前。(此编码的设置是针对要返回的数据进行编码生成response,返回)。

 

JSP:(动态页面)  

<%@page ContentType=”text/html;charset=UTF-8”%>

<%@page pageEncoding=”charset=UTF-8”%>

以上两种编码只有一种有效,用于设置 页面的显示编码。

如果页面中使用include标签导入了其他的JSP,采用<%@ include file=”BB.jsp”%>设置,BB.jsp中不能再设置编码,采用<jsp:include page=”BB.jsp”/>设置,BB.jsp中还可以设置编码。




MySQL中涉及的几个字符集

character-set-server/default-character-set:服务器字符集,默认情况下所采用的。

character-set-database:数据库字符集。

character-set-table:数据库表字符集。

优先级依次增加。所以一般情况下只需要设置character-set-server,而在创建数据库和表时不特别指定字符集,这样统一采用character-set-server字符集。

character-set-client:客户端的字符集。客户端默认字符集。当客户端向服务器发送请求时,请求以该字符集进行编码。

character-set-results:结果字符集。服务器向客户端返回结果或者信息时,结果以该字符集进行编码。

在客户端,如果没有定义character-set-results,则采用character-set-client字符集作为默认的字符集。所以只需要设置character-set-client字符集。

要处理中文,则可以将character-set-server和character-set-client均设置为GB2312,如果要同时处理多国语言,则设置为UTF8。

 

Tomcat 涉及的字符集:

默认情况下,tomcat使用的是iso8859-1的编码编码方式,浏览器的标签中src指向的地址要通过tomcat去解析。如果包含中文,采用这种编码方式就会出现乱码问题,而在这种情况下,乱码问题就表现出无法访问该音频文件了。
解决方法很简单:
修改tomcat下的conf/server.xml文件,找到如下代码:
connectionTimeout="20000"
redirectPort="8443" />


这段代码规定了Tomcat监听HTTP请求的端口号等信息。可以在这里添加一个属性:URIEncoding,将该属性值设置为UTF-8,即可让Tomcat(默认ISO-8859-1编码)以UTF-8的编码处理get请求。更改后的代码如下所示:

URIEncoding="UTF-8"
protocol="HTTP/1.1"
connectionTimeout="20000"

redirectPort="8443" /> 



更易懂,更详细解释看这里:http://blog.csdn.net/ca1m0921/article/details/79286654