[转载]MySQL 的 "SET NAMES xxx" 字符编码问题分析

转载自: PHPChina


近来接受 BBT 的培训,做一个投票系统。系统程式码倒不是很难,但是我的时间主要花费在了研究字符集和编码上面。MySQL 和 Apache 两个系统的编码(字符集)问题让我费劲脑筋,吃尽苦头。网上对这些问题的解决比较零散,比较片面,大部分是提供解决方法,却不说为什么。于是我将这几天收获总结一下,避免后来者再走弯路。这篇文章对 PHP 编写有一点帮助(看完你就知道,怎样让你的 PHP 程式在大部分空间提供商的服务器里显示正常),但是更多帮助在于网络服务器的架设和设置。

先说 MySQL 的字符集问题。Windows 下可透过修改 my.ini 内的

# CLIENT SECTION
[mysql]
default-character-set=utf8
# SERVER SECTION
[mysqld]
default-character-set=utf8

这两个字段来更改数据库的默认字符集。第一个是客户端默认的字符集,第二个是服务器端默认的字符集。假设我们把两个都设为 utf8,然后在MySQL Command Line 里面输入 “show variables like 'character%';”,可看到如下结果:

character_set_client   latin1
character_set_connection    latin1
character_set_database     utf8
character_set_results    latin1
character_set_server   utf8
character_set_system     utf8

其中的 utf8 随着我们上面的设置而改动。此时,要是我们透过采用 UTF-8 的 PHP 程式从数据库里读取资料,很有可能是一串 “?????” 或者是其他乱码。网上查了半天,解决办法倒是简单,在连结数据库之后,读取资料之前,先执行一项查询 “SET NAMES UTF8″,即在 PHP 里为

mysql_query("SET NAMES UTF8");

即可显示正常(只要数据库里资料的字符正常)。为什么会这样?这句查询 “SET NAMES UTF8″ 到底是什么作用?

到 MySQL 命令行输入 “SET NAMES UTF8;”,然后执行 “show variables like 'character%';”,发现原来为 latin1 的那些变量 “character_set_client”、”character_set_connection”、 ”character_set_results” 的值全部变为 utf8 了,原来是这 3 个变量在捣蛋。

查阅手册,上面那句等于:

SET character_set_client = utf8;
SET character_set_results = utf8;
SET character_set_connection = utf8;

看看这 3 个变量的作用:

资料输入路径:client → connection → server;

资料输出路径:server → connection → results。

换句话说,每个路径要经过 3 次改变字符集编码。以出现乱码的输出为例,server 里 utf8 的资料,传入 connection 转为 latin1,传入 results 转为 latin1,utf-8 页面又把 results 转过来。如果两种字符集不相容,比如 latin1 和 utf8,转化过程就为不可逆的,破坏性的。所以就转不回来了。

但这里要声明一点,”SET NAMES UTF8″ 作用只是临时的,MySQL 重启后就恢复默认了。

接下来就说到 MySQL 在服务器上的配置问题了。岂不是我们每次对数据库读写都得加上 “SET NAMES UTF8″,以保证资料传输的编码一致?能不能透过配置 MySQL 来达到那三个变量默认就为我们要想的字符集?手册上没说,我在网上也没找到答案。所以,从服务器配置的角度而言,是没办法省略掉那行程式码的。

总结:为了让你的网页能在更多的服务器上正常地显示,还是加上 “SET NAMES UTF8″ 吧,即使你现在没有加上这句也能正常浏览。

问题多多,多谢指正!

参考网页

  1. PHPChina: Apache和PHP网页的编码问题分析
  2. MySQL: Character Set Support
    • amos tsai
    • 11/09. 2016 7:43上午
    Using Google Chrome Google Chrome 54.0.2840.90 on Linux Linux

    我看过有人在my.cnf里面做这样的设定:

    在[mysqld]新增:
    character-set-server = utf8
    collation-server = utf8_general_ci
    init_connect = 'SET NAMES utf8'

    也许就不用在PHP里面写了
    提供给您参考

return top

%d 位部落客按了赞: