我们首先假设数据库中采用的编码为utf-8
这时我们在php页面中应当首先添加
之后在数据库查询前添加
总而言之,网页保存的编码类型、网页的charset=utf-8、和执行的set names utf8语句的编码方式应当一致
下面引用一篇不错的分析
mysql的“set names x”字符集问题分析
近来接受bbt的培训,做一个投票系统。系统代码倒不是很难,但是我的时间主要花费在了研究字符集和编码上面。mysql和apache两个系统的编码(字符集)问题让我费劲脑筋,吃尽苦头。网上对这些问题的解决比较零散,比较片面,大部分是提供解决方法,却不说为什么。于是我将这几天收获总结一下,避免后来者再走弯路。这篇文章对php编写有一点帮助(看完你就知道,怎样让你的php程序在大部分空间提供商的服务器里显示正常),但是更多帮助在于网络服务器的架设和设置。
先说mysql的字符集问题。windows下可通过修改my.ini内的
1.# client section
2.[mysql]
3.default-character-set=utf8
4.# server section
5.[mysqld]
6.default-character-set=utf8
这两个字段来更改数据库的默认字符集。第一个是客户端默认的字符集,第二个是服务器端默认的字符集。假设我们把两个都设为utf8,然后在mysql command line client里面输入“show variebles like “character_set_%”;”,可看到如下字符:
character_set_client latin1
character_set_connection latin1
character_set_database utf8
character_set_results latin1
character_set_server utf8
character_set_system utf8
其中的utf8随着我们上面的设置而改动。此时,要是我们通过采用utf-8的php程序从数据库里读取数据,很有可能是一串“?????” 或者是其他乱码。网上查了半天,解决办法倒是简单,在连接数据库之后,读取数据之前,先执行一项查询“set names utf8”,即在php里为
1.mysql_query("set names utf8");
即可显示正常(只要数据库里信息的字符正常)。为什么会这样?这句查询“set names utf8”到底是什么作用?
到mysql命令行输入“set names utf8;”,然后执行“show variebles like “character_set_%”;”,发现原来为latin1的那些变量“character_set_client”、“character_set_connection”、“character_set_results”的值全部变为utf8了,原来是这3个变量在捣蛋。查阅手册,上面那句等于:
1.set character_set_client = utf8;
2.set character_set_results = utf8;
3.set character_set_connection = utf8;
看看这3个变量的作用:
信息输入路径:client→connection→server;
信息输出路径:server→connection→results。
换句话说,每个路径要经过3次改变字符集编码。以出现乱码的输出为例,server里utf8的数据,传入connection转为latin1,传入results转为latin1,utf-8页面又把results转过来。如果两种字符集不兼容,比如latin1和utf8,转化过程就为不可逆的,破坏性的。所以就转不回来了。
但这里要声明一点,“set names utf8”作用只是临时的,mysql重启后就恢复默认了。
接下来就说到mysql在服务器上的配置问题了。岂不是我们每次对数据库读写都得加上“set names utf8”,以保证数据传输的编码一致?能不能通过配置mysql来达到那三个变量默认就为我们要想的字符集?手册上没说,我在网上也没找到答案。所以,从服务器配置的角度而言,是没办法省略掉那行代码的。
总结:为了让你的网页能在更多的服务器上正常地显示,还是加上“set names utf8”吧,即使你现在没有加上这句也能正常访问。
评论列表:
发布于 3天前回复该评论
发布于 3天前回复该评论
发布于 3天前回复该评论
发布于 3天前回复该评论
发布于 2天前回复该评论
发布于 2天前回复该评论
发布于 2天前回复该评论
发布于 2天前回复该评论