包含linux下mysql亂碼的詞條

本文目錄一覽：

1、MySQL數據庫中的中文亂碼如何解決
2、如何修正Linux下面MySQL中文亂碼問題
3、Linux系統下MYSQL數據庫中文數據亂碼問題
4、mysql數據庫中存進的是中文，為什麼查出來的亂碼？

MySQL數據庫中的中文亂碼如何解決

mysql數據亂碼問題可能有以下三種原因:

1.server本身設定問題，例如還停留在latin1版本;

2.table的語系設定問題(包含character與collation);

3.客戶端程式(例如php,java)的連線語系設定問題;

建議使用utf8!!!!

想要避免mysql的中文亂碼問題,可以嘗試以下方法：

1,對於版本問題，建議去官網更新最新的版本或者比較好用的版本；

2,創建數據庫，創建表時沒有對字符編碼進行設定會造成亂碼問題:

創建數據庫的時候：CREATE DATABASE `test`

CHARACTER SET ‘utf8’

COLLATE ‘utf8_general_ci’;

建表的時候 CREATE TABLE `database_user` (

`ID` varchar(40) NOT NULL default ”,

`UserID` varchar(40) NOT NULL default ”,

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

3,對於第三種情況,參考一下方法:

編輯linux服務器中/etc/my.cnf文件,在[mysql]段加入default_character_set=utf8;

如果只是調試遇到亂碼問題:

在編寫Connection URL時，加上?useUnicode=truecharacterEncoding=utf-8參數;

並且在網頁代碼中加上一個”set names utf8″或者”set names gbk”的指令，告訴MySQL連線內容都要使用utf-8或者gbk。

utf8或者gbk;

如何修正Linux下面MySQL中文亂碼問題

linux系統的字符集，應該是iso-8859-1。

如果你的項目是j2se項目的話，執行java命令時，可以指定參數，

java -Dfile.encoding=GBK XXX

如果是，j2ee項目的話，建議設置，字符集過濾器。

兩外，指定Hibernate配置中mysql的url地址的字符集。

Linux系統下MYSQL數據庫中文數據亂碼問題

根據你的問題，數據庫不在自己手邊。

那首先要調查清楚，數據表的編碼，看清，不是數據庫，是表，表的字符集編碼。

然後往前順。

然後再java程序中轉碼，保證寫到sql中的數據是以該數據表所用的字符集編碼的就好了。

亂碼出現在不同部分的通信之間

一個系統中，通常是在顯式輸入中文的地方發生轉碼錯誤。

比如，servlet處理從瀏覽器傳來的數據的時候，

從資源文件讀取數據的時候。

在程序中顯式地硬編碼字符串中文字面值的時候。

從別人的數據庫讀取數據的時候。

這些地方經常會跟之後的系統編碼不一致，所以在這些地方使用字符串數據的時候，就要轉碼。

資源文件，可以用文本工具保存成需要的編碼。

對於request中的數據，可以在正式處理之前加

過濾器。

對於別的數據庫，可以設一個專門的過濾類來轉碼。

mysql數據庫中存進的是中文，為什麼查出來的亂碼？

一、轉碼失敗

在數據寫入到表的過程中轉碼失敗，數據庫端也沒有進行恰當的處理，導致存放在表裡的數據亂碼。

針對這種情況，前幾篇文章介紹過客戶端發送請求到服務端。

其中任意一個編碼不一致，都會導致表裡的數據存入不正確的編碼而產生亂碼。

比如下面簡單一條語句：

set @a = “文本字符串”;

insert into t1 values(@a);

變量 @a 的字符編碼是由參數 CHARACTER_SET_CLIENT 決定的，假設此時編碼為 A，也就是變量 @a 的編碼。

2. 寫入語句在發送到 MySQL 服務端之前的編碼由 CHARACTER_SET_CONNECTION 決定，假設此時編碼為 B。

3. 經過 MySQL 一系列詞法，語法解析等處理後，寫入到表 t1，表 t1 的編碼為 C。

那這裡編碼 A、編碼 B、編碼 C 如果不兼容，寫入的數據就直接亂碼。

二、客戶端亂碼

表數據正常，但是客戶端展示後出現亂碼。

這一類場景，指的是從 MySQL 表裡拿數據出來返回到客戶端，MySQL 里的數據本身沒有問題。客戶端發送請求到 MySQL，表的編碼為 D，從 MySQL 拿到記錄結果傳輸到客戶端，此時記錄編碼為 E（CHARACTER_SET_RESULTS）。

那以上編碼 E 和 D 如果不兼容，檢索出來的數據就看起來亂碼了。但是由於數據本身沒有被破壞，所以換個兼容的編碼就可以獲取正確的結果。

這一類又分為以下三個不同的小類：

1)字段編碼和表一致，客戶端是不同的編碼

比如下面例子，表數據的編碼是 utf8mb4，而 SESSION 1 發起的連接編碼為 gbk。那由於編碼不兼容，檢索出來的數據肯定為亂碼。

2）表編碼和客戶端的編碼一致，但是記錄之間編碼存在不一致的情形

比如表編碼是 utf8mb4，應用端編碼也是 utf8mb4，但是表裡的數據可能一半編碼是 utf8mb4，另外一半是 gbk。那麼此時表的數據也是正常的，不過此時採用哪種編碼都讀不到所有完整的數據。這樣數據產生的原因很多，比如其中一種可能性就是表編碼多次變更而且每次變更不徹底導致（變更不徹底，我之前的篇章里有介紹）。舉個例子，表 t3 的編碼之前是 utf8mb4，現在是 gbk，而且兩次編碼期間都被寫入了正常的數據。

3）每個字段的編碼不一致，導致亂碼和第二點一樣的場景。不同的是：非記錄間的編碼不統一，而是每個字段編碼不統一。舉個例子，表 c1 字段 a1,a2。a1 編碼 gbk，a2 編碼是 utf8mb4。那每個字段單獨讀出來數據是完整的，但是所有字段一起讀出來，數據總會有一部分亂碼。

三、LATIN1

還有一種情形就是以 LATIN1 的編碼存儲數據

估計大家都知道字符集 LATIN1，LATIN1 對所有字符都是單位元組流處理，遇到不能處理的位元組流，保持原樣，那麼在以上兩種存入和檢索的過程中都能保證數據一致，所以 MySQL 長期以來默認的編碼都是 LATIN1。這種情形，看起來也沒啥不對的點，數據也沒亂碼，那為什麼還有選用其他的編碼呢？原因就是對字符存儲的位元組數不一樣，比如 emoji 字符 “❤”，如果用 utf8mb4 存儲，佔用 3 個位元組，那 varchar(12) 就能存放 12 個字符，但是換成 LATIN1，只能存 4 個字符。

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-hk/n/300646.html