python下的默認編碼（python 默認編碼）

本文目錄一覽：

1、python默認編碼問題？
2、Python基本編碼格式
3、python123漢字的unicode編碼值

python默認編碼問題？

編碼就是二進制序列和代表的文本字符之間的映射關係。

你說的大多數問題是python2的，python3已經自動解決了，不需要這麼麻煩。默認是utf8.

另外平時遇到的編碼問題，通常又和源碼本身的編碼、系統終端顯示的編碼、字體糾結在一起，要考慮的因素挺多的。

個人認為理解編碼最好的方法是嘗試用寫二進制序列的方法，輸出你想要的文本，多試錯就理解了。

Python基本編碼格式

1、一般來說，聲明編碼格式在腳本中是必需的。2、如果Python源碼文件沒有聲明編碼格式，Python解釋器會默認使用ASCII編碼。但出現非ASCII編碼的字符，Python解釋器就會報錯。

1、Python 採用代碼縮進和冒號（ : ）來區分代碼塊之間的層次。2、在 Python 中，對於類定義、函數定義、流程控制語句、異常處理語句等，行尾的冒號和下一行的縮進，表示下一個代碼塊的開始，而縮進的結束則表示此代碼塊的結束。3、Python 中實現對代碼的縮進，可以使用空格或者 Tab 鍵實現。但無論是手動敲空格，還是使用 Tab 鍵，通常情況下都是採用 4 個空格長度作為一個縮進量（默認情況下，一個 Tab 鍵就表示 4 個空格）。4、對於 Python 縮進規則，初學者可以這樣理解，Python 要求屬於同一作用域中的各行代碼，它們的縮進量必須一致，但具體縮進量為多少，並不做硬性規定。

正確示例代碼:

錯誤示例代碼:

Python中使用 # 進行注釋，我們在使用# 的時候，# 號後面要空一格在行內注釋的時候，中間應該至少加兩個空格

print(“你好，世界”) # 注釋

** 使用的一般性原則：**

1、在二元運算符兩邊各空一格，算術操作符兩邊的空格可靈活使用，但兩側務必要保持一致2、不要在逗號、分號、冒號前面加空格，但應該在它們後面加（除非在行尾）3、函數的參數列表中，逗號之後要有空格4、函數的參數列表中，默認值等號兩邊不要添加空格5、左括號之後，右括號之前不要加添加空格6、參數列表，索引或切片的左括號前不應加空格

使用的一般性原則：

1、編碼格式聲明、模塊導入、常量和全局變量聲明、頂級定義和執行代碼之間空兩行2、頂級定義之間空兩行，方法定義之間空一行3、在函數或方法內部，可以在必要的地方空一行以增強節奏感，但應避免連續空行

1、導入總應該放在文件頂部，位於模塊注釋和文檔字符串之後，模塊全局變量和常量之前。

2、導入應該按照從最通用到最不通用的順序分組，分組之間空一行：

3、每個 import 語句只導入一個模塊，盡量避免一次導入多個模塊

命名規範這一塊的大家應該都比較熟悉了，但是不同的編程語言之間的明明規範也是有所區別的~

Python命名建議遵循的一般性原則：

引號使用的一般性原則：

Python跟其他幾個主流編程語言的分號使用區別很大Python的代碼末尾不需要加分號，而Java和C#等都需要添加

不要在行尾添加分號，也不要用分號將兩條命令放在同一行，例如：

Python學習日記

python123漢字的unicode編碼值

python的默認編碼是ascii，可以通過sys.setdefaultencoding(‘utf-8’)函數設置python的默認編碼。

python中可以通過encode和decode的方式改變數據的編碼，比如：

u’漢字’

u’\u6c49\u5b57′

u’漢字’.encode(‘utf-8’)

‘\xe6\xb1\x89\xe5\xad\x97’

u’漢字’.encode(‘utf-8’).decode(‘utf-8’)

u’\u6c49\u5b57′

我們可以通過這兩個函數設置編碼。

那麼，python中的str是什麼類型？

import binascii

‘漢字’

‘\xba\xba\xd7\xd6’

type(‘漢字’)

print binascii.b2a_hex(‘漢字’)

babad7d6

print binascii.b2a_hex(u’漢字’)

Traceback (most recent call last):

File “”, line 1, in

UnicodeEncodeError: ‘ascii’ codec can’t encode characters in

position 0-1: ordinal not in range(128)

print binascii.b2a_hex(u’漢字’.encode(‘utf-8’))

e6b189e5ad97

print binascii.b2a_hex(u’漢字’.encode(‘gbk’))

babad7d6

binascii是將數據的二進制轉換成ascii，上面的解釋是：‘漢字’的類型是str，二進制是babad7d6，u‘漢字’是無法轉換成ascii，這樣就報出了開頭的第一個錯誤。解決辦法就是把它.encode(‘utf-8′)成str類型。因為我命令行是windows默認的GBK編碼，所有u’漢字’.encode(‘gbk’)的時候，輸出結果和‘漢字’結果一樣。

原創文章，作者：MGECN，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/130258.html

python下的默認編碼（python 默認編碼）

本文目錄一覽：

python默認編碼問題？

Python基本編碼格式

python123漢字的unicode編碼值

相關推薦

發表回復