本文目錄一覽:
python默認編碼問題?
編碼就是二進制序列和代表的文本字符之間的映射關係。
你說的大多數問題是python2的,python3已經自動解決了,不需要這麼麻煩。默認是utf8.
另外平時遇到的編碼問題,通常又和源碼本身的編碼、系統終端顯示的編碼、字體糾結在一起,要考慮的因素挺多的。
個人認為理解編碼最好的方法是嘗試用寫二進制序列的方法,輸出你想要的文本,多試錯就理解了。
Python基本編碼格式
1、一般來說,聲明編碼格式在腳本中是必需的。2、如果Python源碼文件沒有聲明編碼格式,Python解釋器會默認使用ASCII編碼。但出現非ASCII編碼的字符,Python解釋器就會報錯。
1、Python 採用代碼縮進和冒號( : )來區分代碼塊之間的層次。2、在 Python 中,對於類定義、函數定義、流程控制語句、異常處理語句等,行尾的冒號和下一行的縮進,表示下一個代碼塊的開始,而縮進的結束則表示此代碼塊的結束。3、Python 中實現對代碼的縮進,可以使用空格或者 Tab 鍵實現。但無論是手動敲空格,還是使用 Tab 鍵,通常情況下都是採用 4 個空格長度作為一個縮進量(默認情況下,一個 Tab 鍵就表示 4 個空格)。4、對於 Python 縮進規則,初學者可以這樣理解,Python 要求屬於同一作用域中的各行代碼,它們的縮進量必須一致,但具體縮進量為多少,並不做硬性規定。
正確示例代碼:
錯誤示例代碼:
Python中使用 # 進行注釋,我們在使用# 的時候,# 號後面要空一格在行內注釋的時候,中間應該至少加兩個空格
print(“你好,世界”) # 注釋
** 使用的一般性原則:**
1、在二元運算符兩邊各空一格,算術操作符兩邊的空格可靈活使用,但兩側務必要保持一致2、不要在逗號、分號、冒號前面加空格,但應該在它們後面加(除非在行尾)3、函數的參數列表中,逗號之後要有空格4、函數的參數列表中,默認值等號兩邊不要添加空格5、左括號之後,右括號之前不要加添加空格6、參數列表, 索引或切片的左括號前不應加空格
使用的一般性原則:
1、編碼格式聲明、模塊導入、常量和全局變量聲明、頂級定義和執行代碼之間空兩行2、頂級定義之間空兩行,方法定義之間空一行3、在函數或方法內部,可以在必要的地方空一行以增強節奏感,但應避免連續空行
1、導入總應該放在文件頂部,位於模塊注釋和文檔字符串之後,模塊全局變量和常量之前。
2、導入應該按照從最通用到最不通用的順序分組,分組之間空一行:
3、每個 import 語句只導入一個模塊,盡量避免一次導入多個模塊
命名規範這一塊的大家應該都比較熟悉了,但是不同的編程語言之間的明明規範也是有所區別的~
Python命名建議遵循的一般性原則:
引號使用的一般性原則:
Python跟其他幾個主流編程語言的分號使用區別很大Python的代碼末尾不需要加分號,而Java和C#等都需要添加
不要在行尾添加分號,也不要用分號將兩條命令放在同一行,例如:
Python學習日記
python123漢字的unicode編碼值
python的默認編碼是ascii,可以通過sys.setdefaultencoding(‘utf-8’)函數設置python的默認編碼。
python中可以通過encode和decode的方式改變數據的編碼,比如:
u’漢字’
u’\u6c49\u5b57′
u’漢字’.encode(‘utf-8’)
‘\xe6\xb1\x89\xe5\xad\x97’
u’漢字’.encode(‘utf-8’).decode(‘utf-8’)
u’\u6c49\u5b57′
我們可以通過這兩個函數設置編碼。
那麼,python中的str是什麼類型?
import binascii
‘漢字’
‘\xba\xba\xd7\xd6’
type(‘漢字’)
print binascii.b2a_hex(‘漢字’)
babad7d6
print binascii.b2a_hex(u’漢字’)
Traceback (most recent call last):
File “”, line 1, in
UnicodeEncodeError: ‘ascii’ codec can’t encode characters in
position 0-1: ordinal not in range(128)
print binascii.b2a_hex(u’漢字’.encode(‘utf-8’))
e6b189e5ad97
print binascii.b2a_hex(u’漢字’.encode(‘gbk’))
babad7d6
binascii是將數據的二進制轉換成ascii,上面的解釋是:‘漢字’的類型是str,二進制是babad7d6,u‘漢字’是無法轉換成ascii,這樣就報出了開頭的第一個錯誤。解決辦法就是把它.encode(‘utf-8′)成str類型。因為我命令行是windows默認的GBK編碼,所有u’漢字’.encode(‘gbk’)的時候,輸出結果和‘漢字’結果一樣。
原創文章,作者:MGECN,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/130258.html