本文目錄一覽:
python中line.split()的用法及實際使用示例
Python中split()函數,通常用於將字符串切片並轉換為列表。
split():語法:
拆分字符串。通過制定分隔符將字符串進行切片,並返回分割後的字符串列表[list]
參數:str:分隔符,默認為空格,但不能為空(“”)
num: 表示分割次數。如果指定num,則分割成n+1個子字符串,並可將每個字符串賦給新的變量
line.strip().split(’,’)
strip()表示刪除掉數據中的換行符,split(‘,’)則是數據中遇到‘,’ 就隔開。
Python數據分析筆記#7.3.1 字符串對象方法
「目錄」
數據清洗和準備
Data Cleaning and Prepration
——– 字符串對象方法
字符串對象方法
Python能夠成為流行的數據處理語言的部分原因是其易於處理字符串和文本。大部分文本運算都直接做成了字符串對象的內置方法。
split方法可以 通過指定分隔符對字符串進行切片 。
例如,以逗號分割的字符串可以用split拆分成數段:
strip可以 去除字符串頭尾指定的字符 ,默認是空白符或換行符。
strip常常與split一起使用:
利用 加法可以將字符串連接起來 :
但這種方式並不實用,畢竟字符串多了就很麻煩。一種更快 更符合Python風格的方式是是使用join方法 ,我們向join方法中傳入一個列表或元組:
檢測子串的最佳方法是利用Python的in關鍵字,還可以使用index和find。
index和find會 查找指定值的首次出現的位置 。
find和index的區別是:若找不到字符串,index將會引發一個 異常 ,find則會返回 -1 :
count可以 返回指定字串的出現次數
replace用於將 指定模式替換為另一個模式 (replace will substitute occurrences of one pattern for another)
再記錄幾個Python內置的字符串方法吧。
startswith和endswith: 若字符串以某個前綴(後綴)開頭,則返回True :
lower和uppe: 分別將字母字符轉換為小寫或大寫 。
ljust和rjust: 用空格(或其他字符)填充字符串的空白側以返回符合最低寬度的字符串 。
這章終於還剩兩節就結束了。
-END-
Python切片語法圖像記憶法
無論是字符串、列表還是元組,都被稱作【序列】,只要是序列就可以切片。而搞清楚序列的序號的定位方法,是一個基本功。
在Python里,序號有兩種表達方式,一個是 正向角標序號 ,一個是 反向倒數序號 。
我定義的這兩個名字,會更利於中文語言環境的同學的理解和學習。
一圖勝萬言:
有一個字符串序列”abcdef”,它的每一個字符的角標關係就是上圖所示。其實這個方法也叫【插空法】。想象序列中每一項之間都有一個空隙,我們就是把0,1,2,3,4,5……這個數數序列插到空隙中。對於每一項來說,它的左下角的角標就是自己的定位,大家都是對號入座的。
建立一個有效的模型,通過這樣一個明確的方法,至少我個人在平時列表序號時可以一步到位,不會數錯。
在做切片時,有時還會用到倒序號,其實很好辦,比如字母d就是倒數第3個,很符合中文的語言習慣,python的序號就是-3.
那麼他是什麼原理呢?你可以試着把上面的圖寫在一個紙條上,把它首尾相接,這個時候,f的右下角標和a的左下角標重合,都是0,像不像一個數軸?在數軸上,0的右側起,是1,2,3,4,……,0的左側起,自然就是-1,-2,-3,……了,很自然是不是?
再換一個角度,從負數開始插空,是不是還是左下角角標規則?神奇吧?~
這就是python的神奇之處,他很符合我們的數學邏輯,而且是一個統一、自洽的嚴謹邏輯。
記住一句話: 。總共分成三類, 0個冒號 、 1個冒號 和 2個冒號 。
當序號是0時,冒號語法允許不寫0。最後兩個公式里,其實是[0:-4]和[-4:0]。可以發現,只有位置是0時,可以左右顛倒,因為0既可以表示第1位的序號數(在冒號左側時),也可以表示最後一位(在冒號右側時,因為左閉右開),正因為如此特殊,0才可以省略不寫。
這其實又呼應了上一章節的反向倒數序號,f的右下側角標其實是0,再次驗證這種抽象模型的合理性。再好好看看這個模型,記住它。
如果你觀察得很仔細,前面的藍色注釋里括號內的部分,正是每次省略冒號的默認值。
第二個冒號後的數字是步長,它決定了前面所得到的子串 是從第一個開始第n個作為下一個。
默認是1,就意味着,0:4首先取到前4個字符abcd,然後每+1個序號,取一個,直到都取完,那默認就是abcd,沒有變化。
如果是題目中的步長為2,那麼就是取得到的abcd的第0位,第0+2位,第0+2+2位(此位不存在,不再往後累加2),那麼得到的是ac,你懂了。
Python的字符串切片及常用方法
獲取Python字符串中的某字符可以使用索引:
截取字符串中的一段字符串可以使用切片,切片在方括號中使用冒號:來分隔需要截取的首尾字符串的索引,方式是包括開頭,不包括結尾
當尾索引沒有給出時,默認截取到字符串的末尾
當頭索引沒有給出的時候默認從字符串開頭開始截取
當尾索引和頭索引都沒有給出的時候,默認返回整個字符串,不過這只是一個淺拷貝
當尾索引大於總的字符串長度時,默認只截取到字符串末尾,很明顯使用這種方法來截取一段到字符串末尾的子字符串是非常不明智的,應該是不給出尾索引才是最佳實踐
當頭索引為負數時,則是指從字符串的尾部開始計數,最末尾的字符記為-1,以此類推,因此此時應該注意尾索引的值,尾索引同樣可以為負數,如果尾索引的值指明的字符串位置小於或等於頭索引,此時返回的就是空字符串
切片是Python中截取字符串最強大的功能。
以下列舉部分Python字符串常用的方法:
原創文章,作者:FLXVA,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/316512.html