本文目錄一覽:
- 1、如何用Python爬取數據?
- 2、如何用python通過read()方法統計text1.txt文件中數字、空格、字母出現的次數?
- 3、怎樣用python,讀取excel中的一列數據
- 4、python中根號怎麼輸入
- 5、怎麼用python直接讀取txt文件中的數字
- 6、怎麼用python讀取excel表格的數據
如何用Python爬取數據?
方法/步驟
在做爬取數據之前,你需要下載安裝兩個東西,一個是urllib,另外一個是python-docx。
請點擊輸入圖片描述
然後在python的編輯器中輸入import選項,提供這兩個庫的服務
請點擊輸入圖片描述
urllib主要負責抓取網頁的數據,單純的抓取網頁數據其實很簡單,輸入如圖所示的命令,後面帶鏈接即可。
請點擊輸入圖片描述
抓取下來了,還不算,必須要進行讀取,否則無效。
請點擊輸入圖片描述
5
接下來就是抓碼了,不轉碼是完成不了保存的,將讀取的函數read轉碼。再隨便標記一個比如XA。
請點擊輸入圖片描述
6
最後再輸入三句,第一句的意思是新建一個空白的word文檔。
第二句的意思是在文檔中添加正文段落,將變數XA抓取下來的東西導進去。
第三句的意思是保存文檔docx,名字在括弧裡面。
請點擊輸入圖片描述
7
這個爬下來的是源代碼,如果還需要篩選的話需要自己去添加各種正則表達式。
如何用python通過read()方法統計text1.txt文件中數字、空格、字母出現的次數?
(1)先讀取文件(假設文件的目錄在C盤):
file=open(“C:\\text.txt”,”r”)
res=file.read() #讀取內容
file.close() #關閉
(2)統計:
#出現的次數要用count()方法
#空格出現的次數
a1=res.count(” “)
print(a1) #輸出
#數字出現的次數
i=0
for j in range(11): #for循環
i+=res.count(str(j))
print(i) #輸出
#字母出現的次數更麻煩,因為太多了,包括大寫和小寫。
i=0 #初始化變數i
#先統計大寫字母
for j in range(65,91):
i+=res.count(str(chr(j)))
#在統計小寫字母
for j in range(97,123):
i+=res.count(str(chr(j)))
print(i) #輸出
(3)完整代碼:
file=open(“C:\\text.txt”,”r”)
res=file.read() #讀取內容
file.close() #關閉
#出現的次數要用count()方法
#空格出現的次數
a1=res.count(” “)
print(a1) #輸出
#數字出現的次數
i=0
for j in range(11): #for循環
i+=res.count(str(j))
print(i) #輸出
#字母出現的次數更麻煩,因為太多了,包括大寫和小寫。
i=0 #初始化變數i
#先統計大寫字母
for j in range(65,91):
i+=res.count(str(chr(j)))
#在統計小寫字母
for j in range(97,123):
i+=res.count(str(chr(j)))
print(i) #輸出
效果
(4)說明
這裡必須要說一下,chr()是什麼?
chr方法可以生成一些特殊字元、漢字、小寫大寫字母
chr的參數如果在97到122之間生成小寫字母
chr的參數如果在65到90之間生成大寫字
舉個例子:
chr(49)會生成”1″
chr(98)會生成”b”
效果
(5)看不懂的代碼代碼請追問,如有幫助請採納
怎樣用python,讀取excel中的一列數據
用python讀取excel中的一列數據步驟如下:
1、首先打開dos命令窗,安裝必須的兩個庫,命令是:pip3 install xlrd;Pip3 install xlwt。
2、準備好excel。
3、打開pycharm,新建一個excel.py的文件,首先導入支持庫import xlrdimport xlwt。
4、要操作excel,首先得打開excel,使用open_workbook(『路徑』),要獲取行與列,使用nrows(行),ncols(列),獲取具體的值,使用cell(row,col).value。
5、要在excel里寫入值,就要使用write屬性,重點說明寫入是用到xlwt這個支援庫,思路是先新建excel,然後新建頁簽B,然後將一組數據寫入到B,最後保存為excel.xls。
python中根號怎麼輸入
第一種方法:使用math模塊,使用之前需要先調用。
第二種方法:使用內置函數pow()。
第三種方法:使用數學表達式。
python學習網,免費的在線學習python平台,歡迎關注!
怎麼用python直接讀取txt文件中的數字
# -*- coding:utf-8 -*-
f=open(‘test.txt’)
s = f.readline()
print(s)
while s!=’\n’:
arr=s.split(‘ ‘)
a1=arr[0]
a2=arr[1].replace(‘\n’,”) #readline 讀取文件的時候,默認加上「\n”
print(a1)
print(a2)
s=f.readline()
讀取test.txt 賦值給變數a1,a2
怎麼用python讀取excel表格的數據
一、讀excel表
讀excel要用到xlrd模塊,官網安裝()。然後就可以跟著裡面的例子稍微試一下就知道怎麼用了。大概的流程是這樣的:
1、導入模塊
複製代碼代碼如下:
import xlrd
2、打開Excel文件讀取數據
複製代碼代碼如下:
data = xlrd.open_workbook(‘excel.xls’)
3、獲取一個工作表
① table = data.sheets()[0] #通過索引順序獲取
② table = data.sheet_by_index(0) #通過索引順序獲取
③ table = data.sheet_by_name(u’Sheet1′)#通過名稱獲取
4、獲取整行和整列的值(返回數組)
複製代碼代碼如下:
table.row_values(i)
table.col_values(i)
5、獲取行數和列數
複製代碼代碼如下:
table.nrows
table.ncols
6、獲取單元格
複製代碼代碼如下:
table.cell(0,0).value
table.cell(2,3).value
就我自己使用的時候覺得還是獲取cell最有用,這就相當於是給了你一個二維數組,餘下你就可以想怎麼干就怎麼幹了。得益於這個十分好用的庫代碼很是簡潔。但是還是有若干坑的存在導致話了一定時間探索。現在列出來供後人參考吧:
1、首先就是我的統計是根據姓名統計各個表中的信息的,但是調試發現不同的表中各個名字貌似不能夠匹配,開始懷疑過編碼問題,不過後來發現是因為空格。因為在excel中輸入的時候很可能會順手在一些名字後面加上幾個空格或是tab鍵,這樣看起來沒什麼差別,但是程序處理的時候這就是兩個完全不同的串了。我的解決方法是給每個獲取的字元串都加上strip()處理一下。效果良好
2、還是字元串的匹配,在判斷某個單元格中的字元串(中文)是否等於我所給出的的時候發現無法匹配,並且各種unicode也不太奏效,百度過一些解決方案,但是都比較複雜或是沒用。最後我採用了一個比較變通的方式:直接從excel中獲取我想要的值再進行比較,效果是不錯就是通用行不太好,個呢不能問題還沒解決。
二、寫excel表
寫excel表要用到xlwt模塊,官網下載()。大致使用流程如下:
1、導入模塊
複製代碼代碼如下:
import xlwt
2、創建workbook(其實就是excel,後來保存一下就行)
複製代碼代碼如下:
workbook = xlwt.Workbook(encoding = ‘ascii’)
3、創建表
複製代碼代碼如下:
worksheet = workbook.add_sheet(‘My Worksheet’)
4、往單元格內寫入內容
複製代碼代碼如下:
worksheet.write(0, 0, label = ‘Row 0, Column 0 Value’)
5、保存
複製代碼代碼如下:
workbook.save(‘Excel_Workbook.xls’)
由於我的需求比較簡單,所以這上面沒遇到什麼問題,唯一的就是建議還是用ascii編碼,不然可能會有一些詭異的現象。
當然xlwt功能遠遠不止這些,他甚至可以設置各種樣式之類的。附上一點例子
複製代碼代碼如下:
Examples Generating Excel Documents Using Python’s xlwt
Here are some simple examples using Python’s xlwt library to dynamically generate Excel documents.
Please note a useful alternative may be ezodf, which allows you to generate ODS (Open Document Spreadsheet) files for LibreOffice / OpenOffice. You can check them out at:
The Simplest Example
import xlwt
workbook = xlwt.Workbook(encoding = ‘ascii’)
worksheet = workbook.add_sheet(‘My Worksheet’)
worksheet.write(0, 0, label = ‘Row 0, Column 0 Value’)
workbook.save(‘Excel_Workbook.xls’)
Formatting the Contents of a Cell
import xlwt
workbook = xlwt.Workbook(encoding = ‘ascii’)
worksheet = workbook.add_sheet(‘My Worksheet’)
font = xlwt.Font() # Create the Font
font.name = ‘Times New Roman’
font.bold = True
font.underline = True
font.italic = True
style = xlwt.XFStyle() # Create the Style
style.font = font # Apply the Font to the Style
worksheet.write(0, 0, label = ‘Unformatted value’)
worksheet.write(1, 0, label = ‘Formatted value’, style) # Apply the Style to the Cell
workbook.save(‘Excel_Workbook.xls’)
Attributes of the Font Object
font.bold = True # May be: True, False
font.italic = True # May be: True, False
font.struck_out = True # May be: True, False
font.underline = xlwt.Font.UNDERLINE_SINGLE # May be: UNDERLINE_NONE, UNDERLINE_SINGLE, UNDERLINE_SINGLE_ACC, UNDERLINE_DOUBLE, UNDERLINE_DOUBLE_ACC
font.escapement = xlwt.Font.ESCAPEMENT_SUPERSCRIPT # May be: ESCAPEMENT_NONE, ESCAPEMENT_SUPERSCRIPT, ESCAPEMENT_SUBSCRIPT
font.family = xlwt.Font.FAMILY_ROMAN # May be: FAMILY_NONE, FAMILY_ROMAN, FAMILY_SWISS, FAMILY_MODERN, FAMILY_SCRIPT, FAMILY_DECORATIVE
font.charset = xlwt.Font.CHARSET_ANSI_LATIN # May be: CHARSET_ANSI_LATIN, CHARSET_SYS_DEFAULT, CHARSET_SYMBOL, CHARSET_APPLE_ROMAN, CHARSET_ANSI_JAP_SHIFT_JIS, CHARSET_ANSI_KOR_HANGUL, CHARSET_ANSI_KOR_JOHAB, CHARSET_ANSI_CHINESE_GBK, CHARSET_ANSI_CHINESE_BIG5, CHARSET_ANSI_GREEK, CHARSET_ANSI_TURKISH, CHARSET_ANSI_VIETNAMESE, CHARSET_ANSI_HEBREW, CHARSET_ANSI_ARABIC, CHARSET_ANSI_BALTIC, CHARSET_ANSI_CYRILLIC, CHARSET_ANSI_THAI, CHARSET_ANSI_LATIN_II, CHARSET_OEM_LATIN_I
font.colour_index = ?
font.get_biff_record = ?
font.height = 0x00C8 # C8 in Hex (in decimal) = 10 points in height.
font.name = ?
font.outline = ?
font.shadow = ?
Setting the Width of a Cell
import xltw
workbook = xlwt.Workbook()
worksheet = workbook.add_sheet(‘My Sheet’)
worksheet.write(0, 0, ‘My Cell Contents’)
worksheet.col(0).width = 3333 # 3333 = 1″ (one inch).
workbook.save(‘Excel_Workbook.xls’)
Entering a Date into a Cell
import xlwt
import datetime
workbook = xlwt.Workbook()
worksheet = workbook.add_sheet(‘My Sheet’)
style = xlwt.XFStyle()
style.num_format_str = ‘M/D/YY’ # Other options: D-MMM-YY, D-MMM, MMM-YY, h:mm, h:mm:ss, h:mm, h:mm:ss, M/D/YY h:mm, mm:ss, [h]:mm:ss, mm:ss.0
worksheet.write(0, 0, datetime.datetime.now(), style)
workbook.save(‘Excel_Workbook.xls’)
Adding a Formula to a Cell
import xlwt
workbook = xlwt.Workbook()
worksheet = workbook.add_sheet(‘My Sheet’)
worksheet.write(0, 0, 5) # Outputs 5
worksheet.write(0, 1, 2) # Outputs 2
worksheet.write(1, 0, xlwt.Formula(‘A1*B1’)) # Should output “10” (A1[5] * A2[2])
worksheet.write(1, 1, xlwt.Formula(‘SUM(A1,B1)’)) # Should output “7” (A1[5] + A2[2])
workbook.save(‘Excel_Workbook.xls’)
Adding a Hyperlink to a Cell
import xlwt
workbook = xlwt.Workbook()
worksheet = workbook.add_sheet(‘My Sheet’)
worksheet.write(0, 0, xlwt.Formula(‘HYPERLINK(“”;”Google”)’)) # Outputs the text “Google” linking to
workbook.save(‘Excel_Workbook.xls’)
Merging Columns and Rows
import xlwt
workbook = xlwt.Workbook()
worksheet = workbook.add_sheet(‘My Sheet’)
worksheet.write_merge(0, 0, 0, 3, ‘First Merge’) # Merges row 0’s columns 0 through 3.
font = xlwt.Font() # Create Font
font.bold = True # Set font to Bold
style = xlwt.XFStyle() # Create Style
style.font = font # Add Bold Font to Style
worksheet.write_merge(1, 2, 0, 3, ‘Second Merge’, style) # Merges row 1 through 2’s columns 0 through 3.
workbook.save(‘Excel_Workbook.xls’)
Setting the Alignment for the Contents of a Cell
import xlwt
workbook = xlwt.Workbook()
worksheet = workbook.add_sheet(‘My Sheet’)
alignment = xlwt.Alignment() # Create Alignment
alignment.horz = xlwt.Alignment.HORZ_CENTER # May be: HORZ_GENERAL, HORZ_LEFT, HORZ_CENTER, HORZ_RIGHT, HORZ_FILLED, HORZ_JUSTIFIED, HORZ_CENTER_ACROSS_SEL, HORZ_DISTRIBUTED
alignment.vert = xlwt.Alignment.VERT_CENTER # May be: VERT_TOP, VERT_CENTER, VERT_BOTTOM, VERT_JUSTIFIED, VERT_DISTRIBUTED
style = xlwt.XFStyle() # Create Style
style.alignment = alignment # Add Alignment to Style
worksheet.write(0, 0, ‘Cell Contents’, style)
workbook.save(‘Excel_Workbook.xls’)
Adding Borders to a Cell
# Please note: While I was able to find these constants within the source code, on my system (using LibreOffice,) I was only presented with a solid line, varying from thin to thick; no dotted or dashed lines.
import xlwt
workbook = xlwt.Workbook()
worksheet = workbook.add_sheet(‘My Sheet’)
borders = xlwt.Borders() # Create Borders
borders.left = xlwt.Borders.DASHED # May be: NO_LINE, THIN, MEDIUM, DASHED, DOTTED, THICK, DOUBLE, HAIR, MEDIUM_DASHED, THIN_DASH_DOTTED, MEDIUM_DASH_DOTTED, THIN_DASH_DOT_DOTTED, MEDIUM_DASH_DOT_DOTTED, SLANTED_MEDIUM_DASH_DOTTED, or 0x00 through 0x0D.
borders.right = xlwt.Borders.DASHED
borders.top = xlwt.Borders.DASHED
borders.bottom = xlwt.Borders.DASHED
borders.left_colour = 0x40
borders.right_colour = 0x40
borders.top_colour = 0x40
borders.bottom_colour = 0x40
style = xlwt.XFStyle() # Create Style
style.borders = borders # Add Borders to Style
worksheet.write(0, 0, ‘Cell Contents’, style)
workbook.save(‘Excel_Workbook.xls’)
Setting the Background Color of a Cell
import xlwt
workbook = xlwt.Workbook()
worksheet = workbook.add_sheet(‘My Sheet’)
pattern = xlwt.Pattern() # Create the Pattern
pattern.pattern = xlwt.Pattern.SOLID_PATTERN # May be: NO_PATTERN, SOLID_PATTERN, or 0x00 through 0x12
pattern.pattern_fore_colour = 5 # May be: 8 through 63. 0 = Black, 1 = White, 2 = Red, 3 = Green, 4 = Blue, 5 = Yellow, 6 = Magenta, 7 = Cyan, 16 = Maroon, 17 = Dark Green, 18 = Dark Blue, 19 = Dark Yellow , almost brown), 20 = Dark Magenta, 21 = Teal, 22 = Light Gray, 23 = Dark Gray, the list goes on…
style = xlwt.XFStyle() # Create the Pattern
style.pattern = pattern # Add Pattern to Style
worksheet.write(0, 0, ‘Cell Contents’, style)
workbook.save(‘Excel_Workbook.xls’)
TODO: Things Left to Document
– Panes — separate views which are always in view
– Border Colors (documented above, but not taking effect as it should)
– Border Widths (document above, but not working as expected)
– Protection
– Row Styles
– Zoom / Manification
– WS Props?
Source Code for reference available at:
原創文章,作者:簡單一點,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/128453.html