Python讀取同花順日線數據實戰

本篇文章將以「Python讀取同花順日線數據」為主題，介紹如何使用python語言從同花順網站上獲取股票日線數據。通過該實戰，讀者可以學習到如何使用Python進行網頁數據抓取、數據清洗和存儲等知識點。

一、網頁數據抓取

首先，我們需要從同花順網站上獲取需要的數據。在這個步驟中，我們需要藉助第三方庫來實現

import requests
from bs4 import BeautifulSoup

url = 'http://q.10jqka.com.cn/index/index/board/all/field/zdf/order/desc/page/1/ajax/1/'

headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}

response = requests.get(url, headers=headers)

soup = BeautifulSoup(response.content, 'html.parser')

上面的代碼，我們使用requests庫向同花順網站發送請求，得到網頁的HTML內容。之後使用BeautifulSoup進行HTML解析，用於數據清洗。

二、數據清洗

接下來，我們需要從HTML中解析出我們需要的數據，並進行清洗和整理。通過第一步的HTML解析，我們可以得到一個包含了所有數據信息的HTML對象soup。

table = soup.find_all('table')[0]

trs = table.find_all('tr')

for tr in trs:
  tds = tr.find_all('td')
  if len(tds) == 0:
    continue

  code = tds[1].text.strip()
  name = tds[2].text.strip()
  price = tds[3].text.strip()
  chg = tds[4].text.strip()
  chg_percent = tds[5].text.strip()
  print(code, name, price, chg, chg_percent)

通過find_all()，我們可以得到所有

標籤的內容，所以我們需要使用循環來遍歷每一個

標籤，然後再一次執行find_all()方法得到每一個

標籤的內容。

三、數據存儲

在獲取和清洗了我們需要的數據之後，下一步是將數據存儲到本地或者資料庫中。在這裡，我們將數據保存到CSV文件中，以便其他應用程序或軟體都可以方便地打開和讀取CSV文件。

import csv

with open('stock_data.csv', mode='w', newline='') as file:
  writer = csv.writer(file)
  writer.writerow(['Code', 'Name', 'Price', 'Change', 'Change_percent'])
  for tr in trs:
    tds = tr.find_all('td')
    if len(tds) == 0:
      continue
    code = tds[1].text.strip()
    name = tds[2].text.strip()
    price = tds[3].text.strip()
    chg = tds[4].text.strip()
    chg_percent = tds[5].text.strip()
    writer.writerow([code, name, price, chg, chg_percent])

以上代碼將把數據寫入名為stock_data.csv的文件中。

四、總結

通過本文的介紹，我們學習了如何使用Python爬取網頁數據、對數據進行清洗和整理、以及存儲到本地或資料庫的知識點。在實際應用中，我們還可以使用Python對數據進行進一步的處理和分析，例如製作圖表等。
Python的數據處理能力越來越強，不僅可以用於數據科學領域，也可以應用於網頁抓取、自然語言處理以及機器學習等很多領域。

原創文章，作者：OAMTL，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/373875.html

Python讀取同花順日線數據實戰

一、網頁數據抓取

二、數據清洗

三、數據存儲

四、總結

相關推薦

發表回復