一、介紹
在數據分析、機器學習、深度學習等領域,Jupyter Notebook(以下簡稱Notebook)已經成為一種必備的開發工具。除了可以編寫代碼並逐步運行外,它還可以實時展示代碼、圖像和文本等多種數據類型。在Notebook中,打開文件是一個基礎功能,本文將涵蓋如何在Notebook中打開CSV、Excel、JSON、文本、Python代碼等不同類型的文件。
二、正文
1. 打開CSV文件
CSV(Comma-Separated Values)是指逗號分隔值文件,它通常用於存儲表格數據。在Notebook中打開CSV文件,只需要使用pandas庫中的read_csv方法即可。
import pandas as pd data = pd.read_csv('data.csv') print(data.head())
以上代碼讀取名為data.csv的CSV文件,並用head()方法顯示前5行數據。如果文件不在當前目錄中,可以添加其路徑。
2. 打開Excel文件
Excel是一種電子表格軟件,它的文件通常以.xls或.xlsx為後綴名。在Notebook中打開Excel文件,同樣可以使用pandas庫,只需要使用read_excel方法,並指定需要讀取的表單的位置或名稱。
import pandas as pd data = pd.read_excel('data.xlsx', sheet_name='Sheet1') print(data.head())
以上代碼讀取名為data.xlsx中的Sheet1表單,並用head()方法顯示前5行數據。
3. 打開JSON文件
JSON(JavaScript Object Notation)是指JavaScript對象表示法的文件格式。在Notebook中,使用Python的標準json庫即可讀取JSON文件。
import json with open('data.json') as f: data = json.load(f) print(data)
以上代碼讀取名為data.json的JSON文件,並打印其中的全部內容。由於JSON數據天然適合用Python的字典表示,json.load()方法返回的也是Python字典。
4. 打開文本文件
文本文件以純文本格式存儲,可以用記事本等文本編輯器打開。在Notebook中,讀取文本文件也非常簡單,使用內置的open方法即可。
with open('data.txt') as f: data = f.read() print(data)
以上代碼讀取名為data.txt的文本文件,並打印全部內容。如果文件被讀取時需要加上換行符,則可以在read()方法中傳入’rb’。
5. 打開Python代碼文件
在Notebook中打開Python的代碼文件,可以使用Python內置的builtins模塊的open函數。讀取後,可以用IPython的run_line_magic方法執行其中的Python代碼。
from IPython.core import magic_arguments from IPython.core.magic import register_line_cell_magic @register_line_cell_magic @magic_arguments.magic_arguments() @magic_arguments.argument('--filename', '-f', help='the Python script you want to run.') def run_py(filename, cell=None): ''' `run_py` - Run the specified Python script in Jupyter Notebook. ''' if cell is not None: clean_cell = ''.join(cell.splitlines()) # remove '\n' exec(clean_cell, globals()) if filename is not None: exec(open(filename, 'rb').read(), globals()) %run_py -f example.py
以上代碼示例是如何打開名為example.py的Python代碼文件,並執行其中的代碼。需要注意的是,run_py方法需要被註冊為IPython的magic方法,並在其中使用exec()來執行指定的代碼。
三、小標題
1. CSV文件
CSV文件是存儲表格數據的一種文件格式。
2. Excel文件
Excel文件是一種電子表格軟件,通常以.xls或.xlsx結尾。
3. JSON文件
JSON文件是JavaScript對象表示法的文件格式。
4. 文本文件
文本文件是以純文本格式存儲的一種文件。
5. Python代碼文件
Python代碼文件是存儲Python代碼的一種文件格式。
四、結論
在Notebook中打開文件是一項基礎技能,需要通過熟悉的庫和Python內置函數實現。無論是CSV、Excel、JSON、文本、Python代碼等不同類型的文件,在Notebook中打開都是非常簡單的。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/304904.html