提取csvjsonexcel的簡單介紹

本文目錄一覽:

csv如何轉換為excel?

1、在計算機桌面上有一個「列出的分發」 CSV文件。 右鍵單擊該文件,將彈出右鍵菜單。

2、單擊:打開模式,彈出子菜單的右側,然後單擊:EXCEL

3、接着,在工作表左上方這裡,點擊文件

4、到另一頁;在這裡, 點擊: 另存為

5、在彈出對話框的「另存為類型」中,單擊其按鈕,在各種類型的彈出EXCEL工作表中,後綴名為xlsx,然後單擊「保存」。

CSV格式轉換到excel,怎麼做?

1、現在電腦桌面上有「上架分佈」的CSV文件。鼠標右擊該文件,彈出右鍵菜單。

2、再點:打開方式,在右側彈出子菜單,再點:EXCEL

3、接着,在工作表左上方這裡,點擊文件,

4、轉到另一個頁面;在這裡,點擊:另存為

5、接着,選擇計算機,再點:桌面

6、彈出對話框,在保存類型這裡,點擊其下按鈕,在彈出的各種類型中選擇EXCEL工作薄,後綴名是xlsx;再點保存即可。

如何把一個或幾個CSV文件中的數據讀取到Excel表格中

1.首先介紹下CSV的合併方法。第一步將csv全部放在一個文件夾,並同時複製到C盤或者其他盤第一路徑下。下面以D盤介紹。

2.複製完畢,開始合併準備工作。打開cmd命令提示符。輸入cmd,按下enter後,切換到D盤符下。

輸入合併指令(注意英文輸入法輸入):copy *.CSV all.csv

(意思是合併D盤下第一路徑中的所有的csv文件為一個,並命名為all.csv,另外,表格最多大約支持107w條數據,如果多餘這些,建議分表合併了)。

3.合併完畢,建議打開另存為excel,既xlsx格式的表格。這樣原表可作為備份。

接下來再介紹下excel格式的表格合併,區別於csv稍有不同,需藉助「excel匯總專家」工具來實現。可以百度搜素並下載安裝。

該軟件可將多個excel文件合併,具體如下。

4.將所需要的合併軟件全部放在一個文件夾內,如附件圖。其次打開該軟件,另外,該軟件為綠色軟件,無需安裝。雙擊文件名為:excel匯總專家.exe。

5.運行完畢,選擇匯總表格行數據,其次在選擇你要合併的文件夾(既你所新建的文件夾)。默認為第2行數據到最後一行(因為表頭的原因),如果沒有表格,記住選擇第一行開始。

在取一個表格名稱。

6.點擊開始運行,運行完畢,查看,再另存表格一份。以上介紹完畢。

Excel如何抓取網頁數據之JSON數據抓取

打開Chrome,在拉勾網搜索深圳市的「數據分析」職位,使用檢查功能查看網頁源代碼,發現拉勾網有反爬蟲機制,職位信息並不在源代碼里,而是保存在JSON的文件里,因此我們直接下載JSON,並使用字典方法直接讀取數據。

抓取網頁時,需要加上頭部信息,才能獲取所需的數據。

在搜索結果的第一頁,我們可以從JSON里讀取總職位數,按照每頁15個職位,獲得要爬取的頁數。再使用循環按頁爬取,將職位信息匯總,輸出為CSV格式。

程序運行如圖:

抓取結果如圖:

數據清洗占數據分析工作量的大頭。在拉勾網搜索深圳市的「數據分析」職位,結果得到369個職位。查看職位名稱時,發現有4個實習崗位。由於我們研究的是全職崗位,所以先將實習崗位剔除。由於工作經驗和工資都是字符串形式的區間,我們先用正則表達式提取數值,輸出列表形式。工作經驗取均值,工資取區間的四分位數值,比較接近現實。

4. 詞雲

我們將職位福利這一列的數據匯總,生成一個字符串,按照詞頻生成詞雲實現python可視化。以下是原圖和詞雲的對比圖,可見五險一金在職位福利里出現的頻率最高,平台、福利、發展空間、彈性工作次之。

5. 描述統計

可知,數據分析師的均值在14.6K,中位數在12.5K,算是較有前途的職業。數據分析散布在各個行業,但在高級層面上涉及到數據挖掘和機器學習,在IT業有長足的發展。

我們再來看工資的分佈,這對於求職來講是重要的參考:

工資在10-15K的職位最多,在15-20K的職位其次。個人愚見,10-15K的職位以建模為主,20K以上的職位以數據挖掘、大數據架構為主。

我們再來看職位在各區的分佈:

數據分析職位有62.9%在南山區,有25.8%在福田區,剩下少數分佈在龍崗區、羅湖區、寶安區、龍華新區。我們以小窺大,可知南山區和福田區是深圳市科技業的中心。

我們希望獲得工資與工作經驗、學歷的關係,由於學歷分三類,需設置3個虛擬變量:大專、本科、碩士。多元回歸結果如下:

在0.05的顯著性水平下,F值為82.53,說明回歸關係是顯著的。t檢驗和對應的P值都小於0.05表明,工作經驗和3種學歷在統計上都是顯著的。另外,R-squared的值為0.41,說明工作經驗和學歷僅僅解釋了工資變異性的41%。這點不難理解,即使職位都叫數據分析師,實際的工作內容差異比較大,有的只是用Excel做基本分析,有的用Python、R做數據挖掘。另外,各個公司的規模和它願意開出的工資也不盡相同。而工作內容的差異和公司的大方程度是很難單憑招聘網頁上的宣傳而獲得實際數據,導致了模型的擬合優度不是很好這一現實。

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/295504.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-27 12:56
下一篇 2024-12-27 12:56

相關推薦

  • Python簡單數學計算

    本文將從多個方面介紹Python的簡單數學計算,包括基礎運算符、函數、庫以及實際應用場景。 一、基礎運算符 Python提供了基礎的算術運算符,包括加(+)、減(-)、乘(*)、除…

    編程 2025-04-29
  • Python滿天星代碼:讓編程變得更加簡單

    本文將從多個方面詳細闡述Python滿天星代碼,為大家介紹它的優點以及如何在編程中使用。無論是剛剛接觸編程還是資深程序員,都能從中獲得一定的收穫。 一、簡介 Python滿天星代碼…

    編程 2025-04-29
  • Python海龜代碼簡單畫圖

    本文將介紹如何使用Python的海龜庫進行簡單畫圖,並提供相關示例代碼。 一、基礎用法 使用Python的海龜庫,我們可以控制一個小海龜在窗口中移動,並利用它的「畫筆」在窗口中繪製…

    編程 2025-04-29
  • Python櫻花樹代碼簡單

    本文將對Python櫻花樹代碼進行詳細的闡述和講解,幫助讀者更好地理解該代碼的實現方法。 一、簡介 櫻花樹是一種圖形效果,它的實現方法比較簡單。Python中可以通過turtle這…

    編程 2025-04-28
  • Python大神作品:讓編程變得更加簡單

    Python作為一種高級的解釋性編程語言,一直被廣泛地運用於各個領域,從Web開發、遊戲開發到人工智能,Python都扮演着重要的角色。Python的代碼簡潔明了,易於閱讀和維護,…

    編程 2025-04-28
  • 用Python實現簡單爬蟲程序

    在當今時代,互聯網上的信息量是爆炸式增長的,其中很多信息可以被利用。對於數據分析、數據挖掘或者其他一些需要大量數據的任務,我們可以使用爬蟲技術從各個網站獲取需要的信息。而Pytho…

    編程 2025-04-28
  • 如何製作一個簡單的換裝遊戲

    本文將從以下幾個方面,為大家介紹如何製作一個簡單的換裝遊戲: 1. 遊戲需求和界面設計 2. 使用HTML、CSS和JavaScript開發遊戲 3. 實現遊戲的基本功能:拖拽交互…

    編程 2025-04-27
  • Guava Limiter——限流器的簡單易用

    本文將從多個維度對Guava Limiter進行詳細闡述,介紹其定義、使用方法、工作原理和案例應用等方面,並給出完整的代碼示例,希望能夠幫助讀者更好地了解和使用該庫。 一、定義 G…

    編程 2025-04-27
  • 製作一個簡單的管理系統的成本及實現

    想要製作一個簡單的管理系統,需要進行技術選型、開發、測試等過程,那麼這個過程會花費多少錢呢?我們將從多個方面來闡述製作一個簡單的管理系統的成本及實現。 一、技術選型 當我們開始思考…

    編程 2025-04-27
  • 2的32次方-1:一個看似簡單卻又複雜的數字

    對於計算機領域的人來說,2的32次方-1(也就是十進制下的4294967295)這個數字並不陌生。它經常被用來表示IPv4地址或者無符號32位整數的最大值。但實際上,這個數字卻包含…

    編程 2025-04-27

發表回復

登錄後才能評論