python載入js溢出,python爬取js載入的網頁

本文目錄一覽:

python 下用selenium打開phantomjs出錯,請問如何處理

python的js解析,發現使用Selenium+PhantomJS的方案還是比較適合我的,以下是環境配置教程。

Selenium及PhantomJS介紹:

Selenium是一個用於Web應用程序測試的工具,Selenium測試直接運行在瀏覽器中,就像真正的用戶在操作一樣。支持的瀏覽器包括IE、Mozilla Firefox、Chrome等。

Phantom JS是一個伺服器端的 JavaScript API 的 WebKit。其支持各種Web標準: DOM 處理, CSS 選擇器, JSON, Canvas, 和 SVG。

安裝環境:

Windows 7 (64位)

python 2.7.8

配置過程:

1、使用pip安裝Selenium,如果沒有安裝pip的請參考我之前的博客文章。

命令: pip install -U selenium

2、安裝PhantomJS,到PhantomJS的官方網站上下載,然後放到python的安裝目錄。

PhantomJS下載

如果想使用Chrome來實現解析的,請下載GG瀏覽器的相應驅動(同時需要安裝chrome瀏覽器),如上圖中的第一個程序,第二個程序就是PhantomJS了。

如果想使用Firefox來實現解析,則需要安裝Selenium提供的firefox插件,位於python安裝目錄Lib\site-packages\selenium\webdriver\firefox\webdriver.xpi,請拖入到firefox瀏覽器中,然後重啟瀏覽器即可。

Selenium+PhantomJS使用:

使用方法很簡單,代碼如下,如果成功列印出網站的標題,那麼說明已經可以成功使用了。

from selenium import webdriver

driver = webdriver.PhantomJS() #webdriver.Firefox()driver.get(‘httpcn/’)

print driver.title

driver.quit()

哪些操作會導致Python內存溢出,怎麼處理?

一、Python內存溢出原因

1、內存中載入的數據量過於龐大,如一次從資料庫取出過多數據; 一般比如數據查詢未做分頁處理。

2、集合類中有對對象的引用,使用完後未清空,使得JVM不能回收。

3、代碼中存在死循環或循環產生過多重複的對象實體。

4、使用的第三方軟體中的BUG; 一般引用第三方jar包過多會出現此類問題。

5、啟動參數內存值設定的過小 這種可能性很小伺服器參數設置一般會出現這類問題畢竟都是開發。

二、Python內存溢出的解決方案

第一步:

修改JVM啟動參數,直接堆內存( -Xms,-Xmx參數一定不要忘記加 )。

第二步:

檢查錯誤日誌,查看「OutOfMemory」錯誤前是否有其 它異常或錯誤。

第三步:

對代碼進行走查和分析,找出可能發生內存溢出的位置。

如果我的回答對您有所幫助,記得點亮採納哦,謝謝啦!

python中如何調用js文件中的方法呢

1、打開pycharm開發工具,點擊File菜單,選擇Settings…,進行第三方模塊安裝;輸入selenium,點擊Install Package。

2、接著在python項目的指定文件夾下,滑鼠右鍵新建python文件,輸入文件名並點擊Python file。

3、打開新建的文件,依次導入selenium、webdriver和time。

4、調用webdriver模塊中的Chrome(),使用get()獲取對應網址的內容。

5、調用find_element_by_id()獲取對應頁面元素,然後調用按鈕點擊事件。

6、修改get()方法中的請求路徑,然後保存代碼並運行文件,查看運行結果。

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/187679.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-11-28 06:24
下一篇 2024-11-28 06:24

相關推薦

  • Python中引入上一級目錄中函數

    Python中經常需要調用其他文件夾中的模塊或函數,其中一個常見的操作是引入上一級目錄中的函數。在此,我們將從多個角度詳細解釋如何在Python中引入上一級目錄的函數。 一、加入環…

    編程 2025-04-29
  • Python列表中負數的個數

    Python列表是一個有序的集合,可以存儲多個不同類型的元素。而負數是指小於0的整數。在Python列表中,我們想要找到負數的個數,可以通過以下幾個方面進行實現。 一、使用循環遍歷…

    編程 2025-04-29
  • 如何查看Anaconda中Python路徑

    對Anaconda中Python路徑即conda環境的查看進行詳細的闡述。 一、使用命令行查看 1、在Windows系統中,可以使用命令提示符(cmd)或者Anaconda Pro…

    編程 2025-04-29
  • Python計算陽曆日期對應周幾

    本文介紹如何通過Python計算任意陽曆日期對應周幾。 一、獲取日期 獲取日期可以通過Python內置的模塊datetime實現,示例代碼如下: from datetime imp…

    編程 2025-04-29
  • JS Proxy(array)用法介紹

    JS Proxy(array)可以說是ES6中非常重要的一個特性,它可以代理一個數組,監聽數據變化並進行攔截、處理。在實際開發中,使用Proxy(array)可以方便地實現數據的監…

    編程 2025-04-29
  • Python周杰倫代碼用法介紹

    本文將從多個方面對Python周杰倫代碼進行詳細的闡述。 一、代碼介紹 from urllib.request import urlopen from bs4 import Bea…

    編程 2025-04-29
  • 蝴蝶優化演算法Python版

    蝴蝶優化演算法是一種基於仿生學的優化演算法,模仿自然界中的蝴蝶進行搜索。它可以應用於多個領域的優化問題,包括數學優化、工程問題、機器學習等。本文將從多個方面對蝴蝶優化演算法Python版…

    編程 2025-04-29
  • Java Bean載入過程

    Java Bean載入過程涉及到類載入器、反射機制和Java虛擬機的執行過程。在本文中,將從這三個方面詳細闡述Java Bean載入的過程。 一、類載入器 類載入器是Java虛擬機…

    編程 2025-04-29
  • python強行終止程序快捷鍵

    本文將從多個方面對python強行終止程序快捷鍵進行詳細闡述,並提供相應代碼示例。 一、Ctrl+C快捷鍵 Ctrl+C快捷鍵是在終端中經常用來強行終止運行的程序。當你在終端中運行…

    編程 2025-04-29
  • Python清華鏡像下載

    Python清華鏡像是一個高質量的Python開發資源鏡像站,提供了Python及其相關的開發工具、框架和文檔的下載服務。本文將從以下幾個方面對Python清華鏡像下載進行詳細的闡…

    編程 2025-04-29

發表回復

登錄後才能評論