爬蟲js破解cookie,爬蟲破解js加密的流程

本文目錄一覽:

簡單NodeJS爬蟲和使用cookie進行模擬登錄

       NodeJS做爬蟲也是很方便的。因為nodejs有HTTP模塊直接可以使用,而且還有很多簡單粗暴的庫可以即拿即用。

      首先,需要的庫文件,

      1、superagent 是個輕量的的 http 方面的庫,就像jquery的post,和get一樣,很簡單。

      2、cheerio 是一個服務端操作DOM的庫,簡直就是服務端的jquery。

     好的,我們需要抓取某個網站的題目。如下圖。這個系統下,及時是遊客狀態也是可以查看題目的,只是答案我們看不到。會顯示我沒有登錄。

現在我們有個需求,先抓取15頁,根據URL的參數可以頁數就是地址中 的P。並且要有本地cookie,獲取cookie的方法,最簡單的是,利用瀏覽器登錄網站之後,在控制台直接列印document.cookie,得到之後,複製進txt文本。用fs模塊讀取並轉換成字元串。在superagent請求時,把cookie傳進去。

好了,控制台已經不輸出「未登錄」,說明已經登錄成功了。

爬蟲 如何抓包獲取cookie

我們需要使用爬蟲程序對目標網站登錄時的請求進行一次抓取,獲取請求中的cookie數據;

在使用個人信息頁的url進行請求時,該請求需要攜帶cookie,只有攜帶了cookie後,伺服器才可識別這次請求的用戶信息,方可響應回指定的用戶信息頁數據。

爬蟲除了要注意Cookie的限制之外,還需要注意其他的反爬蟲,比如IP限制,這就需要使用極光代理IP進行更換IP地址,以其他的IP地址繼續訪問,突破網路限制。當然,還有其它很多的限制,爬蟲在進行採集之前需要好好分析網站的反爬蟲策略。

方法:對 superagent 封裝一下,每次都自動把新 cookie 取出,再下一次請求的時候 set 進去。

用post打開”連接1″提交登錄數據,通過”連接1″獲得Cookie信息,保留下來在以後的連接中加入Cookie數據

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/200672.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-05 20:02
下一篇 2024-12-05 20:02

相關推薦

  • JS Proxy(array)用法介紹

    JS Proxy(array)可以說是ES6中非常重要的一個特性,它可以代理一個數組,監聽數據變化並進行攔截、處理。在實際開發中,使用Proxy(array)可以方便地實現數據的監…

    編程 2025-04-29
  • Python爬蟲可以爬哪些網站

    Python是被廣泛運用於數據處理和分析領域的編程語言之一。它具有易用性、靈活性和成本效益高等特點,因此越來越多的人開始使用它進行網站爬取。本文將從多個方面詳細闡述,Python爬…

    編程 2025-04-29
  • 爬蟲是一種程序

    爬蟲是一種程序,用於自動獲取互聯網上的信息。本文將從如下多個方面對爬蟲的意義、運行方式、應用場景和技術要點等進行詳細的闡述。 一、爬蟲的意義 1、獲取信息:爬蟲可以自動獲取互聯網上…

    編程 2025-04-29
  • 使用Selenium爬蟲實現數據採集

    本文將詳細闡述如何使用Selenium爬蟲實現數據採集,包括Selenium的基本用法,Selenium + Beautiful Soup庫的用法以及常見問題的解決方案。如果您是初…

    編程 2025-04-29
  • Python爬蟲亂碼問題

    在網路爬蟲中,經常會遇到中文亂碼問題。雖然Python自帶了編碼轉換功能,但有時候會出現一些比較奇怪的情況。本文章將從多個方面對Python爬蟲亂碼問題進行詳細的闡述,並給出對應的…

    編程 2025-04-29
  • 解析js base64並轉成unit

    本文將從多個方面詳細介紹js中如何解析base64編碼並轉成unit格式。 一、base64編碼解析 在JavaScript中解析base64編碼可以使用atob()函數,它會將b…

    編程 2025-04-29
  • Node.js使用Body-Parser處理HTTP POST請求時,特殊字元無法返回的解決方法

    本文將解決Node.js使用Body-Parser處理HTTP POST請求時,特殊字元無法返回的問題。同時,給出一些相關示例代碼,以幫助讀者更好的理解並處理這個問題。 一、問題解…

    編程 2025-04-29
  • Python載入Cookie錯誤解決方法用法介紹

    本文將從多個方面詳細闡述Python載入Cookie錯誤的解決方法,希望能對讀者有所幫助。 一、Cookie錯誤常見原因 1、Cookie過期:當Cookie過期時,載入Cooki…

    編程 2025-04-29
  • Cookie是後端生成的嗎?

    是的,Cookie通常是由後端生成並發送給客戶端的。下面從多個方面詳細闡述這個問題。 一、什麼是Cookie? 我們先來簡單地了解一下什麼是Cookie。Cookie是一種保存在客…

    編程 2025-04-28
  • Python爬蟲文檔報告

    本文將從多個方面介紹Python爬蟲文檔的相關內容,包括:爬蟲基礎知識、爬蟲框架及常用庫、爬蟲實戰等。 一、爬蟲基礎知識 1、爬蟲的定義: 爬蟲是一種自動化程序,通過模擬人的行為在…

    編程 2025-04-28

發表回復

登錄後才能評論