本文目錄一覽:
怎麼爬取網頁的動態內容,很多都是js動態生
抓取動態頁面有兩種常用的方法,一是通過JavaScript逆向工程獲取動態數據接口(真實的訪問路徑),另一種是利用selenium庫模擬真實瀏覽器,獲取JavaScript渲染後的內容。但selenium庫用起來比較繁瑣,抓取速度相對較慢,所以第一種方法日常使用較多。
網頁的動態JS在哪找?
可以在開發者工具當中找。
打開開發者工具,然後選擇網絡(network),在下面的列表就可以看到動態加載的js文件了。如果文件比較多,可以選js進行篩選。
如果不是js文件,是在頁面當中的js,可以在開發者工具的元素(elements)面板裏面找到文檔當中的js。
如何在html頁面動態加載js文件
html頁面動態加載js文件腳本的方法。
1、直接document.write
script language=”javascript”
document.write(“script src=’test.js’\/script”);
/script
2、動態改變已有script的src 屬性
script src=” id=”s1″/script
script language=”javascript”
s1.src=”test.js”
/script
3、動態創建 script元素
script
var oHead = document.getElementsByTagName(‘HEAD’).item(0);
var oScript= document.createElement(“script”);
oScript.type = “text/javascript”;
oScript.src=”test.js”;
oHead.appendChild( oScript);
/script
這三種方法都是異步的,所以在採用這類方法動態加載Js的同時,主界面的Js腳本是繼續執行的,所以可能出現通過異步加載的Js代碼得不到預期的效果的情況。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/247924.html