1.寫壹個按鍵向導腳本,自動點擊手機上的公共文章列表頁面,即“查看歷史新聞”;
2.利用fiddler代理劫持手機的訪問,將URL轉發到用php編寫的本地網頁;
3.將接收到的URL備份到php網頁上的數據庫中;
4.使用python從數據庫中檢索URL,然後正常抓取。
如果妳只是想抓取壹篇文章的內容,似乎沒有訪問頻率限制,但如果妳想抓取閱讀數和點贊數,超過壹定頻率後,返回就會變成null。我設置的時間間隔是10秒,可以正常抓取。這樣的頻率,壹個小時只能抓取360篇文章,沒有實際意義。
微信微信官方賬號數據存儲
1.對於您未能在本服務中刪除或存儲相關數據,騰訊概不負責。
2.騰訊有權根據實際情況決定本服務中單個用戶數據的最大存儲期限,並在服務器上分配數據的最大存儲空間。您可以根據自己的需要備份該服務中的相關數據。
3.如果您停止使用本服務或本服務被終止或取消,騰訊可以從服務器上永久刪除您的數據。在服務停止、終止或取消後,騰訊沒有義務向您返還任何數據。