其實現在流行的是通過程序在網頁上獲取妳想要的數據,也就是自動抓取數據。
爬行動物能做什麽?
妳可以使用爬蟲抓取妳想要抓取的圖片、視頻和其他數據。只要能通過瀏覽器訪問數據,就可以通過爬蟲獲取。
爬行動物的本質是什麽?
模擬瀏覽器打開壹個網頁,在網頁中獲取我們想要的數據。
用瀏覽器打開網頁的過程:
當您在瀏覽器中輸入地址時,您通過DNS服務器找到服務器主機,並向服務器發送請求。服務器解析並將結果發送到用戶的瀏覽器,包括html、js、css等文件內容。瀏覽器解析並最終在瀏覽器上將結果呈現給用戶。
所以用戶看到的瀏覽器結果都是由html代碼組成的,我們的爬蟲就是獲取這些內容,通過對HTML代碼的分析和過濾,獲取我們想要的資源。