什麽是蟒蛇爬行動物？

網絡爬蟲(Web crawler，也稱為web spider，web robot，在FOAF社區中，更常被稱為web chaser)是壹種按照壹定規則自動抓取萬維網上信息的程序或腳本。其他不常用的名字是螞蟻、自動索引、模擬器或蠕蟲。

其實現在流行的是通過程序在網頁上獲取妳想要的數據，也就是自動抓取數據。

爬行動物能做什麽？

妳可以使用爬蟲抓取妳想要抓取的圖片、視頻和其他數據。只要能通過瀏覽器訪問數據，就可以通過爬蟲獲取。

爬行動物的本質是什麽？

模擬瀏覽器打開壹個網頁，在網頁中獲取我們想要的數據。

用瀏覽器打開網頁的過程:

當您在瀏覽器中輸入地址時，您通過DNS服務器找到服務器主機，並向服務器發送請求。服務器解析並將結果發送到用戶的瀏覽器，包括html、js、css等文件內容。瀏覽器解析並最終在瀏覽器上將結果呈現給用戶。

所以用戶看到的瀏覽器結果都是由html代碼組成的，我們的爬蟲就是獲取這些內容，通過對HTML代碼的分析和過濾，獲取我們想要的資源。