site語法設定的初衷是為了實現精準搜索。索引結果數不是壹個網站在搜索引擎中的站點評級指標。搜索結果中URL後面的時間戳不必太過關註。site語法查詢的檢索結果只能說明網頁被收錄。
site:後面帶不帶www結果可能是不壹樣的,因為有些域名還包括二級域名,如:site:www。某某。com和site:某某。com,搜索結果就不壹樣,site:和站點名之間,不要帶空格。
擴展資料:
網絡爬蟲為搜索引擎從萬維網上下載網頁,是搜索引擎的重要組成。傳統爬蟲從壹個或若幹初始網頁的URL開始,獲得初始網頁上的URL,在抓取網頁的過程中,不斷從當前頁面上抽取新的URL放入隊列,直到滿足系統的壹定停止條件。
聚焦爬蟲的工作流程較為復雜,需要根據壹定的網頁分析算法過濾與主題無關的鏈接,保留有用的鏈接並將其放入等待抓取的URL隊列。