全文檢索技術的研究,尤其是中文全文檢索技術的研究,是從1987左右開始的,已經有壹些商業化的軟件。互聯網的普及使得全文檢索技術日益成熟。
構建內部信息發布平臺,建立安全的信息發布渠道和與其他網站的交流渠道,建立電子商務的應用,建立以數據為中心的應用平臺,都離不開全文檢索。
這種檢索技術可以跨越所有數據源,支持多種數據和信息格式,按照業務分類規則排列檢索結果,也可以滿足用戶特定的知識檢索請求,將所有不同信息查詢中的命中結果按照相關性或分類進行排列,提供不同格式的信息瀏覽功能。
從搜索結果的來源來看,全文搜索引擎可以細分為兩種類型。壹種是擁有自己的索引器,俗稱“蜘蛛”或“機器人”程序。