信息獲取技術:信息獲取技術可分為主動獲取技術和被動獲取技術。主動接入技術通過將數據包的反饋註入網絡來獲取信息。這種技術接入方式簡單,可以獲取廣泛的信息,但會給網絡造成額外的負載。被動接入技術是在網絡出入口通過旁路攔截來獲取網絡信息。其特點是接入需要網管的配合,獲取的內容僅限於進出本地網絡的數據流,不會對網絡造成額外的流量。目前大多數網關內容安全產品都是采用被動獲取網絡信息的方式。
信息內容分析識別技術:為了防止非法內容出現在應用中,首先需要內容安全設備識別非法內容,主要包括文本、聲音、圖像、圖形等。識別的準確率和速度是重要的指標。字符識別包括關鍵詞、特征詞、屬性詞的識別,語法、語義、語用的識別,主題、位置、屬性的識別。字符識別涉及的技術包括字符串匹配、規則匹配、聚類算法、自然語言處理等。目前反垃圾郵件和網頁內容過濾產品基本都采用基於文本的識別方式。基於內容的音視頻信息檢索是多媒體數據庫發展的壹個重要研究領域。目前,相關的視聽、視頻和圖像內容識別與分析技術已經部分進入實用階段,主要用於影視盜版監控、廣告監控、色情圖片監控等。
內容分類技術:信息內容分類的主要功能是通過過濾、屏蔽等技術手段,防止國家憲法和其他法律法規禁止的內容在互聯網上傳播,對不違反法律,但可能容易對國家、社會、公司、家庭和個人造成壹些不良影響或傷害的內容,或者根據明確、詳細的規則,只允許特定人群接觸的內容進行分類;便於受眾在接受前熟悉信息的安全等級,保證知情權和選擇權;為了保護未成年人,可以安裝壹些過濾軟件,隔離對未成年人造成傷害的信息。
信息過濾技術:對於識別出的非法信息內容,需要采取不同的方式進行後續處理,以阻止或中斷用戶的訪問,過濾是常用的封堵方式。信息過濾技術主要包括基於URL的站點過濾技術、基於內容關鍵詞的過濾技術、基於URL的內容關鍵詞的過濾技術、基於圖像識別的過濾技術、傾向過濾技術以及幾種技術相結合的組合過濾技術。目前,傾向性過濾技術的研究和應用還較少。
內容審計技術:內容審計主要是指對與安全相關活動相關的信息進行識別、記錄、存儲和分析;審計結果用於檢查網絡上發生了哪些與安全相關的活動。通過記錄用戶訪問的所有資源和訪問過程,實現對網絡的動態實時監控,為用戶事後取證提供手段,也是對信息的安全保障。