無論是網(wǎng)絡(luò)安全產(chǎn)品,還是專業(yè)的流量分析引擎,在網(wǎng)絡(luò)的入口處實(shí)現(xiàn)準(zhǔn)確識(shí)別應(yīng)用程序是非常重要的。準(zhǔn)確識(shí)別應(yīng)用流量不但可洞悉整個(gè)網(wǎng)絡(luò)的運(yùn)行情況,而且可針對(duì)具體需求做用戶行為的準(zhǔn)確管控,這在一定程度上既可保證業(yè)務(wù)流的高效運(yùn)行,也可預(yù)防由于內(nèi)網(wǎng)中毒引起的斷網(wǎng)事件。
然而,要準(zhǔn)確識(shí)別應(yīng)用流量,從技術(shù)實(shí)現(xiàn)上講并不簡(jiǎn)單,難度主要體現(xiàn)在識(shí)別的算法及檢測(cè)深度。算法不但要解決流量的分類,而且要負(fù)責(zé)在多個(gè)分類中查找特征,所以最好的算法往往帶來的是精確的識(shí)別;另一個(gè)就是檢查數(shù)據(jù)的深度,深度總是和性能關(guān)聯(lián),檢查的越多,消耗的系統(tǒng)資源越多。因此,檢查一個(gè)流的前20個(gè)包所付出的性能代價(jià)往往是超乎想象的,這就是我們提到的識(shí)別難度。
對(duì)于識(shí)別方法來說,從技術(shù)角度看,檢查一個(gè)應(yīng)用特征主要有三種方法。第一種方法稱為標(biāo)準(zhǔn)檢測(cè),主要靠識(shí)別報(bào)頭信息的地址和端口,這種方法常見于做QoS的網(wǎng)關(guān)設(shè)備。第二種方法稱為DPI(深度包檢測(cè)),這是業(yè)界常用的術(shù)語,絕大多數(shù)設(shè)備聲稱具有這樣的技術(shù),常見于"下一代內(nèi)容檢測(cè)系統(tǒng)"及UTM類設(shè)備。從理論上,數(shù)據(jù)流中每個(gè)報(bào)文的任意字段或數(shù)據(jù)流傳輸過程中的任何特征都可以作為應(yīng)用協(xié)議識(shí)別的依據(jù),但實(shí)際上,如何快速選擇最有效的數(shù)據(jù)流特征信息的難度遠(yuǎn)遠(yuǎn)超過了您的想象。第三種方法稱為解密檢測(cè)方法,就是將數(shù)據(jù)流送入一個(gè)分類器,數(shù)據(jù)流被分類之后,將加密數(shù)據(jù)流送入一個(gè)解密引擎,解密引擎通過預(yù)置的解密算法對(duì)數(shù)據(jù)解密,解密后再次返回分類器進(jìn)行檢查。
準(zhǔn)確識(shí)別應(yīng)用流量的基本概念
介紹準(zhǔn)確識(shí)別應(yīng)用流量之前,有幾個(gè)概念需要介紹:
數(shù)據(jù)流:基于應(yīng)用層協(xié)議識(shí)別的對(duì)象不能只是簡(jiǎn)單的檢查單個(gè)報(bào)文,而是要將數(shù)據(jù)流作為一個(gè)整體來檢測(cè)。因此,數(shù)據(jù)流是指在某個(gè)會(huì)話生命周期內(nèi),通過網(wǎng)絡(luò)上一個(gè)檢測(cè)節(jié)點(diǎn)的IP數(shù)據(jù)報(bào)文的集合。實(shí)際上,一個(gè)節(jié)點(diǎn)發(fā)送的數(shù)據(jù)流的所有屬性是相同的。
數(shù)據(jù)流分類:利用數(shù)據(jù)流以及數(shù)據(jù)流中報(bào)文的某些信息,可將網(wǎng)絡(luò)上的數(shù)據(jù)流進(jìn)行分類,這種分類可加速應(yīng)用流量的分類,如游戲應(yīng)用數(shù)據(jù)流通常是小報(bào)文,而P2P流一般稱為大報(bào)文。
數(shù)據(jù)流類別:數(shù)據(jù)流類別是一個(gè)大型網(wǎng)狀結(jié)構(gòu)的分類器,按照行為特征及簽名進(jìn)行歸類。在數(shù)據(jù)流分類問題中,每個(gè)類別可能包含某些屬性類似的多種協(xié)議,典型的如IE下載即包括了多個(gè)類別,有分塊下載,有偽IE下載等,有另存單線程下載等,而協(xié)議識(shí)別必須對(duì)流進(jìn)行更精細(xì)的分類,使得每個(gè)類別中的流只使用一種應(yīng)用層協(xié)議。
協(xié)議識(shí)別:協(xié)議識(shí)別是指檢測(cè)引擎根據(jù)協(xié)議特征,識(shí)別出網(wǎng)絡(luò)數(shù)據(jù)流使用的應(yīng)用層協(xié)議。
應(yīng)用協(xié)議特征字符串:特征字符串是協(xié)議歸類的關(guān)鍵依據(jù),字符串特征舉例協(xié)議特征字符串
ftp特征字符串a(chǎn)cct、cwd、smnt、port;
smtp特征字符串HELO、EHLO、MAIL FROM:、RCPT TO:、VRFY、EXPN;
pop3特征字符串+OK、-ERR、APOP、TOP、UIDL;
msn 特征字符串包括msg、nln、out、qng、ver、msnp;
OICQ特征字符串開頭第一個(gè)字節(jié):0x02,第四、五字節(jié):協(xié)議號(hào);
sip特征字符串REGISTER、INVITE、ACK、BYE、CANCEL、SIP;
eMule特征字符串開頭第一個(gè)字節(jié):0xe3 或 0xc5 或 0xd4;
應(yīng)用流量協(xié)議特征檢測(cè)方法
數(shù)據(jù)流檢測(cè)方法主要分為四個(gè)層次,讓我們描述一下從最簡(jiǎn)單到最復(fù)雜的檢測(cè)過程。
首先,互聯(lián)網(wǎng)眾所周知的網(wǎng)絡(luò)應(yīng)用都是建立在固定網(wǎng)絡(luò)協(xié)議或端口上,如http、ftp等等常用協(xié)議,這些協(xié)議的特征非常明顯,在一定程度上幾乎不使用檢測(cè)引擎就可識(shí)別。
其次,但當(dāng)應(yīng)用變得復(fù)雜時(shí),很多應(yīng)用都會(huì)啟用隨機(jī)端口進(jìn)行通信,因此,新啟用的端口我們事先無法預(yù)知,此時(shí)DPI必須實(shí)時(shí)監(jiān)控會(huì)話,通過監(jiān)測(cè)數(shù)以千計(jì)的并發(fā)會(huì)話來判斷其應(yīng)用特征。
很多新的網(wǎng)絡(luò)應(yīng)用偽裝使用已知的固定端口,如使用80、8080、443等知名端口,特別像使用80端口的偽裝,偽裝的目的首先是被防火墻認(rèn)可,不至于在防火墻上被阻斷,被作為正常的web訪問而通行。這種應(yīng)用如P2P偽裝、視頻偽裝,都使用這些知名端口。此時(shí)設(shè)備需要在多個(gè)會(huì)話中開始尋找所謂的簽名,通常這是一個(gè)復(fù)雜的字符串,是檢測(cè)引擎預(yù)先定義好的,而且是唯一一個(gè)應(yīng)用。隨著應(yīng)用的增加,DPI特征庫需要不斷更新。如下圖迅雷采用偽IE下載就屬于典型的偽裝。
第三,對(duì)于完全加密的應(yīng)用,我們稱為加密流,對(duì)于加密數(shù)據(jù)流,去尋求一個(gè)端口或簽名是毫無意義的。因此,檢測(cè)引擎需要開發(fā)出一種新方法,著眼于數(shù)據(jù)包長(zhǎng)度和它們的順序排序。而實(shí)際上,其中的一些加密應(yīng)用總是使用同一系列的包長(zhǎng)度、在同一位置、在同一順序,這就是所謂的行為特征。通常,檢測(cè)引擎能夠這些加密流進(jìn)行行為分析,而實(shí)際上,這里存在兩個(gè)難度,一個(gè)是加密流特征字符串的獲取本身需要扎實(shí)的獨(dú)特的算法,另外,單單對(duì)于位置的檢測(cè)還遠(yuǎn)遠(yuǎn)不夠,如加密傳輸?shù)膽?yīng)用協(xié)議的加密方法幾乎每周都在變換位置。
如何評(píng)價(jià)應(yīng)用識(shí)別引擎:
應(yīng)用識(shí)別引擎是應(yīng)用流量管理系統(tǒng)的核心,所以下面五點(diǎn)則能較好的評(píng)價(jià)產(chǎn)品。
第一、應(yīng)用程序的識(shí)別數(shù)量多少,特別對(duì)復(fù)雜協(xié)議及新協(xié)議的識(shí)別數(shù)量成為產(chǎn)品的核心,而不是單單用端口號(hào)來標(biāo)識(shí)的簡(jiǎn)單應(yīng)用或標(biāo)準(zhǔn)應(yīng)用。
第二、應(yīng)用協(xié)議識(shí)別的準(zhǔn)確性。一個(gè)好的引擎或好的算法才能保證低的誤報(bào)和漏報(bào)。
第三、應(yīng)用檢測(cè)的時(shí)間消耗。一個(gè)好的引擎能夠花費(fèi)很少的時(shí)間即可檢查出特征。
第四、對(duì)高性能和高帶寬處理。一個(gè)好的引擎才能部署到大的網(wǎng)絡(luò)環(huán)境中,如高校、大集團(tuán)用戶、運(yùn)營商網(wǎng)絡(luò)。
第五、協(xié)議庫更新的頻率及協(xié)議庫庫更新的難易程度。一個(gè)好的引擎才能保證協(xié)議庫的更新有驗(yàn)證、計(jì)算、校對(duì),使系統(tǒng)不斷網(wǎng)、不重啟,即使出現(xiàn)升級(jí)失敗,也能保證原有特征庫不被損壞,正常運(yùn)行。
【推薦閱讀】
◆IT運(yùn)維管理專區(qū)
◆泛普BTNM如何實(shí)現(xiàn)對(duì)客戶機(jī)的流量管理,比如說對(duì)下載的管理?
◆網(wǎng)管經(jīng)驗(yàn):基于MAC地址來管控流量
◆詳細(xì)講解網(wǎng)絡(luò)訪問控制策略的應(yīng)用
◆網(wǎng)管軟件專區(qū)
本文來自互聯(lián)網(wǎng),僅供參考