當前位置:工程項目OA系統(tǒng) > 泛普各地 > 吉林OA系統(tǒng) > 長春OA系統(tǒng) > 長春OA行業(yè)資訊
專家分析:內(nèi)存架構(gòu)對系統(tǒng)性能的影響
內(nèi)存技術(shù)大多數(shù)根據(jù)其執(zhí)行速度來命名。如PC100 SDRAM組件是指數(shù)據(jù)速率為100MHz的儲存技術(shù),PC133則表示數(shù)據(jù)速率為133MHz,等等。盡管這種命名的習慣隨著時間發(fā)展而變化,但通常還是能為潛在買家提供關(guān)于內(nèi)存執(zhí)行速度的信息。事實上,今天的主流儲存技術(shù)都是依照其峰值數(shù)據(jù)速率來命名的,這將繼續(xù)成為評估儲存系統(tǒng)性能的要素之一。不過,在實際系統(tǒng)中,沒有內(nèi)存能完全工作在其峰值速率下。
從寫入命令轉(zhuǎn)換到讀取命令,在某個時間存取某個地址,以及刷新數(shù)據(jù)等作業(yè)都要求數(shù)據(jù)總線在一定時間內(nèi)保持休止狀態(tài),這樣就不能充分利用內(nèi)存信道。此外,寬并行總線和DRAM核心預(yù)取都經(jīng)常導(dǎo)致不必要的大數(shù)據(jù)量存取。在指定的時間段內(nèi),內(nèi)存控制器能存取的有用數(shù)據(jù)稱為有效數(shù)據(jù)速率,這很大程度上取決于系統(tǒng)的特定應(yīng)用。有效數(shù)據(jù)速率隨著時間而變化,常低于峰值數(shù)據(jù)速率。在某些系統(tǒng)中,有效數(shù)據(jù)速率可下降到峰值速率的10%以下。
通常,這些系統(tǒng)受益于那些能產(chǎn)生更高有效數(shù)據(jù)速率的內(nèi)存技術(shù)的變化。在CPU方面存在類似的現(xiàn)象,最近幾年諸如AMD和Transmeta等公司已經(jīng)指出,在測量基于CPU的系統(tǒng)的性能時,頻率頻率不是唯一的要素。內(nèi)存技術(shù)已經(jīng)很成熟,峰值速率和有效數(shù)據(jù)速率或許并不比以前匹配的更好。盡管峰值速率依然是內(nèi)存技術(shù)最重要的參數(shù)之一,但其它結(jié)構(gòu)參數(shù)也可以大幅影響內(nèi)存系統(tǒng)的性能。
影響有效數(shù)據(jù)速率的參數(shù)
有幾類影響有效數(shù)據(jù)速率的參數(shù),其一是導(dǎo)致數(shù)據(jù)總線進入若干周期的停止狀態(tài)。在這類參數(shù)中,總線轉(zhuǎn)換、行周期時間、CAS延遲以及RAS到CAS的延遲(tRCD)引發(fā)系統(tǒng)結(jié)構(gòu)中的大部份延遲問題。
總線轉(zhuǎn)換本身會在數(shù)據(jù)信道上產(chǎn)生非常長的停止時間。以GDDR3系統(tǒng)為例,該系統(tǒng)對內(nèi)存的開放頁不斷寫入數(shù)據(jù)。在這期間,內(nèi)存系統(tǒng)的有效數(shù)據(jù)速率與其峰值速率相當。不過,假設(shè)100個頻率周期中,內(nèi)存控制器從讀取轉(zhuǎn)換到寫入。由于這個轉(zhuǎn)換需要6個頻率周期,有效的數(shù)據(jù)速率下降到峰值速率的94%。在這100個頻率周期中,如果內(nèi)存控制器將總線從寫入轉(zhuǎn)換到讀取的話,將會丟失更多的頻率周期。這種內(nèi)存技術(shù)在從寫入轉(zhuǎn)換到讀取時需要15個空閑周期,這會將有效數(shù)據(jù)速率進一步降低到峰值速率的79%。表1顯示出針幾種高性能內(nèi)存技術(shù)類似的運算結(jié)果。
顯然,所有的內(nèi)存技術(shù)并不相同。需要很多總線轉(zhuǎn)換的系統(tǒng)設(shè)計師可以選用諸如XDR、RDRAM或者DDR2這些更高效的技術(shù)來提升性能。另一方面,如果系統(tǒng)能將處理事務(wù)分組成非常長的讀寫序列,那么總線轉(zhuǎn)換對有效頻寬的影響最小。不過,其它的增加延遲現(xiàn)象,例如庫(bank)沖突會降低有效頻寬,對性能產(chǎn)生負面影響。
DRAM技術(shù)要求庫的頁或行在存取之前開放。一旦開放,在一個最小周期時間,即行周期時間(tRC)結(jié)束之前,同一個庫中的不同頁不能開放。對內(nèi)存開放庫的不同頁存取被稱為分頁遺漏,這會導(dǎo)致與任何tRC間隔未滿足部份相關(guān)的延遲。對于還沒有開放足夠周期以滿足tRC間隙的庫而言,分頁遺漏被稱為庫沖突。而tRC決定了庫沖突延遲時間的長短,在特定的DRAM上可用的庫數(shù)量直接影響庫沖突產(chǎn)生的頻率。
大多數(shù)內(nèi)存技術(shù)有4個或者8個庫,在數(shù)十個頻率周期具有tRC值。在隨機負載情況下,那些具有8個庫的核心比具有4個庫的核心所發(fā)生的庫沖突更少。盡管tRC與庫數(shù)量之間的相互影響很復(fù)雜,但是其累計影響可用多種方法量化。
內(nèi)存讀取事務(wù)處理
考慮三種簡單的內(nèi)存讀取事務(wù)處理情況。第一種情況,內(nèi)存控制器發(fā)出每個事務(wù)處理,該事務(wù)處理與前一個事務(wù)處理產(chǎn)生一個庫沖突??刂破鞅仨氃诖蜷_一個頁和打開后續(xù)頁之間等待一個tRC時間,這樣增加了與頁循環(huán)相關(guān)的最大延遲時間。在這種情況下的有效數(shù)據(jù)速率很大程度上決定于I/O,并主要受限于DRAM核心電路。最大的庫沖突頻率將有效頻寬削減到目前最高階內(nèi)存技術(shù)峰值的20%到30%。
在第二種情況下,每個事務(wù)處理都以隨機產(chǎn)生的地址為目標。此時,產(chǎn)生庫沖突的機會取決于很多因素,包括tRC和內(nèi)存核心中庫數(shù)量之間的相互作用。tRC值越小,開放頁循環(huán)地越快,導(dǎo)致庫沖突的損失越小。此外,內(nèi)存技術(shù)具有的庫越多,隨機地址存取庫沖突的機率就越小。
第三種情況,每個事務(wù)處理就是一次頁命中,在開放頁中尋址不同的列地址。控制器不必存取關(guān)閉頁,允許完全利用總線,這樣就得到一種理想的情況,即有效數(shù)據(jù)速率等于峰值速率。
第一種和第三種情況都涉及到簡單的運算,隨機情況受其它的特性影響,這些特性沒有包括在DRAM或者內(nèi)存接口中。內(nèi)存控制器仲裁和排隊會大幅改善庫沖突頻率,因為更有可能出現(xiàn)不產(chǎn)生沖突的事務(wù)處理,而不是那些導(dǎo)致庫沖突的事務(wù)處理。
然而,增加內(nèi)存隊列深度未必增加不同內(nèi)存技術(shù)之間的相對有效數(shù)據(jù)速率。例如,即使增加內(nèi)存控制隊列深度,XDR的有效數(shù)據(jù)速率也比GDDR3高20%。這種增量主因是XDR具有更高的庫數(shù)量以及更低的tRC值。一般而言,更短的tRC間隔、更多的庫數(shù)量以及更大的控制器隊列能產(chǎn)生更高的有效頻寬。
實際上,很多效率限制現(xiàn)象是與行存取粒度相關(guān)的問題。tRC約束本質(zhì)上要求內(nèi)存控制器從新開放的行中存取一定量的數(shù)據(jù),以確保數(shù)據(jù)管線保持充滿。事實上,為保持數(shù)據(jù)總線無中斷地執(zhí)行,在開放一個行之后,只須讀取很少量的數(shù)據(jù),即使不需要額外的數(shù)據(jù)。
另外一種減少內(nèi)存系統(tǒng)有效頻寬的主要特性被歸類到列存取粒度范疇,它規(guī)定了每次讀寫作業(yè)必須傳輸?shù)臄?shù)據(jù)量。與之相反,行存取粒度規(guī)定每個行啟動(一般指每個RAS的CAS作業(yè))需要多少單獨的讀寫作業(yè)。列存取粒度對有效數(shù)據(jù)速率具有不易于量化的巨大影響。因為它規(guī)定一個讀取或?qū)懭胱鳂I(yè)中需要傳輸?shù)淖钚?shù)據(jù)量,列存取粒度為那些一次只需要很少數(shù)據(jù)量的系統(tǒng)帶來了問題。如一個需要來自兩列各8字節(jié)的16字節(jié)存取粒度系統(tǒng),必須讀取總共32字節(jié)以存取兩個位置。因為只需要32個字節(jié)中的16個字節(jié),系統(tǒng)的有效數(shù)據(jù)速率降低到峰值速率的50%。總線頻寬和脈沖時間長度這兩個結(jié)構(gòu)參數(shù)規(guī)定了內(nèi)存系統(tǒng)的存取粒度。
總線頻寬是指連接內(nèi)存控制器和內(nèi)存之間的數(shù)據(jù)線數(shù)量。它設(shè)定最小的存取粒度,因為對于一個指定的內(nèi)存事務(wù)處理,每條數(shù)據(jù)線必須至少傳遞一個數(shù)據(jù)位。而脈沖時間長度則規(guī)定對于指定的事務(wù)處理,每條數(shù)據(jù)線必須傳遞的位數(shù)量。每個事務(wù)處理中的每條數(shù)據(jù)線只傳一個數(shù)據(jù)位的儲存技術(shù),其脈沖時間長度為1??偭写嫒×6群芎唵危毫写嫒×6?總線寬度×脈沖時間長度。
很多系統(tǒng)架構(gòu)僅僅透過增加DRAM組件和儲存總線頻寬就能增加儲存系統(tǒng)的可用頻寬。畢竟,如果4個400MHz數(shù)據(jù)速率的連接可實現(xiàn)1.6GHz的總峰值頻寬,那么8個連接將得到3.2GHz。增加一個DRAM組件,電路板上的聯(lián)機以及ASIC的接腳就會增多,總峰值頻寬相對倍增。
首要的是,架構(gòu)師希望完全利用峰值頻寬,這已經(jīng)達到他們透過實體設(shè)計內(nèi)存總線所能達到的最大值。具有256位甚或512位儲存總線的圖形控制器已并不鮮見,這種控制器需要1,000個,甚至更多的接腳。封裝設(shè)計師、ASIC底層規(guī)劃工程師以及電路板設(shè)計工程師不能找到采用便宜的、商業(yè)上可行的方法來對這么多訊號進行布線的硅芯片區(qū)域。僅僅增加總線寬度來獲得更高的峰值數(shù)據(jù)速率,會導(dǎo)致因為列存取粒度限制而降低有效頻寬。
假設(shè)某個特定儲存技術(shù)的脈沖時間長度等于1,對于一個內(nèi)存處理,512位寬系統(tǒng)的存取粒度為512位(或者64字節(jié))。如果控制器只需要一小段數(shù)據(jù),那么剩下的數(shù)據(jù)就被浪費掉,這就降低了系統(tǒng)的有效數(shù)據(jù)速率。如只需要儲存系統(tǒng)32字節(jié)數(shù)據(jù)的控制器將浪費剩余的32字節(jié),進而導(dǎo)致有效的數(shù)據(jù)速率等于50%的峰值速率。這些運算都假定脈沖時間長度為1。隨著內(nèi)存接口數(shù)據(jù)速率增加的趨勢,大多數(shù)新技術(shù)的最低脈沖時間長度都大于1。
核心預(yù)取
一種稱為核心預(yù)取的功能主要負責增加最小的脈沖時間長度。DRAM核心電路不能跟上I/O電路速度的速增。由于數(shù)據(jù)不能再連續(xù)地從核心中取出以確??刂破餍枨?,核心通常為I/O提供比DRAM總線寬度更大的數(shù)據(jù)集。
本質(zhì)上,核心傳輸足夠的數(shù)據(jù)到接口電路,或者從接口電路傳輸足夠的數(shù)據(jù),以使接口電路保持足夠長時間的繁忙狀態(tài),以便讓核心準備下一個作業(yè)。如假設(shè)DRAM核心每個奈秒才能對作業(yè)響應(yīng)一次。不過,接口可以支持每奈秒兩位的數(shù)據(jù)速率。
DRAM核心每次作業(yè)取兩個數(shù)據(jù)位,而不是一個數(shù)據(jù)位,因而不必浪費接口一半的容量。在接口傳輸數(shù)據(jù)之后,核心已經(jīng)準備好響應(yīng)下一個請求,而不需增加延遲。增加的核心預(yù)取導(dǎo)致最小脈沖時間長度增加為2,這將直接影響列存取粒度。
對于每個增加到總線寬度的額外訊號,內(nèi)存接口將傳輸兩個額外的數(shù)據(jù)位。因此具有最小脈沖時間長度為2的512位寬的儲存系統(tǒng),其存取粒度為1,024位(128字節(jié))。很多系統(tǒng)對最小存取粒度的問題并不敏感,因為它們儲存大量的數(shù)據(jù)。不過,某些系統(tǒng)依賴內(nèi)存系統(tǒng)提供小的數(shù)據(jù)單元,并獲益于更窄、更有效的內(nèi)存技術(shù)。
隨著儲存技術(shù)向峰值數(shù)據(jù)速率發(fā)展,有效的數(shù)據(jù)速率變的越來越重要。在選擇內(nèi)存時,設(shè)計師必須深入了解已公布的內(nèi)存規(guī)格,并明白某個特定的技術(shù)特性將對應(yīng)用設(shè)計產(chǎn)生怎樣的影響。內(nèi)存系統(tǒng)設(shè)計師必須超越峰值數(shù)據(jù)速率規(guī)格,就像CPU設(shè)計師不再用GHz作為唯一的性能衡量標準一樣。盡管對于內(nèi)存接口而言,峰值數(shù)據(jù)速率依然是最終要的性能規(guī)格,但有效的數(shù)據(jù)速率已開始為系統(tǒng)設(shè)計師和架構(gòu)師提供更大的空間。未來產(chǎn)品的性能將大幅取決于其內(nèi)存系統(tǒng)的有效利用程度。(IT專家網(wǎng))
- 1評估綠色數(shù)據(jù)中心有哪些量化指標?
- 2EAI與Web服務(wù)兩種應(yīng)用集成技術(shù)比較
- 3解析視頻會議中的存儲和安全問題
- 4OA辦公系統(tǒng)結(jié)合了先進的管理思想和經(jīng)驗
- 5如何更好管理一臺服務(wù)器上多個數(shù)據(jù)庫
- 6如何給虛擬化做好網(wǎng)絡(luò)技術(shù)準備
- 7部署企業(yè)無線網(wǎng)路應(yīng)考慮四個風險和對策
- 8數(shù)據(jù)中心 迎接巨變
- 9企業(yè)電子郵件安全問題隱憂重重
- 10服務(wù)器虛擬化是實現(xiàn)綠色IT重要途徑
- 11解密數(shù)據(jù)中心三大困局
- 12由微軟黑屏思考信息安全真正黑手
- 13分支機構(gòu)網(wǎng)絡(luò)管理影響企業(yè)的IP電話管理
- 14Gartner為何看輕客戶端虛擬化?
- 15云計算是創(chuàng)新了技術(shù)還是創(chuàng)新了營銷
- 16因為共享企業(yè)必須面對云計算時代
- 17崔真實事件考問國內(nèi)上網(wǎng)行為管理
- 18三大熱門數(shù)據(jù)存儲技術(shù)的類比分析
- 19應(yīng)用接入產(chǎn)品選擇四大方法
- 20五大虛擬化熱門技術(shù):CPU虛擬化居首
- 21分析:虛擬化技術(shù)給企業(yè)應(yīng)用帶來的優(yōu)勢
- 22長春OA為企業(yè)量身打造適合企業(yè)的協(xié)同OA辦公系統(tǒng)!
- 23采取7項措施來建設(shè)更綠色數(shù)據(jù)中心
- 24虛擬化會成為Linux的殺手嗎?
- 25分析未來數(shù)據(jù)中心的走向
- 26泛普OA軟件的文檔知識一體化管理系統(tǒng)
- 27泛普OA為集團企業(yè)客戶提供更好地OA產(chǎn)品
- 28中國用戶到底需要什么樣的網(wǎng)管軟件
- 29CTO解讀企業(yè)數(shù)據(jù)安全管理與防護
- 30教你幾招服務(wù)器數(shù)據(jù)備份方法
成都公司:成都市成華區(qū)建設(shè)南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓