加入RUN!PC粉絲團
 
企業採購 - 基礎架構
分享到Plurk
分享到FaceBook
 
是推薦升級的時機了
Intel Core i5/i7效能比較
文/何信達

先前代號為Lynnfield的處理器是Nehalem微架構為基礎的第二批處理器,新上市的i5/i7處理器以全系列四核心、新一代的1156腳位、取消南北橋架構、熱功耗95W、增加Turbo Boost等特色吸引我們的眼光,究竟其效能表現如何?

Intel代號Nehalem的微架構推出之後,造就了一陣效能旋風,最先受惠者由雙路伺服器需要的代號Nehalem-EP(Xeon 5500系列)處理器、Bloomfield(Xeon 3500系列/Core i7-900系列)處理器,再到近日推出的Lynnfield(Xeon 3400系列/Core i7-800系列/i5-700系列)。除了將一般主流伺服器帶入新的效能領域,也將高階桌上型電腦市場切割為三種腳位彼此不相容的平台,也就是1366腳位、1156腳位以及舊架構Penry的775腳位。很明確的是,這些平台都已經採用45nm製程的處理器,而下一代的32nm製程處理器,正是日前舉辦的IDF的重點之一,這也符合Intel tick-tock的發展策略,在更新微架構之後的階段便是製程更新。

圖1 Intel推出代號Lynnfield的i5/i7處理器。



Intel平台三大架構與頻寬演變
775腳位的Core 2處理器由於存在市場上的時間最久,因此在晶片組支援方面最廣泛,包括3系列晶片(G31/G33/G35/P31/P35/Q35/X38)與4系列晶片組(G43/G45/P43/P45/Q43/Q45/X48),1156腳位的i5目前支援的為P55晶片組,i7則依照i7-800的1156腳位支援P55,以及i7-900的1366腳位支援X58晶片組。Lynnfield加上P55晶片帶來最大的改變便是南北橋架構已經被打破。

圖2 P45平台架構。



圖3 X58平台架構。



圖4 P55平台架構。


P55是Intel第一次完全捨棄南北橋的架構,讀者可以從架構圖中看到。Nehalem微架構在Bloomfield將記憶體控制器整合在處理器之後,現在Lynnfield在架構上更進一步的將原來北橋所負責的顯示卡所使用的PCI-E 2.0也整合在處理器,只保留了PCI-E x1的部分在P55晶片的部分。當然,由於已經沒有南北橋的架構,過去由ICH(I/O Controller Hub)所連接的慢速通道,則全由PCH(Platform Controller Hub)晶片接手,PCH負責包括PCI-E、PCI、SATA等功能匯集,但並不提供IDE硬碟(PATA)與軟碟的支援。讀者可以留意P55的主機板,通常會再加上一顆如JMicron的JMB363控制晶片來提供IDE硬碟(PATA)與軟碟的支援。

三平台頻寬與應用方向
過去有北橋架構的P45晶片組與處理器之間的頻寬為10.6GB/s,X58晶片組則提升到25.6GB/s。X58晶片組的QPI是由其規格6.4GT/s而來, 6.4GT/s x 2Byte x 2(雙向作業) = 25.6GB/s ,同樣地,P55平台雖然將北橋部分整合在處理器中,但內部仍有QPI頻寬4.8GT/s,可以換算為19.2GB/s。簡單地說起來,X58晶片組雖然提供最大6.4GT/s的頻寬,但實際上只有在搭配 i7 Extreme 965/975時才會擁有,其餘其他i5/i7則是維持在4.8GT/s的頻寬。
在記憶體的頻寬變化上,過去有北橋架構的P45晶片組提供雙通道12.8GB/s(DDR2 6.4GB/s)或17GB/s(DDR3 8.5GB/s)的頻寬;但在Nehalem的微架構推出之後,Bloomfield處理器直接與記憶體溝通,可以提供DDR3記憶體三通道25.5GB/s(各通道8.5GB/s)的頻寬;而現今的Lynnfield同樣也包含記憶體控制器,可以提供雙通道DDR3的頻寬為21.2GB/s(各通道10.6GB/s)。
由於頻寬的不同,也說明了三種腳位平台應用方向的不同,當有巨量資料傳輸需求時,1366腳位便能發揮極大效益,為最佳的選擇。

效能測試說明
編輯部這次主要測試的是新推出的Lynnfield處理器,i7-870以及i5-750,並將手邊所有的i7-965、i7-920以及C2D E8500做一參考比較(另外還加上年代更久遠的Northwood P4-3.2GHz,如果讀者還在用的話)。由於平台架構的不同,記憶體容量的搭配並不一樣(但i5/i7均採用同一品牌的DDR3-1066記憶體模組),原則上我們讓平台能以雙通道或三通道配置以發揮較高的效能,同時我們也先採用了Windows 7 32位元版作為測試平台的作業系統(唯有i7-965採用64bit的配置讓其得到極致效能)。
效能是一顆處理器相當重要的環節,但隨著軟體不同,取用處理器資源的狀況也不一樣。編輯部採用的測試軟體則對多核心處理器提供支援,包括WinRAR、Cinebench以及Passmark PerformanceTest。在處理器核心的使用上,Cinebench R10包含單一處理器以及多處理器的Render測試,i5或i7處理器即使只測試單處理器時,使用率也只有10~20%,而且是各個核心輪流使用;但若相較於採用C2D E8500,所佔用的資源便超過50%,並且必須兩個核心同時使用。我們另外也測試i5-750與i7-870在Windows XP與Windows 7下的表現,Cinebench顯示,在單處理器的效能Windows XP可以勝過Windows 7約2%的表現。

圖5 i7-870進行Cinebench的多處理器運算效能測試。



效能測試結果
在所有的效能記錄中,我們也將數值換算為倍數,讓讀者更容易瞭解這些處理器在效能上的級距。

圖6 效能測試記錄總表。
註: 括弧裡的倍數是以E8500為基準進行換算。
VM RAR Host表示系統承載一個VM後的主機效能,括弧內的百分比是比較沒有承載VM時的比例。
CB為Cinebench的測試結果



圖7 在Cinebench測試結果中, i7-870 (2.93GHz)在多執行緒的工作下比 i7-920 (2.67GHz)更有效益。



圖8 i7-870進行Cinebench的單處理器運算效能測試。


各處理器的效能表現大多依型號變大而效能持續上升,比較特別的是i7-920與i7-870在效能方面時有高低,主要是因為在核心時脈上i7-870便比i7-920來得高,但另一方面,i7-870只搭配2GB的記憶體,如果效能值可以超過搭配3GB的i7-920也算划算的選擇。圖6的效能表中,我們以C2D E8500為基準(1x)讓讀者更容易瞭解這些差距。以整體測試結果而論,由於i5/i7在效能上幾乎都有接近2倍以上的增長,因此是舊系統升級的好時機。
在WinRAR基準測試項目中,得到依據處理器時脈有相同的排列,但值得一邊參考的是執行效能測試時的處理器使用率,在E8500處理器系統的執行時,幾乎佔用所有處理器的資源,可是在使用i7-870測試時,不只效能兩倍,而且才佔用了不到一半的處理器資源,這也意味著你還可以有充分的資源同步執行其他應用程式。

虛擬機器測試說明
是的,目前VMware官方公佈的虛擬機器效能測試只有一套叫VMmark,而且是適合用在複雜的企業環境中,所以---我們也只好轉個方向,也就是表格中VM RAR Host所測量的分數與百分比,這數字代表實體系統在開啟一個VM後所剩下來的效能,以i7-870為例,在不執行VM時其WinRAR效能達到2966,執行一個滿載的VM後,效能仍有2580,也就是一個VM只吃掉了10%的資源,Host主機仍保有90%的效能!所以你也可以看到,當效能越弱的主機執行VM時,所影響的情況更為明顯,因此經常執行VM的使用者真的要準備升級了。
在VMware Workstation的運作上是這樣的,一旦設定了VM所需要的記憶體大小,那麼VM會使用的運算資源也會限制在固定的範圍中,一旦VM達到100%的使用率,不論你怎麼操VM,都不會再影響Host實體主機的效能。由這樣的測試數據你可以看到,一方面是記憶體的大小決定了執行VM時相關的效能;另一方面,VM所消耗的效能是固定的,Host的運算資源越少,系統相對也就越吃力,例如E8500的系統,雖然有4G的記憶體,但當他VM滿載時,處理器也只剩一半的效能。
關於另一點比較有趣的是,在Host與Guest使用系統的順序,也會對效能產生一些影響,如果你先選擇使用VM應用程式的話,Host剩餘的資源就會少一些;相對地,如果Host的資源先被使用、Guest的資源也會少一些。

PerformanceTest - CPU Mark
從Passmark PerformanceTest來看,i5/i7的效能明顯地超過E8500許多,如果以P4的舊機種來比較,效能更差距超過12倍之多!

圖9 在CPU整體效能上極致版的i7-965有大幅度的領先。



圖10 3D整體效能部分很明顯的接近,完全依照顯示卡的效能而定!



圖11 在記憶體效能上,安裝越多記憶體仍然有相當大的效能影響,E8500搭配4GB記憶體後數字也很好看。(以下的測試數據保留各三次較具參考完整性)


在記憶體整體效能上,E8500是搭配4GB記憶體、i7-920則是搭配2GB記憶體,i5-750與i7-870則是2GB記憶體。在記憶體效能的部分並沒有大幅度的拉開,不過i5-750與i7-870可以支援至DDR3-1333,但只安裝了DDR3-1066,因此理論上還可以高一些。但相較之下,i7-920很像不是那麼划得來。

圖12 i7-965在整數運算上超凡的成績。



圖13 i7-870的浮點運算與質數計算比i7-920更好。


深究更詳細的效能比較時可以發現,i7-920的浮點運算與質數計算效能比i7-870差是主要的關鍵!i7-920的核心時脈為2.67GHz、i7-870核心時脈則為2.93GHz,i7-870的時脈原本就比920來得高會是帶來差別的原因之一。從此觀點來看,無疑地i7-870是較佳選擇。從Intel公布的千顆批量售價來看,i7-870價格整整是i7-920的兩倍價格,如果想要較高的成本效益比,不妨考量這次沒有測到的i7-860,其價格與i7-920定位相仿。
另外我們也將這些平台效益比做了估算,如果不考慮你有多少預算也不考慮其他的配置(如顯示卡),從CPU Mark與平台價格(主機板+記憶體+處理器),那麼砸大錢買i7-900極致版效益比最高,單位成本可以買到最大效能(但事實上不可能,因為你可能還會買兩張更高檔的顯示卡來做SLI之類的)。比較平易近人的選擇是i5-750加上P55平台的配置,不用一萬五就可以享受到Lynnfield的高效能。

圖14 2009年10月的效能型處理器新台幣售價。



Turbo Boost Technology(TBT)
在Nehalem的微架構下,不論是Lynnfield或Bloomfield,都具備了所謂Turbo Boost的功能,簡單地說就是當多核心處理器在非多執行緒的應用程式執行時,可以提高執行核心的時脈而降低非使用核心的時脈,超過標定的核心時脈處理工作。與一般的超頻不同的是,其只能夠在最大TDP的範圍下進行自動超頻,其只有在BIOS設定啟用或禁用,至於如何超頻其會自行運作。
Turbo Boost的自動運作以一個倍頻(1bin=+133MHz)來增加,例如i5-750的核心時脈為2.66GHz,當只有使用1或2個核心時,可以超頻到3.2GHz(4 bins),在使用3或4個核心時,可以超頻至2.8GHz(1 bin);同樣時脈為2.66GHz的i7-920在只使用單核心時,可以超頻至2.8GHz(2 bins);目前i7-870與i7-860在單一執行核心時最高可以到5 bins。
至於如何決定自動運作的時機,則依照軟體的設計而定,當其偵測到軟體只能為單核心運作時,以i5-750的話便會以3.20GHz執行該程式,如果偵測到軟體是經過四核心最佳化處裡的軟體,變會把四個核心以2.80GHz來執行該軟體。而這些變化,則是動態地再調整,使用者無須介入設定。
圖15 i5/i7處理器重要規格比較。其中Turbo Boost bins表示處理器在四核心/三核心/二核心/單核心時可以增加的bin數。



圖16 Turbo boost示意圖。當單執行緒只能使用單核心運算時,Turbo Boost機制提高執行核心的運作時脈。



是推薦升級的時機了
就效能型的桌上電腦來說,現在已經很明確的分為三級,三種腳位互不相容,多架構的市場對於企業來說會有一點麻煩,複雜度越高時所需要的備品就越多。回到需求面來看,在企業中並不需要每台電腦都做高效能的配置,而且,如果是在繪圖工作站的需求,那麼寧可將錢壓在顯示卡上,能夠有實質上的效益。對於恰好有升級桌機需求的人來說,i5在效能提升但價格並不算太高的狀況下是很值得升級的對象,例如i5-750價格與C2D-E8500價格接近,但效能完全不輸,而且將能在多核運作下更有效率。由於目前定價i7-860與i7-920類似,可以依照應用情況加以選擇,例如會安裝大量記憶體的話就選擇i7-920。
Lynnfield處理器是個值得採用的好東西,但在功能上還有需要留意的地方,不同的i5/i7處理器雖然都支援VT技術,但在TXT(Intel Trusted Execution Technology)、VT-d的支援並不一樣。在整體功耗散熱的部分,P55平台也有適當的設計,其包含處理器的TDP(Thermal Design Power)為95W,講求高效能的X58平台含處理器的TDP則為158.6W,而一般P45平台依照處理器搭配則在61.5W~156.5W之間。



測試環境配備:
P55晶片主機板:MSI P55-CD53
X58晶片主機板:MSI Eclipse、Asus P6T
顯示卡:MSI R4890(ATI)
記憶體:Qimonda IMSH1GU03A1F1C-10F(DDR3-1066 1GB)
硬碟:Intel 80GB SerialATA SSD (SSDSA2MH080G1GN)
電源:保銳魔族MOD 82+ 625W模組化電源供應器
作業系統:Microsoft Windows 7 RTM