全新x86微架構「Core」吹起省電風潮的號角
「Core」是英特爾首款「針對雙核心最佳化」的設計,電源管理機制是其重頭戲,Core微架構內部的匯流排可視資料傳輸的需求,動態關閉一半的寬度以節約電力。
毫無疑問的,先前普遍稱為「NGMA(Next Generation Micro-Architecture)」或「Merom」,最後正名「Core Microarchitecture」的全新x86微架構,是本屆IDF中最重要也最受注目的焦點。從Core微架構開始,「省電」與「效能/功耗比」確定成為英特爾處理器未來數年的技術發展方向,也將帶動省電處理器的風潮。
Prescott與Tejas的悲劇
前年英特爾寄以厚望的90nm製程Pentium 4「Prescott」遭遇功耗過高的瓶頸,被戲稱為「100多瓦的不發光燈泡」,直接導致後繼預定時脈超過5GHz的「Tejas」慘遭腰斬,6GHz的「Nehalem」更因此無疾而終,而4GHz的Pentium 4 580則根本就沒有出現。
結果就是:英特爾原先保證起碼可以發展十年的NetBurst,後來竟然連五年都不到。NetBurst微架構的發展受阻,使得英特爾在加速雙核心x86處理器的進度之外,必須重新研發兼具高效能、多功能與低耗電的微架構,使得原先僅用在第三代Centrino的「Merom」,就此成為英特爾x86處理器的主角。
追求「效能/功耗」比,與架構上的效率
Core微架構是英特爾首款「針對雙核心最佳化」的設計,支援EM64T指令集、Vanderpool虛擬化技術、La Grande安全運算技術、SSE/SSE2/SSE3以及代號MNI(Merom New Instructions)的SSE4指令集。
相較於Pentium 4處理器那驚世駭俗的NetBurst,Core微架構可謂反璞歸真,是以既有的Pentium M處理器為基礎的全新設計。但「舊瓶裝新酒」是一回事,Core微架構在技術上頗有可觀之處,值得大書特書。
Core微架構最大的突破,在於揚棄了Pentium 4時代的超深管線架構與高時脈訴求,其整數邏輯運算指令管線僅有14階,透過可每個時脈週期解碼四個指令的解碼器,與更充沛的執行單元數目,每個核心可同時處理96個指令,以達成更高的指令平行運算能力,兼顧省電與高效能。除了延續過去Pentium M處理器的微指令融合機制之外,Core微架構進一步提供巨集指令融合,可將接連的比較/測試與跳躍指令合而為一,增加實際執行的指令數目,以及縮短載入跳躍目標記憶體位址的時間。換言之,Core微架構實際上的運算效能,超過規格帳面上所看到的數字,遠比過往的英特爾x86處理器更有效率。
SSE等SIMD延伸指令集對多媒體應用日益重要,Core微架構提供完整的128位元SSE執行單元,而非過去的英特爾x86處理器,僅提供64位元執行單元,128位元寬的資料運算,起碼需要兩個時脈週期才能完成。
英特爾基於「種種因素」,不採用處理器內建記憶體控制器的作法,為了縮短記憶體存取延遲,Core微架構採用雙核心共享第二階快取改善快取容量的利用率,強化指令/資料預先擷取機制,新增記憶體位址相依性預測功能以加速載入記憶體資料的效率。
電源管理機制則是Core微架構的重頭戲,除了延續既有Pentium M與Core Duo/Solo(代號「Yonah」)處理器的功能、如動態關閉用不到的功能單元與內建數位熱量感測器外,Core微架構內部的匯流排可視資料傳輸的需求,動態關閉一半的寬度以節約電力。
既有產品四倍的「效能/功耗比」
這些「新技術」究竟帶來怎樣的成果?英特爾表示,和最高階Yonah T2600相比,在維持相同電池續航力的前提下,時脈2.33GHz的「Merom」行動式處理器可提昇超過20%的效能。時脈2.66GHz的「Conroe」桌上型處理器,可比目前最高階的Pentium D 950提昇40%的效能,與降低40%的耗電量。時脈2.93GHz的Xeon DP「Woodcrest」,效能比現有的雙核心Xeon DP「Paxville DP」2.8GHz多出80%,耗電量還可減少35%。
先前國外網站實測Conroe處理器的實際效能,相較於AMD最高階的Athlon 64 FX-60(時脈2.8GHz,耗電量110W),最高階的Conroe E6700處理器時脈僅有2.66GHz,耗電量區區65W,卻享有20%的整體效能優勢。雖然Core微架構相關產品要將近半年後才會上市,但因AMD目前依舊缺乏可抗衡Core微架構的核心設計,英特爾頗有機會從AMD手上奪回x86處理器的技術與效能優勢。
半年後取代NetBurst微架構,明年進入四核心的世界
根據英特爾的處理器時程表,從今年第三季開始,與雙核心行動式處理器「Merom」、雙核心桌上型處理器「Conroe」與雙核心Xeon DP「Woodcrest」將陸續上市。預計今年第三季推出、雙核心內建16MB共享式第三階快取記憶體的Xeon MP「Tulsa」,將成為NetBurst微架構的絕響。換言之,Core微架構將逐步取代既有的產品線,結束目前Pentium 4(NetBurst)與Pentium M(Banias)分立的局面,重新統一英特爾x86微架構。
在明年第一季,英特爾將推出四核心桌上型處理器「Kentsfield」、四核心Xeon DP處理器「Clovertown」與四核心Xeon MP處理器「Tigerton(Clovertown MP)」,x86處理器從此進入四核心的世界。在2008年,採用Core微架構的處理器,更將邁進八核心。
Core微架構的誕生,只是省電風潮的第一步
當然,單純一顆省電的處理器,是絕對無法省下多少電的,就算從95W的Pentium D換成65W的Conroe,也只能省下30W,對整臺電腦來說根本是杯水車薪,記憶體時脈稍微調高馬上就「彌補」回來了。但不可否認的,Core微架構堪稱是x86處理器發展史上的一大突破,一昧追求極限效能的時代已經過去了。
更重要的是,Core微架構將帶動在降低耗電量的前提下、追求合理效能的訴求,讓不分領域的硬體廠商,開始重視省電技術的必要性-尤其是耗電量已經完全失控的顯示晶片。這也許是英特爾這一步棋,對整個產業界最重大的貢獻,以及對企業界最重要的啟發。文⊙劉人豪
另類觀點:Core微架構真的比AMD K8省電?
雖然Core微架構家族處理器的耗電量看似令人驚艷,但光看處理器是不公平的,實際上的耗電量,必須從整體系統平臺的角度來衡量,這也剛好呼應著英特爾「平臺化」的訴求。
AMD K8核心內建記憶體控制器,所以已經將傳統北橋的大半耗電量給「吸收」進去了,況且因整合之故,可以配合處理器的運作模式進行最佳化,例如在省電模式時,可以關閉部分較為耗電的記憶體存取方法,如部分線路預先充電、處理器存取第二階快取時讓記憶體控制器預先載入位址的功能,最省電模式時強迫記憶體進入自我更新狀態等。因此,AMD K8平臺記憶體控制器的電力效率上,是明顯勝過採用傳統北橋架構的英特爾處理器。
記憶體種類也應納入考量。以英特爾Xeon DP「Bensley」平臺所採用的FB-DIMM為例,在安裝32GB容量時,光是記憶體本身的耗電量就將近100W,而在2路Opteron系統上所安裝的相同容量DDR400卻不到35W,高下立判。至於PCI-X、PCI Express橋接器與網路晶片的耗電量,因各家相去不遠,所以姑且不論。
從這個角度來看,其實Core微架構的省電能力,並沒有英特爾所宣傳的那麼明顯。但不可否認的,相較於過去動輒100W以上的「不發光燈泡」,Core微架構的確大幅縮短了英特爾與AMD的差距,而效能上更享有明顯優勢,所以AMD即將推出的新版Revision F核心,實際上的表現如何,就是非常值得關注的焦點。
「Core」是英特爾首款「針對雙核心最佳化」的設計,電源管理機制是其重頭戲,Core微架構內部的匯流排可視資料傳輸的需求,動態關閉一半的寬度以節約電力。
|
歷經超過三年的開發時程,與將近一年的風聲鶴唳,英特爾號稱兼顧「效能、功能與省電」的Core微架構處理器,終於正式登場了。資料來源:英特爾 |
毫無疑問的,先前普遍稱為「NGMA(Next Generation Micro-Architecture)」或「Merom」,最後正名「Core Microarchitecture」的全新x86微架構,是本屆IDF中最重要也最受注目的焦點。從Core微架構開始,「省電」與「效能/功耗比」確定成為英特爾處理器未來數年的技術發展方向,也將帶動省電處理器的風潮。
Prescott與Tejas的悲劇
前年英特爾寄以厚望的90nm製程Pentium 4「Prescott」遭遇功耗過高的瓶頸,被戲稱為「100多瓦的不發光燈泡」,直接導致後繼預定時脈超過5GHz的「Tejas」慘遭腰斬,6GHz的「Nehalem」更因此無疾而終,而4GHz的Pentium 4 580則根本就沒有出現。
結果就是:英特爾原先保證起碼可以發展十年的NetBurst,後來竟然連五年都不到。NetBurst微架構的發展受阻,使得英特爾在加速雙核心x86處理器的進度之外,必須重新研發兼具高效能、多功能與低耗電的微架構,使得原先僅用在第三代Centrino的「Merom」,就此成為英特爾x86處理器的主角。
追求「效能/功耗」比,與架構上的效率
Core微架構是英特爾首款「針對雙核心最佳化」的設計,支援EM64T指令集、Vanderpool虛擬化技術、La Grande安全運算技術、SSE/SSE2/SSE3以及代號MNI(Merom New Instructions)的SSE4指令集。
相較於Pentium 4處理器那驚世駭俗的NetBurst,Core微架構可謂反璞歸真,是以既有的Pentium M處理器為基礎的全新設計。但「舊瓶裝新酒」是一回事,Core微架構在技術上頗有可觀之處,值得大書特書。
Core微架構最大的突破,在於揚棄了Pentium 4時代的超深管線架構與高時脈訴求,其整數邏輯運算指令管線僅有14階,透過可每個時脈週期解碼四個指令的解碼器,與更充沛的執行單元數目,每個核心可同時處理96個指令,以達成更高的指令平行運算能力,兼顧省電與高效能。除了延續過去Pentium M處理器的微指令融合機制之外,Core微架構進一步提供巨集指令融合,可將接連的比較/測試與跳躍指令合而為一,增加實際執行的指令數目,以及縮短載入跳躍目標記憶體位址的時間。換言之,Core微架構實際上的運算效能,超過規格帳面上所看到的數字,遠比過往的英特爾x86處理器更有效率。
SSE等SIMD延伸指令集對多媒體應用日益重要,Core微架構提供完整的128位元SSE執行單元,而非過去的英特爾x86處理器,僅提供64位元執行單元,128位元寬的資料運算,起碼需要兩個時脈週期才能完成。
英特爾基於「種種因素」,不採用處理器內建記憶體控制器的作法,為了縮短記憶體存取延遲,Core微架構採用雙核心共享第二階快取改善快取容量的利用率,強化指令/資料預先擷取機制,新增記憶體位址相依性預測功能以加速載入記憶體資料的效率。
電源管理機制則是Core微架構的重頭戲,除了延續既有Pentium M與Core Duo/Solo(代號「Yonah」)處理器的功能、如動態關閉用不到的功能單元與內建數位熱量感測器外,Core微架構內部的匯流排可視資料傳輸的需求,動態關閉一半的寬度以節約電力。
既有產品四倍的「效能/功耗比」
這些「新技術」究竟帶來怎樣的成果?英特爾表示,和最高階Yonah T2600相比,在維持相同電池續航力的前提下,時脈2.33GHz的「Merom」行動式處理器可提昇超過20%的效能。時脈2.66GHz的「Conroe」桌上型處理器,可比目前最高階的Pentium D 950提昇40%的效能,與降低40%的耗電量。時脈2.93GHz的Xeon DP「Woodcrest」,效能比現有的雙核心Xeon DP「Paxville DP」2.8GHz多出80%,耗電量還可減少35%。
先前國外網站實測Conroe處理器的實際效能,相較於AMD最高階的Athlon 64 FX-60(時脈2.8GHz,耗電量110W),最高階的Conroe E6700處理器時脈僅有2.66GHz,耗電量區區65W,卻享有20%的整體效能優勢。雖然Core微架構相關產品要將近半年後才會上市,但因AMD目前依舊缺乏可抗衡Core微架構的核心設計,英特爾頗有機會從AMD手上奪回x86處理器的技術與效能優勢。
半年後取代NetBurst微架構,明年進入四核心的世界
根據英特爾的處理器時程表,從今年第三季開始,與雙核心行動式處理器「Merom」、雙核心桌上型處理器「Conroe」與雙核心Xeon DP「Woodcrest」將陸續上市。預計今年第三季推出、雙核心內建16MB共享式第三階快取記憶體的Xeon MP「Tulsa」,將成為NetBurst微架構的絕響。換言之,Core微架構將逐步取代既有的產品線,結束目前Pentium 4(NetBurst)與Pentium M(Banias)分立的局面,重新統一英特爾x86微架構。
在明年第一季,英特爾將推出四核心桌上型處理器「Kentsfield」、四核心Xeon DP處理器「Clovertown」與四核心Xeon MP處理器「Tigerton(Clovertown MP)」,x86處理器從此進入四核心的世界。在2008年,採用Core微架構的處理器,更將邁進八核心。
Core微架構的誕生,只是省電風潮的第一步
當然,單純一顆省電的處理器,是絕對無法省下多少電的,就算從95W的Pentium D換成65W的Conroe,也只能省下30W,對整臺電腦來說根本是杯水車薪,記憶體時脈稍微調高馬上就「彌補」回來了。但不可否認的,Core微架構堪稱是x86處理器發展史上的一大突破,一昧追求極限效能的時代已經過去了。
更重要的是,Core微架構將帶動在降低耗電量的前提下、追求合理效能的訴求,讓不分領域的硬體廠商,開始重視省電技術的必要性-尤其是耗電量已經完全失控的顯示晶片。這也許是英特爾這一步棋,對整個產業界最重大的貢獻,以及對企業界最重要的啟發。文⊙劉人豪
另類觀點:Core微架構真的比AMD K8省電?
雖然Core微架構家族處理器的耗電量看似令人驚艷,但光看處理器是不公平的,實際上的耗電量,必須從整體系統平臺的角度來衡量,這也剛好呼應著英特爾「平臺化」的訴求。
AMD K8核心內建記憶體控制器,所以已經將傳統北橋的大半耗電量給「吸收」進去了,況且因整合之故,可以配合處理器的運作模式進行最佳化,例如在省電模式時,可以關閉部分較為耗電的記憶體存取方法,如部分線路預先充電、處理器存取第二階快取時讓記憶體控制器預先載入位址的功能,最省電模式時強迫記憶體進入自我更新狀態等。因此,AMD K8平臺記憶體控制器的電力效率上,是明顯勝過採用傳統北橋架構的英特爾處理器。
記憶體種類也應納入考量。以英特爾Xeon DP「Bensley」平臺所採用的FB-DIMM為例,在安裝32GB容量時,光是記憶體本身的耗電量就將近100W,而在2路Opteron系統上所安裝的相同容量DDR400卻不到35W,高下立判。至於PCI-X、PCI Express橋接器與網路晶片的耗電量,因各家相去不遠,所以姑且不論。
從這個角度來看,其實Core微架構的省電能力,並沒有英特爾所宣傳的那麼明顯。但不可否認的,相較於過去動輒100W以上的「不發光燈泡」,Core微架構的確大幅縮短了英特爾與AMD的差距,而效能上更享有明顯優勢,所以AMD即將推出的新版Revision F核心,實際上的表現如何,就是非常值得關注的焦點。


請先 登入 以發表留言。