僅僅半年之后,AI PC 就要迎來(lái)了一輪大幅度的升級(jí)。在之前關(guān)于 AMD 銳龍 AI 300 系列的報(bào)道中,雷科技就提到了 AMD 新款 AI PC 芯片在 NPU 算力的飛躍,以及高通、AMD 和英特爾之間的全新競(jìng)爭(zhēng)。而在高通、AMD 之后,英特爾終于也帶來(lái)了下一代筆記本電腦芯片。6 月 4 日,英特爾在臺(tái)北電腦展上展示了最新一代的 Lunar Lake 處理器,并計(jì)劃在秋 季正式出貨。坦白講,這個(gè)發(fā)布節(jié)奏對(duì)比 AMD 和高通顯然要「慢」上不少,首批搭載驍龍 X 系列芯片的 Windows 11 AI PC 很快就將在 618 上市,搭載 AMD 銳龍 AI 300 系列的 Windows 11 AI PC 也將從 7 月起陸續(xù)上市。俗話說(shuō)「好飯不怕晚」。但問(wèn)題是,英特爾的 Lunar Lake 會(huì)是一碗「好飯」嗎?英特爾已經(jīng)放言,Lunar Lake「絕對(duì)」超越高通同類產(chǎn)品(其實(shí)就是驍龍 X 系列芯片),然而就現(xiàn)在來(lái)說(shuō),我們肯定不會(huì)得到一個(gè)明確的答案。
但從目前公開和流出的信息來(lái)看,Lunar Lake 至少是值得期待的,不僅因?yàn)槿嫣嵘?nbsp;CPU、GPU、NPU 性能,也因?yàn)橛蒙狭伺_(tái)積電的先進(jìn)制造工藝以及自己的先進(jìn)封裝工藝。
甚至在 Lunar Lake 上,英特爾第一次將 LPDDR5X 內(nèi)存封裝在芯片之中,就像蘋果的統(tǒng)一內(nèi)存架構(gòu)一般。但這種設(shè)計(jì)能給 Lunar Lake 帶來(lái)什么變化和升級(jí)?Lunar Lake 又能給下一代 AI PC 帶來(lái)什么?這些都是英特爾要在幾個(gè)月后要正式回答的。
去年,英特爾宣稱酷睿 Ultra(Meteor Lake)處理器代表了該公司 40 年來(lái)最大的一次架構(gòu)轉(zhuǎn)變,但面對(duì) Arm 芯片的持續(xù)挑戰(zhàn),這種轉(zhuǎn)變顯然不會(huì)是一次性的。在 Lunar Lake 上,英特爾繼續(xù)采用了 SoC 的設(shè)計(jì),在一塊芯片中集成了 CPU、GPU、NPU 計(jì)算模塊。不同的是,Lunar Lake 沒(méi)有采用英特爾自己的芯片制造工藝,而是用上了臺(tái)積電 N3B 和臺(tái)積電 N6 兩種工藝來(lái)打造。在一定程度上,這是一種升級(jí),畢竟是用上了目前最先進(jìn)的臺(tái)積電 3nm 工藝。要指出的是,N3B 作為臺(tái)積電 3nm 的第一代工藝,在蘋果 A17 Pro 上并沒(méi)有帶來(lái)大幅的能效提升。不過(guò)對(duì)比英特爾的先進(jìn)工藝就另說(shuō)了,按照英特爾自己的說(shuō)法,Lunar Lake 的能效提升了約 30%。而在性能方面,Lunar lake 配備了全新的 CPU 和 GPU 架構(gòu),CPU 性能提升了約 20%,GPU 性能更是提升了 50%,尤其在 3DMark Time Spy 等基準(zhǔn)測(cè)試中提升更為明顯。
具體來(lái)說(shuō),新的 CPU 設(shè)計(jì)增強(qiáng)了分支預(yù)測(cè)、指令并行度和緩存帶寬,使得處理器在處理多任務(wù)和計(jì)算密集型任務(wù)時(shí)有更好的表現(xiàn)。原來(lái)酷睿 Ultra 采用的 3D 性能混合架構(gòu)也改了,英特爾在 Lunar Lake 上砍掉了 LP-E 核設(shè)計(jì),用上了新的 4x4 設(shè)計(jì),也就是說(shuō),Lunar Lake 現(xiàn)在配備了 4 個(gè) P 核、4 個(gè) E 核。同時(shí) Lunar Lake 上不支持超線程,意味著 Lunar Lake 的線程數(shù)量和核心數(shù)量一樣都是 8。按照英特爾的說(shuō)法,與之前的 LP-E 核相比,Lunar Lake 的 E 核(Skymont)在同性能下的功耗只有前者的三分之一,同功耗下的單線程和多線程性能則有前者 2 倍和 4 倍。另一邊,P 核(Lion Cove)的 IPC 提高了 14%。
此外,在 Windows 11「containment zones」的基礎(chǔ)上,Lunar Lake 可以通過(guò)線程指令使用異構(gòu)調(diào)度策略,將工作負(fù)載(比如 Copilot 助手等應(yīng)用)導(dǎo)向功耗更低的 E 核,來(lái)實(shí)現(xiàn)節(jié)省電量的目的;或者是導(dǎo)向性能更高的 P 核,實(shí)現(xiàn)更流暢地運(yùn)行。簡(jiǎn)單來(lái)說(shuō),現(xiàn)在 Lunar Lake 可以將特定任務(wù)細(xì)化到分配給不同策略的核心,做到更高匹配度和更高效率的運(yùn)行。GPU 方面,Lunar Lake 采用了下一代 Xe2 架構(gòu),不僅性能有了平均 50%的提升,而且和 Xe 架構(gòu)一樣具有高度的可擴(kuò)展性,即可以集成在低功耗的移動(dòng) SoC 上,也將用在稍晚即將推出的 Arc 顯卡上。同時(shí),GPU 還能提供高達(dá) 67TOPS 的 AI 算力。
AI PC 這個(gè)概念,可以說(shuō)最初就是英特爾主導(dǎo)的,隨后也被整個(gè) PC 行業(yè)所共同介紹。但公允地講,英特爾現(xiàn)售的 AI PC 芯片酷睿 Ultra 在很多方面難以支撐「AI PC」的概念,除了 Windows 系統(tǒng)沒(méi)有跟上之外,AI 算力也是基礎(chǔ)因素之一。好在,Lunar Lake 也迎來(lái)了一波 AI 性能大升級(jí)。英特爾宣稱,Lunar Lake 處理器的 NPU 達(dá)到了 48TOPS 的 AI 性能,相比酷睿 Ultra 上的 NPU 算力提升了四倍不止。作為對(duì)比,新一代筆記本電腦芯片中,驍龍 X 系列的 NPU 算力是 45TOPS,銳龍 AI 300 系列的 NPU 算力是 50TOPS。
爾此外,在異構(gòu)計(jì)算下,NPU 加上 CPU 的 5TOPS、GPU 的 67TOPS,Lunar Lake 處理器整體能夠提供高達(dá) 120TOPS 的算力。不過(guò)在小雷看來(lái),筆記本電腦受限于續(xù)航,異構(gòu)計(jì)算更多承擔(dān)的是臨時(shí)性的重負(fù)載 AI 任務(wù)。而要將生成式 AI 技術(shù)應(yīng)用到 PC 的基礎(chǔ)體驗(yàn)之中,則必須充分利用起低功耗高 AI 性能的 NPU。這其實(shí)也是微軟在下一代 Windows 11 AI PC 的標(biāo)準(zhǔn)中著重強(qiáng)調(diào) 40TOPS 以上算力的關(guān)鍵原因。所以從這個(gè)角度來(lái)看,就算是 NPU 我們也不能只看最高算力,還要看功耗表現(xiàn)。不過(guò),這一點(diǎn)還是要以后續(xù)的實(shí)際測(cè)試為準(zhǔn)。而除了算力,影響 AI 實(shí)際運(yùn)行表現(xiàn)的其實(shí)還有內(nèi)存。我們都知道,現(xiàn)在很多時(shí)候限制 AI 實(shí)際運(yùn)行表現(xiàn)的并非計(jì)算,而是傳輸,更直接地說(shuō)是內(nèi)存帶寬和延遲。當(dāng)然,往大了說(shuō),內(nèi)存的改進(jìn)也會(huì)影響 CPU 以及 GPU 的實(shí)際表現(xiàn),從而影響設(shè)備的整體性能。這可能也是為什么,英特爾選擇在 Lunar Lake 中直接封裝了內(nèi)存。
在主題演講上,當(dāng)英特爾 CEO 帕特·基辛格(Pat Gelsinger)手持展示 Lunar Lake 的時(shí)候,所有人都注意到了:Lunar Lake 還封裝了兩顆內(nèi)存。
作為英特爾首款采用封裝內(nèi)存的芯片,Lunar Lake 有 16GB 和 32GB(雙通道)LPDDR5X 兩種配置,單芯片運(yùn)行速度高達(dá) 8533MT/s。該內(nèi)存支持 16bx4 通道,與傳統(tǒng)的 PCB 嵌入式設(shè)計(jì)相比,PHY 功耗降低了 40%,面積節(jié)省了 250 平方毫米。在當(dāng)下,這種設(shè)計(jì)我們已經(jīng)不陌生了,比如消費(fèi)級(jí)中蘋果 M 系列芯片就采用了統(tǒng)一內(nèi)存架構(gòu),此外,英偉達(dá)的高端加速卡如 H100、B200 都是直接將內(nèi)存(包括 HBM)焊在 GPU 和 CPU 旁邊,封裝成一個(gè)芯片。這樣做的好處也非常明顯,首先是可以顯著提升數(shù)據(jù)傳輸速度和系統(tǒng)響應(yīng)時(shí)間。內(nèi)存與處理器之間的距離縮短,大大減少了數(shù)據(jù)傳輸?shù)难舆t,提升整體系統(tǒng)性能。這對(duì)于需要高帶寬和低延遲的應(yīng)用,例如圖形處理、AI 計(jì)算和高性能計(jì)算任務(wù),尤為重要。
其次是有助于降低功耗。同樣因?yàn)閭鬏斁嚯x縮短,也減少了數(shù)據(jù)傳輸過(guò)程中的能量損耗,同時(shí)配合更先進(jìn)的制造工藝,有助于延長(zhǎng)設(shè)備的續(xù)航,特別適用于移動(dòng)設(shè)備和筆記本電腦 。再有,在芯片里封裝內(nèi)存也可以簡(jiǎn)化主板布局,減少主板上的元件和連接。這不僅減少了生產(chǎn)成本,還提高了系統(tǒng)的可靠性。更緊湊的設(shè)計(jì)使得設(shè)備在重量和體積上有所減少,進(jìn)一步提升了便攜性。這對(duì)于超薄筆記本和移動(dòng)設(shè)備來(lái)說(shuō),同樣是一個(gè)重要的優(yōu)勢(shì)。
版權(quán)所有 ? 東莞市康納電子科技有限公司 技術(shù)支持: 商友科技