五月天成人小说,中文字幕亚洲欧美专区,久久妇女,亚洲伊人久久大香线蕉综合,日日碰狠狠添天天爽超碰97

AMD四代霄龍曝光,未來處理器會如何設計?

關注
在高性能計算領域,人們很早就用多處理器來提升性能,在操作系統(tǒng)和軟件層面完成了對多線程處理的優(yōu)化。

圖源:圖蟲

編者按:本文來自微信公眾號DoNews(ID: ilovedonews),作者maomaobear,創(chuàng)業(yè)邦經授權轉載。

按照計劃,AMD將在這個月正式發(fā)布代號“Milan”(米蘭)的第三代霄龍7003系列數據中心處理器。

這款處理器基于7nm工藝、Zen3架構,最多64核心128線程,支持八通道DDR4-3200內存、128條PCIe 4.0通道。

而在第三代產品還沒有正式發(fā)布的時候,已經有推特博主已經了曝光了AMD第四代霄龍的核心規(guī)格:

AMD第四代霄龍的核心數量最多96個,線程數量最多196個,比現(xiàn)在增加整整50%,內部仍是chiplet小芯片結構,每顆8核心,總計12顆,另外繼續(xù)一顆IO芯片。內存方面,第四代霄龍支持新一代DDR5,最高頻率達5200MHz,通道數也增加一半的達到12個。功耗設計最高320W,比現(xiàn)在增加40W,同時支持最高上調到400W(cTDP)。

接口首次更換為新的SP5 LGA6096,比現(xiàn)在的SP3 LGA4094增加多達2002個觸點。

可以看出,未來的處理器核心越來越多,帶寬通道越來越高。但是單個芯片的規(guī)格卻沒有增加。

處理器從單核心到多核心,到眾核,再到chiplet小芯片結構,完成了一輪輪進化。那么未來處理器會如何設計呢?我們來看一下。

單核頻率的極限

計算機最早出現(xiàn),是用于軍事用途的科學計算,用來破解密碼,計算彈道,做的是單純的計算任務。相當于一個大型的快速計算器。

后來,雖然計算速度越來越快,人們發(fā)現(xiàn)計算能力,可以應用于商業(yè)辦公的字處理和信息管理,于是有了字處理軟件和數據庫軟件,為了運行這些軟件,方便開發(fā)(否則計算機得從底層一步步開發(fā)一個軟件做字處理或者信息管理),就有了操作系統(tǒng)。

同時,計算機硬件也逐步進化,從分開的獨立元件,進化成了一個超大規(guī)模集成電路,也就是我們所熟悉的CPU。古老的計算機是沒有CPU的,是一大堆電子元件來完成今天CPU的功能。后來集成電路發(fā)展,有了封裝技術,才有我們看到的芯片。

最初的CPU都是單核心的。后來為了提高性能,搞多路并行,一開始是把一大堆單核心的大型計算機放到一起聯(lián)網運行。

后來,人們發(fā)明了多處理器的主板,在一塊電路板上放置多個CPU,在主板上實現(xiàn)互聯(lián)。

早期,處理器的進化方向是提高頻率,改善微架構。在摩爾定律下,這條道路最初很順利。處理器從早期的1MHZ,8MHZ很快就提升到66MHZ、100MHZ。

而此時計算機的用途越來越廣,操作系統(tǒng)、應用軟件、網絡的出現(xiàn),讓計算機迅速從科學計算、字處理、信息管理擴展到人類社會的各個層面。計算機字處理軟件替代紙筆、打字機,表格軟件替代手工制表,財務軟件替代手工記賬,數據庫系統(tǒng)替代紙質檔案……

需求的指數級別增長,刺激技術快速發(fā)展,CPU從100MHZ到1Ghz只用了幾年。到了2Ghz也非???。

但是,很快頻率提升就遇到瓶頸,4Ghz再往上就功率越來越大,提升越來越難。提升單核頻率的路線到頭了。

100MHZ到1Ghz只用了幾年,而1Ghz到10Ghz至今看不到希望,如見最快的處理器就是官方睿頻5Ghz多一點,20年前奔騰4超頻記錄是7Ghz,單核頻率提升到頭了。

從多核心到眾核

在高性能計算領域,人們很早就用多處理器來提升性能,在操作系統(tǒng)和軟件層面完成了對多線程處理的優(yōu)化。

所以,在單核心頻率觸摸到天花板之后,處理器開始了多核心的進化。處理器搞多核心,比主板上搞多處理器更好,因為片內通訊比主板上多個處理器之間通信更快,延遲更低。

所以,很快CPU,就從單核發(fā)展到雙核、四核、八核。在進化道路上,英特爾一度參考GPU的并行計算搞過眾核,把幾十個性能弱一些的小核心堆到一起來提升性能。在核心之間建立一套高速的網絡連接,達到強大的總體性能。

但是,這種模式的應用范圍很窄,僅限于能大規(guī)模并行的科學計算,AI計算,普通服務需要強大的單核心性能,這種小核心提供不了。

而真正需要大規(guī)??茖W計算和AI計算,人們會購買更便宜,小核心更多,計算能力更強的GPU去算。

這種眾核就變成了積累,搞大規(guī)模并行不如GPU性價比高,搞傳統(tǒng)的服務器計算,單核心性能太弱小。

最后,英特爾停掉了眾核的產品線,把技術用到大核心的堆疊上面,這就是英特爾28核心的至強處理器。

雖然,比并行計算比不了GPU,是做傳統(tǒng)的服務器運算,28核心還是很強大的。

chiplet小芯片的挑戰(zhàn)

理論上,多個核心堆到一塊芯片里面,各個核心的互聯(lián)最快,性能最好。但是多個核心堆到一個芯片里面,會大大增加芯片的面積。

而芯片的面積與良率和成本密切相關,越大的芯片,造起來越困難。因為一塊晶圓上的瑕疵是隨機分布的,單個芯片越大,中招的概率越大,合格的芯片越少。所以,大芯片的價格遠遠高于小芯片。

AMD對于多核心的解決辦法是chiplet小芯片,一塊芯片上就放8個核心(Zen2是4個核心),需要多核心,我就把多塊小芯片封裝到一個基板上面,有些模塊不需要7nm工藝,用14nm便宜的工藝做,也封裝到一起。

在基板上面封裝,通信速度不如芯片內,但是比在主板上要好很多。而單CPU主板,比多CPU主板要便宜很多,這種中庸的解決方案,性能適中,價格卻要便宜得多。

英特爾做高性能的28核心處理器,得專門設計一個28核心的架構,測試流片,成本極高。

而AMD用小芯片,理論性能弱一點,但是從筆記本電腦到PC到服務器,只要測試生產一種核心就夠了。高端產品只要封裝多個核心,也有高性能,價格就便宜多了。

英特爾一看,當然也就學乖了,它在今年底發(fā)布代號Sapphire Rapids的第四代可擴展至強,用10nm Enhanced SuperFin制造工藝,Golden Cove CPU架構,也是MCM多芯封裝,最多4顆小芯片、60核心120線程(64核心,屏蔽4個,提升良率),集成最多64GB HBM2e高帶寬內存,支持最多8通道DDR5-4800、80條PCIe 5.0,熱設計功耗最高400W,接口換成新的LGA4677-X。

所以,未來一段時間,我們看到的高性能處理器,都會走chiplet小芯片技術,在基板上堆小芯片,甚至把內存也堆上去,提升性能,降低成本。

本文(含圖片)為合作媒體授權創(chuàng)業(yè)邦轉載,不代表創(chuàng)業(yè)邦立場,轉載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。

反饋
聯(lián)系我們
推薦訂閱