龍芯3D5000研發(fā)成功,能和AMD扳手腕嗎?
事實(shí)上,這個(gè)也在大家的意料之中,因?yàn)樽?020年9月15日后,華為麒麟芯片就成為了絕唱,沒(méi)有代工廠了,只能靠庫(kù)存撐著,自然有用光的一天。
有人表示,華為苦等兩年,沒(méi)有等來(lái)解封,也沒(méi)有等來(lái)突破封鎖的“奇跡”,真是可惜。
確實(shí)從現(xiàn)在的情況來(lái)看,雖然“奇跡”沒(méi)有等來(lái),等眾多企業(yè)的努力,還是沒(méi)有白費(fèi),這些企業(yè)的努力,或深遠(yuǎn)的影響著未來(lái)全球芯片的格局。
華為海思提出的芯片堆疊技術(shù),現(xiàn)在來(lái)看,暫時(shí)沒(méi)有成為華為突破芯片封鎖的技術(shù),但通過(guò)一些企業(yè)的驗(yàn)證,未來(lái)還是有希望的。
比如龍芯,近日就給華為打了個(gè)樣,用兩顆相對(duì)工藝不那么先進(jìn)的芯片,封裝在一起,使得性能翻倍了。龍芯這顆芯片叫做3D5000,是通過(guò)兩顆3C5000芯片,封測(cè)在一起而實(shí)現(xiàn)的。
3C5000芯片,采用12nm工藝,內(nèi)部集成 16 個(gè)高性能的龍芯 LA 464 核心,單芯片雙精度浮點(diǎn)峰值運(yùn)算速度超過(guò) 0.5TFLOPS。
而將兩顆3C5000芯片封裝在一起后,變成了內(nèi)部集成32個(gè)高性能核心了,變成了32核,而多核性能上,相比于3C5000,性能直接翻倍。
3D5000性能戰(zhàn)Zen2?
此次龍芯發(fā)布的3D5000與去年發(fā)布的3C5000同屬一個(gè)系列,實(shí)質(zhì)上就是將兩顆3C5000核心封裝在一起,通過(guò)特殊的連接協(xié)議使其成為一顆單獨(dú)的處理器,類似的設(shè)計(jì)思路在半導(dǎo)體行業(yè)中并不少見,一般會(huì)被網(wǎng)友稱之為“膠水核”。
雖然這種設(shè)計(jì)方式看起來(lái)簡(jiǎn)單且粗暴,但是設(shè)計(jì)合理,那么就可以輕松提升單顆處理器的性能上限。當(dāng)然,缺點(diǎn)也是明顯的,一方面是雙核封裝會(huì)帶來(lái)功耗的飆升,另一方面則是封裝體積過(guò)大,不適用于普通民用市場(chǎng)。
所以,3D5000與3C5000的定位不同,將主要面向服務(wù)器市場(chǎng),不會(huì)在消費(fèi)級(jí)市場(chǎng)發(fā)售。作為基礎(chǔ)核心的3C5000,性能并不弱,早前小雷也專門進(jìn)行過(guò)一次報(bào)道,3C5000采用16核心設(shè)計(jì),主頻為2.0GHz-2.2GHz,unixbench分?jǐn)?shù)達(dá)到95000分以上,雙精度計(jì)算能力可達(dá)560GFlops,峰值性能與典型ARM 64核處理器相當(dāng)。
那么封裝了兩個(gè)3C5000的性能又如何呢?從官方給出的參數(shù)來(lái)看,3D5000采用32核設(shè)計(jì),集成64MB L3緩存,支持最多8個(gè)DDR4-3200 DRAM,同時(shí)支持HyperTransport接口,最多可以支持四路處理器互聯(lián),單主板最高可以提供128核的運(yùn)算支持。
另外,從目前的測(cè)試結(jié)果來(lái)看,單就IPC性能而言基本上是持平了同主頻且核心數(shù)相同的Zen2 EPIC處理器,但是對(duì)于Zen2 EPIC處理器而言,3D5000的最高2.2GHz僅僅是勉強(qiáng)摸到了同核心數(shù)處理器的下限,比如EPYC 7452的基準(zhǔn)頻率就達(dá)2.35GHz,加速頻率可達(dá)3.35GHz。
或許看完數(shù)據(jù)對(duì)比,大家會(huì)對(duì)龍芯的性能感到悲觀,但是從產(chǎn)業(yè)發(fā)展角度來(lái)說(shuō),其實(shí)已經(jīng)是一個(gè)很大的進(jìn)步,而且3C5000與Zen2系列處理器使用的制程工藝并非一個(gè)世代的,前者為12nm工藝,后者則是7nm工藝,架構(gòu)+主頻的差距,使得3C5000主頻表現(xiàn)疲弱,而這并不是無(wú)法解決的。
3D5000能否撐起國(guó)產(chǎn)服務(wù)器需求?
在實(shí)測(cè)性能方面,官方給出了單路和雙路的SPEC CPU2006 Base測(cè)試結(jié)果,在實(shí)測(cè)中單路得分超過(guò)400,雙路得分超過(guò)800,在完整的四路配置下,預(yù)計(jì)SPEC CPU2006 Base分?jǐn)?shù)可以達(dá)到1600分,基本上與英特爾的至強(qiáng)E5 2699 V4性能持平。
從目前的性能來(lái)看,3D5000已經(jīng)可以取代部分英特爾的至強(qiáng)處理器,活躍在一些服務(wù)器和軟件部署場(chǎng)景之中。當(dāng)然,理智上講,兩者的區(qū)別依然巨大,但是至強(qiáng)系列本就是世界領(lǐng)先的服務(wù)器處理器,E5-2699 V4作為一款2016年推出的中高端產(chǎn)品,其性能還是頗為可觀的。
當(dāng)然,如果對(duì)比最近兩年發(fā)布的處理器,那么不管是3D5000還是E5-2699 V4都相形見絀,自從在架構(gòu)上取得突破后,英特爾和AMD的新一代處理器性能就以前所未有的速度向前狂奔,幾乎淘汰了2019年之前的所有處理器。
即使是在服務(wù)器領(lǐng)域,新架構(gòu)的服務(wù)器處理器在核心數(shù)、主頻和IPC性能等方面都有著恐怖的提升。以AMD在2019年針對(duì)個(gè)人服務(wù)器市場(chǎng)推出的線程撕裂者3960X為例,在多核性能上已經(jīng)被英特爾在2022年發(fā)布的i9-13900K擊敗,而后者只是一顆面向個(gè)人消費(fèi)市場(chǎng)的處理器。
迅猛發(fā)展的處理器性能正在加速甩開其他競(jìng)爭(zhēng)對(duì)手,但就目前的發(fā)展趨勢(shì)來(lái)看,國(guó)產(chǎn)處理器想要完全取代英特爾和AMD是不可能的,至少在超大型服務(wù)器和個(gè)人工作站領(lǐng)域,英特爾和AMD仍然是目前國(guó)內(nèi)大多數(shù)公司和用戶的最好的選擇。
那么3D5000就沒(méi)有意義了?當(dāng)然不是,作為一顆服務(wù)器處理器,其性能已經(jīng)足夠應(yīng)付一般的信創(chuàng)服務(wù)器部署需要,在一些關(guān)鍵場(chǎng)所和機(jī)要部門,可以完全杜絕海外硬件的使用,帶來(lái)更高的安全性能。
此外,龍芯的產(chǎn)品計(jì)劃中,3C6000將會(huì)達(dá)到更高的IPC性能和主頻,甚至可以真正匹敵Zen2架構(gòu)的AMD EPIC處理器,想要做到這點(diǎn),意味著3C6000的主頻至少需要提高到2.5GHz,對(duì)于龍芯來(lái)說(shuō)是一個(gè)艱難的任務(wù)。
而在更久遠(yuǎn)的7000系列處理器規(guī)劃中,龍芯希望可以借助7nm工藝將處理器的IPC性能推進(jìn)到Zen3和12代酷睿處理器的水平。雖然從現(xiàn)在看來(lái)八字還沒(méi)一撇,但是已經(jīng)初步驗(yàn)證了架構(gòu)的可行性,只要相關(guān)制程工藝跟上就有機(jī)會(huì)實(shí)現(xiàn)這個(gè)目標(biāo)。
在龍芯的計(jì)劃中,7000系列將會(huì)提供單個(gè)24-32核的3D7000和48-64核的3E7000,后者或?qū)⒂蓛深w3D7000組合而成,屆時(shí)性能或許將可以持平國(guó)外主流服務(wù)器處理,使得中低端服務(wù)器的搭建不再依賴于國(guó)外產(chǎn)品。
不過(guò),即使在硬件性能方面追上英特爾和AMD,對(duì)于龍芯來(lái)說(shuō)還有許多問(wèn)題需要解決。首先,龍芯使用的并非x86架構(gòu),而是一個(gè)全新的自研處理器架構(gòu),意味著大量的主流專業(yè)軟件都將無(wú)法正常運(yùn)行在龍芯的處理器環(huán)境中。
在服務(wù)器等專業(yè)領(lǐng)域,失去了專業(yè)軟件的支持基本上就失去了主流市場(chǎng),這也是ARM處理器即使在能效比等方面表現(xiàn)出色,依然無(wú)法搶占x86市場(chǎng)的原因,許多專業(yè)軟件都僅僅針對(duì)x86架構(gòu)做了優(yōu)化,如果想通過(guò)編譯等方式使其運(yùn)行在新環(huán)境下,會(huì)面對(duì)性能損失、穩(wěn)定性下降等問(wèn)題。
如果龍芯想要進(jìn)入商用服務(wù)器市場(chǎng),那么在軟件生態(tài)適配方面也要下功夫,單顆硬件性能是無(wú)法站穩(wěn)商用市場(chǎng)的。當(dāng)然,我知道現(xiàn)在談龍芯的商用發(fā)展還為時(shí)尚早,龍芯目前更多的是服務(wù)于政府等對(duì)國(guó)產(chǎn)化要求高的行業(yè)和領(lǐng)域,對(duì)于商業(yè)公司來(lái)說(shuō)沒(méi)有必要也不需要采購(gòu)龍芯來(lái)設(shè)計(jì)部署服務(wù)器。
而且,龍芯也在推進(jìn)軟件生態(tài)的發(fā)展,比如通過(guò)二進(jìn)制編譯器來(lái)翻譯兼容x86生態(tài)中的軟件,與國(guó)產(chǎn)系統(tǒng)合作,推動(dòng)系統(tǒng)和軟件的適配等,隨著使用者的增加,相信在未來(lái)可以構(gòu)建出屬于自己的架構(gòu)生態(tài)。
目前,ARM是全球第一大芯片IP授權(quán)服務(wù)商,在移動(dòng)CPU市場(chǎng)占比超90%的企業(yè),中國(guó)芯片設(shè)計(jì)公司大多采用ARM架構(gòu),來(lái)設(shè)計(jì)手機(jī)和服務(wù)器芯片。然而因?yàn)橹袊?guó)芯片的發(fā)展速度太快,美國(guó)還是坐不住了,再次玩起了限制的把戲。
而龍芯最大的優(yōu)勢(shì)在于,擁有自主知識(shí)產(chǎn)權(quán)的架構(gòu),不受任何外力限制,而且100%安全。
相比于消費(fèi)級(jí)CPU,服務(wù)器CPU更為重要,它被廣泛的用于數(shù)據(jù)中心、云計(jì)算中心等場(chǎng)景,這里存儲(chǔ)著大量與國(guó)家、民生、經(jīng)濟(jì)等方面的數(shù)據(jù),事關(guān)信息安全問(wèn)題。
所以可以預(yù)見,數(shù)據(jù)中心的國(guó)產(chǎn)化替代,將會(huì)迎來(lái)提速,取代主流的X86架構(gòu)、ARM架構(gòu)的服務(wù)器產(chǎn)品,已經(jīng)勢(shì)在必行,龍芯也將獲得巨大的發(fā)展空間。
總之,有了龍芯,我們已經(jīng)有了十足的底氣面對(duì)各個(gè)方面的壓力。所以也讓我們一起祝福龍芯,在2023年能夠有更好的發(fā)展,為國(guó)家的信息安全,繼續(xù)做出更多的貢獻(xiàn),加油。
