最近,國產CPU進入“收獲期”,先是華為高調發布鯤鵬920,兆芯發布了KX6000,然后是龍芯3A4000成功流片,最近飛騰發布了FT2000/4,加上海光的X86 CPU和申威的SW3232,國內各家CPU公司已經推出或即將推出各自的新產品。
由于國產CPU眾多,比較是再所難免的,鐵流簡單做一個盤點。由于各家CPU的核心數不一樣,有的64核,有的4核、8核,因而如果比多核性能就有一點不太公平,因而鐵流就以對用戶體驗影響最大的單核性能為標尺進行對比。本篇文章只談性能,至于技術路線和自主可控等不在盤點之列。
龍芯
龍芯最新一代的CPU是3A4000,這款處理器使用28nm工藝,是本文中盤點的處理器中,制造工藝最差的一款。雖然制造工藝相對落后,但3A4000的單核性能卻并不比其他幾家遜色。采用GCC編譯器,SPEC20006定點和浮點成績都在20左右(@2G主頻)。
近些年,龍芯專注于微結構的提升,在制造工藝上普遍落后于同時期其他國產CPU,比如2015年前后問世的龍芯3A2000,工藝為40nm,而在此時,國內同行CPU的工藝大多為28nm。2019年問世的龍芯3A4000,制造工藝為28nm,國內同行的工藝普遍為7/16nm。
在制造工藝落后國內同行1至2代的情況下,龍芯能夠把CPU性能做到同一檔次水平,實屬不易。從龍芯3B1500至龍芯3A4000,龍芯在制造工藝處于同一水平的情況下,通過自身設計能力,把CPU的性能翻了6倍,SPEC20006測試每G主頻性能達到10分,在微結構設計水平上是國內數一數二的存在。
這充分體現了龍芯的CPU設計能力,折射出能力建設和培養比引進國外技術更重要,與一些高度依賴臺積電先進工藝的廠商形成鮮明對比。
龍芯的桌面CPU做的非常不錯,但在服務器CPU上由于核數較少,暫時落后于國產X86和ARM CPU。由于3A/B4000多路性能提升較大,龍芯將主推4路服務器。
申威
SW由相關單位設計,在超算上非常成功,神威太湖之光曾經多次在TOP500上名列第一,即便現在依然位居第三。在超算上取得成功后,SW開始把服務器作為發力的方向,2019年會有SW3231問世,2020年SW3232會問世,比PPT上的規劃時間晚一年。
就單核性能來說,SW3232采用14/16nm工藝,并且有極大概率單核性能達到25分(SPECint2006),多核性能600+是起步水平,實際性能會明顯高于這個水平。
SW3232在單核與多核性能上著實不俗,申威用實踐證明,獨立自主與CPU高性能可以兼得,沒必要一定依附于X86和ARM,中國人自主定義指令集完全走的通。
飛騰
9月19日,飛騰發布了新一代桌面處理器FT-2000/4。
根據飛騰的官方介紹,FT-2000/4集成4個FTC663,16nm制程,主頻2.6至3.0GHz,最大功耗10W,單核1GHz下芯片功耗降為3.8W。在專業CPU性能測試軟件SPEC2006中,FT-2000/4全芯片實測整數計算得分61.1,浮點計算得分62.5,相比飛騰上一代桌面CPUFT-1500A/4提升近1倍,訪存帶寬提升3倍。
就單核性能來說,從FT1500A到FT2000,再到FT2000plus性能提升有限,因而無法判斷FTC663相對于FTC662有多大的提升。根據測試成績來看,FT2000的單核性能(定點)為12+(飛騰的PPT也有13分的),假設FT-2000/4與FT2000同主頻性能處于同一水平,那么,2.6G至3G主頻的FT-2000/4單核性能大約為16.5至19。
據悉,FT-2000/4在主頻2.6GHZ下,單核定點16到17之間,多核整數55到57之間。
從定點成績看,飛騰的FTC662和FTC663在同主頻性能上差距微乎其微,基本上FTC663可以視為FTC662的“微小改動版”。
因此,FT-2000/4單核性能最好成績(@3G主頻)應該是18+,接近19分,或19出頭一點,但到不了20分。
兆芯
兆芯最新的KX6000,把主頻做到2.7G至3.0G。根據兆芯公布的PPT,SPECint2006有29分(ICC編譯器),如果采用GCC編譯器的話,成績要打一個折扣,3G主頻下估計20+的成績應該還是有的。KX6000的單核性能基本達到了老一代AMD處理器(推土機、挖掘機)的水平。
海光
海光是AMD和曙光成立的合資公司,一直非常低調。海光站在AMD的肩膀上,消化吸收AMD的技術,加入了自研技術和安全機制,其CPU性能目前在國產CPU中應是最強的,也是生態兼容性、通用性最好的,具備很強的市場競爭力。這一點從AMD市場份額大幅提升,股價在過去幾年上漲800%就能體現出來。海光CPU的單核性能估算可達到35以上。
華為
最近,華為非常高調的再次亮相鯤鵬系列處理器。根據華為官方的PPT,鯤鵬920的多核性能非常強悍,搞到900+分。不過,華為沒有公布鯤鵬920的單核性能,從華為的PPT上48核戰平英特爾28核的情況看(主頻相差不大的情況下),單核性能和微結構設計上與英特爾還是存在明顯差距的。鯤鵬920在國產CPU中的優勢有2個,一是核心數眾多,高達64個核心,而目前國產CPU中核心數達到64個的只有飛騰。第二個是采用7nm工藝,在工藝上領先其他國產CPU。
CPU單核性能匯總
上圖中有英特爾,并非指英特爾是國產CPU,而只是用于參照。
從上圖可以看出,國產CPU單核性能基本都達到了20分這道坎,而這個成績是AMD老一代處理器(推土機、挖掘機)的性能水平。可以說,國產CPU的進步是顯而易見的。
在看到成績的同時,也要看到差距。就單核性能來說,目前英特爾主流CPU普遍在40分以上,英特爾4G主頻的CPU單核性能超過50分,追趕之路任重道遠。
就性能來說,單核性能最強的是海光,多核性能最強的應該是華為。
申威3232的單核性能和多核性能都很不錯,不知是否受E級超算任務的影響,分散了精力,導致SW3232進度延期。鐵流非常期待申威E級超算和SW3232。
另外,提一個潛力股,龍芯3A4000。龍芯3A4000的潛力還有待挖掘,因為從圖表中看出,龍芯3A4000是唯一一款依然采用28nm工藝的CPU。龍芯3A4000的微結構非常不錯,即便CPU核不變或小改,直接換工藝,比如采用更先進的7nm工藝或16nm工藝,CPU的主頻和性能都有望得到大幅增長。
據小道消息,3A5000將采用12/14/16nm工藝,并小改CPU核,單核成績有望達到25至27分。如果將來采用7nm工藝,單核性能有望突破30分。參照龍芯3A2000到3A3000的研發進度,3A5000有望在2020年上半年流片。屆時,龍芯又能獲得一次性能提升。
總的來說,國產CPU進步明顯,海光單核性能最強,華為多核最強,龍芯潛力很大,SPEC20006測試每G主頻性能達到10分,在微結構設計水平上是國內數一數二的存在,其自主研發能力獲得實踐證實。申威3232雖然跳票,但性能值得期待。
「 支持烏有之鄉!」
您的打賞將用于網站日常運行與維護。
幫助我們辦好網站,宣傳紅色文化!
歡迎掃描下方二維碼,訂閱烏有之鄉網刊微信公眾號
