「來源: |EETOP ID:eetop-1」
20年來,經(jīng)過無數(shù)人的奮斗,今天基于國產(chǎn)龍芯CPU的自主信息產(chǎn)業(yè)體系正在逐步形成。
胡偉武表示,龍芯CPU在迭代中發(fā)展,經(jīng)過20年的發(fā)展,從第一代的基本可用(小學畢業(yè))到第二代可用(中學畢業(yè)),第三代產(chǎn)品將實現(xiàn)好用(大學畢業(yè)),主CPU和OS(操作系統(tǒng))基本完成“補課”,CPU通用處理性能已逼近市場主流水平,操作系統(tǒng)成熟度也已接近Windows XP。
談到技術(shù)方面,胡偉武指出,通過在市場中試錯,龍芯意識到我國CPU與國外CPU的主要差距在于通用處理性能,而不是專用處理性能;同時,單核性能不足,僅僅疊加核數(shù)并不能解決問題;設(shè)計能力不足,不能僅僅依賴工藝。因此,龍芯希望通過優(yōu)化設(shè)計提高單核通用處理性能。
值此龍芯20周年,芯思想精心梳理龍芯家族產(chǎn)品,特別推出龍芯族譜篇,以作紀念(有部分芯片因各種原因,未列示)。
龍芯誕生
2001年8月19日,設(shè)計與驗證系統(tǒng)成功啟動Linux操作系統(tǒng)。因此,8月19日被確定為龍芯的生日。
龍芯一號“XIA50”
2002年8月10日,首款單核32位通用CPU龍芯一號流片成功。為了紀念夏培肅院士從事計算機事業(yè)50周年,龍芯一號的代號為“XIA50”。
龍芯一號(Godson-1A)采用類MIPS 的RISC指令集,具有七級動態(tài)流水線、32位整數(shù)單元和64位浮點單元。主頻可達266MHz,整體的性能低于Intel Pentium II。
龍芯一號(Godson-1A)采用0.18微米CMOS工藝進行流片,集成400萬晶體管,采用QFP封裝。
注:夏培肅(1923.7.28—2014.8.27)被譽為“中國計算機之母”,1951年從美國回來,一生致力國家計算機事業(yè),1991年當選為中國科學院院士,是龍芯CPU的功臣李國杰院士、唐志敏研究員、胡偉武研究員的導師。
▲龍芯1(XIA50)▲
2002年9月28日龍芯一號(Godson-1A)正式發(fā)布。時任中國科學院計算技術(shù)研究所所長李國杰院士在稱贊時,引用《易經(jīng)》中的話:萬物生于有,有生于無。
龍芯一號(Godson-1A)完成后,龍芯課題組投入了龍芯二號(Godson-2)的研發(fā)。
龍芯2A
2003年龍芯2A(Godson-2A)因為寄存器堆設(shè)計問題流片失敗。
2003年3月部署“龍芯2A(Godson-2A)”九個端口的寄存器堆的全定制設(shè)計;5月“龍芯2A(Godson-2A)”的物理設(shè)計正式展開;6月完成FPGA驗證平臺建設(shè),7月14日“龍芯2A(Godson-2A)”的第一個設(shè)計完成tapeout。
龍芯2B“MZD110”
2003年10月17日,首款單核64位通用CPU龍芯2B(Godson-2B)流片成功,和龍芯2A同期研發(fā)。為了紀念毛主席誕辰110周年,龍芯2B的代號為“MZD110”。
龍芯2B(Godson-2B)采用境內(nèi)0.18微米工藝進行流片,集成1000萬晶體管,最高頻率為300MHz,7-10級流水線,功耗1W-2W。相同主頻下,性能是龍芯1號的3至5倍,已經(jīng)超過了英特爾Pentium II。
▲龍芯2B(MZD110)▲
2003年3月部署“狗剩2號”九個端口的寄存器堆的全定制設(shè)計;5月“狗剩2號”的物理設(shè)計正式展開;6月完成FPGA驗證平臺建設(shè);8月13日“狗剩2號”的第二個設(shè)計完成tapeout。
龍芯2C“DXP100”
2004年9月28日,龍芯2C(Godson-2C)流片成功。為了紀念鄧小平誕辰100年,龍芯2C的代號為“DXP100”。
龍芯2C芯片主頻為450MHz,其單精度峰值浮點運算速度為每秒20億次,雙精度浮點運算速度為每秒10億次,64+64k一級緩存。龍芯2C的性能是龍芯2B的3倍,達到了相同主頻的英特爾Pentium III的性能。
龍芯2C采用0.18微米工藝,集成1350萬晶體管。
▲龍芯2C(DXP-100)▲
在龍芯2C上,印有中科院計算所的“ICT”標識
龍芯2D
有關(guān)龍芯2D的信息很少。
2005年12月龍芯2D完成流片,采用0.13微米工藝,加入片內(nèi)512k二級緩存,主頻600-800MHz,改版后,主頻可達800-1000MHz,性能是龍芯2C的五倍。
龍芯2E“CZ70”
2006年3月18日,龍芯2E流片成功。為了紀念長征勝利70周年,龍芯2E的代號為“CZ70”。
龍芯2E主頻最高可以達到1GHz,兼容MIPS64,具有128KB一級緩存、512KB二級緩存,單精度峰值浮點運算速度為80億次/秒,雙精度浮點運算速度為40億次/秒。
龍芯2E是我國首款采用90納米工藝制造的處理器,芯片面積6.8mm×5.2mm,集成4700萬晶體管,采用HSBGA452封裝。
2006年9月13日,龍芯2E通過科技部組織的驗收。
龍芯2E在包括政府辦公、數(shù)字電視、農(nóng)村信息化、工業(yè)控制等領(lǐng)域展開了試點應(yīng)用,但由于龍芯2E的北橋使用FPGA實現(xiàn),成本較高,最終沒有大規(guī)模量產(chǎn)。
意法半導體參與協(xié)助了龍芯2E的流片,所以龍芯2E處理器上同時印有“ST”和“ICT”的標識。
據(jù)當時的報道稱,基于龍芯2E的成功,意法半導體還花費三百多萬美元授權(quán)費購買了龍芯2E的生產(chǎn)和銷售授權(quán),開創(chuàng)了我國計算機核心技術(shù)對外授權(quán)的先例。
▲龍芯2E▲
2007年8月7日,曙光公司舉行了主題為“中國芯,更安全”的產(chǎn)品發(fā)布會,推出了首款基于龍芯2E處理器的網(wǎng)絡(luò)安全產(chǎn)品-“曙光100L防火墻”。
龍芯內(nèi)核
經(jīng)過多年積累,龍芯CPU形成了GS132、GS232和GS464三大系列處理器核。龍芯GS132及GS232系列CPU核對標ARM中低端系列,GS464系列核對標Intel桌面、服務(wù)器系列。
GS132為單發(fā)射32位結(jié)構(gòu),采用靜態(tài)流水線。其1.0版本(GS132)為三級靜態(tài)流水結(jié)構(gòu),在龍芯1D中使用。其2.0版本(GS132E)為五級靜態(tài)流水結(jié)構(gòu),GS132R用于龍芯1C101處理器。
GS232為雙發(fā)射32/64位結(jié)構(gòu),采用動態(tài)流水線。其1.0版本(GS232)為五級動態(tài)流水線結(jié)構(gòu),只有32位版本,在龍芯1A、1B、1C中使用。其2.0版本為動態(tài)流水線結(jié)構(gòu),有32位(GS232E)和64位版本(GS264),在龍芯2K中使用。
GS464為四發(fā)射64位結(jié)構(gòu),采用動態(tài)流水線。其1.0版本(GS464)為9級流水線結(jié)構(gòu),在龍芯3A、3B、2H中使用。其2.0版本(GS464E)為12級動態(tài)流水線結(jié)構(gòu),在龍芯3A2000、龍芯3B2000、龍芯3A3000、龍芯3B3000等CPU中使用;GS464E的優(yōu)化版GS464V在龍芯3A4000、龍芯3B4000中應(yīng)用,GS464V的LoongArch自主指令系統(tǒng)版本(LA464)在龍芯3A5000、龍芯3C5000等CPU中使用。
GS464E微結(jié)構(gòu)框架圖(紅色方框部分為亂序執(zhí)行引擎)
龍芯曾經(jīng)一度準備砍掉GS132核,重點研發(fā)GS232和GS464處理器核。但經(jīng)過市場調(diào)研,還是繼續(xù)了GS132處理器核的研發(fā),并基于此核開發(fā)了一系列的專用處理器。
龍芯指令集架構(gòu)
2021年4月15日龍芯發(fā)布完全的指令集架構(gòu)LoongArch,寫下了國產(chǎn)CPU發(fā)展史上具有歷史性意義的一筆。
LoongArch是全新的指令集,包含基礎(chǔ)指令 337 條、虛擬機擴展 10 條、二進制翻譯擴展 176 條、128 位向量擴展 1024 條、256 們向量擴展 1018 條,共計 2565 條原生指令。
龍芯中科產(chǎn)品族譜
龍芯中科的處理器按照其為結(jié)構(gòu),分為四類,分別是單發(fā)射32位(132),雙發(fā)射32位(232),四發(fā)射64位(464)以及雙發(fā)射64位(264)。按照處理器的性能、核數(shù)等分為龍芯1號小CPU,龍芯2號中CPU以及龍芯3號大CPU。
“龍芯3號”系列芯片,面向個人計算機與服務(wù)器類應(yīng)用。
“龍芯2號”系列芯片,面向工業(yè)控制和終端類應(yīng)用。
“龍芯1號”系列芯片,面向嵌入式專門應(yīng)用。
龍芯1號家族
真正的龍芯1號家族成員都是在龍芯中科成立之后,經(jīng)過市場調(diào)研開發(fā)的專用芯片。
龍芯1家族處理器可以大致分為兩類,一類是單發(fā)射的32位CPU,采用單發(fā)射順序執(zhí)行的GS132系列處理器核,主頻在10MHz左右,主要當作單片機使用;一類是雙發(fā)射的32位CPU,采用雙發(fā)射亂序執(zhí)行的GS232系列處理器核,主頻在1GHz以內(nèi),用做更高性能的嵌入式處理器,可以替代同等主頻的ARM處理器。
龍芯1A
2012年推出的龍芯1A是一款面向嵌入式市場的處理器。
龍芯1A芯片主頻266MHz,基于GS232處理器核,具有一級指令緩存16KB和一級數(shù)據(jù)緩存16KB。
龍芯1A采用0.13微米工藝制造、WBBGA448封裝,封裝尺寸23mm×23mm,功耗小于1W。
龍芯1A可以被配置為具有PCI接口的全功能南橋芯片。
▲龍芯1A▲
龍芯1B0200
2011年推出的龍芯1B是一款面向嵌入式市場的處理器。龍芯1B可以被視為是龍芯1A的簡化版,是龍芯在嵌入式處理器研發(fā)上繼續(xù)做減法的產(chǎn)物,以降低芯片的成本。
龍芯1B主頻200MHz,基于GS232處理器核,5級流水線,具有一級指令緩存8KB和一級數(shù)據(jù)緩存8KB。
龍芯1B采用0.13微米工藝制造,采用WBBGA256封裝,封裝尺寸17mm×17mm,功耗小于0.5W。
▲龍芯1B0200▲
2018年5月10日,安控科技與龍芯中科共同發(fā)布了基于龍芯1B處理器開發(fā)的國產(chǎn)化RTU產(chǎn)品。表明我國完全有能力在工控領(lǐng)域逐步完成從芯片到軟件的整體自主化替代,保障工業(yè)信息安全不再受制于人。
龍芯1C300“XPS90”
2012年推出的龍芯1C300可應(yīng)用于工業(yè)控制及物聯(lián)網(wǎng)等領(lǐng)域。為了紀念夏培肅院士90歲壽辰,龍芯1C300的代號為“XPS90”。
龍芯1C300主頻240MHz,基于GS232處理器核,5級流水線,具有一級指令緩存16KB和一級數(shù)據(jù)緩存16KB。
龍芯1C300采用0.13微米工藝制造,采用QFP176封裝,封裝尺寸20mm×20mm,功耗小于0.5W;還可以采用QFP100封裝。
▲龍芯1C300▲
龍芯1C101
龍芯1C101是針對門鎖應(yīng)用而優(yōu)化設(shè)計的單片機芯片。
龍芯1C101主頻8MHz,基于GS132R處理器核,集成Flash、SPI、UART、I2C、RTC、TSENSOR、VPWN、ADC等功能模塊,在滿足低功耗要求的同時,可以大幅減少板級成本。
龍芯1C101采用0.13微米工藝制造,采用QFP64封裝,封裝尺寸12mm×12mm,功耗5mW/5μW。
▲龍芯1C101▲
浙江龍芯凱豐在2012年推出龍芯智能門鎖。龍芯智能門鎖具有傳統(tǒng)智能鎖的指紋、密碼開鎖功能,還有“短信開鎖”的功能。只要通過指定代碼發(fā)送短信,門就可以自動打開,實現(xiàn)遠程遙控。此外,如果指紋開鎖出現(xiàn)三次錯誤,“龍芯鎖”就會拍攝影像發(fā)送到主人的手機;如果遇到煤氣泄漏、發(fā)生火情等情況,“龍芯鎖”不僅會發(fā)出警報,還會同時拍攝煙霧影像傳到主人手機。
龍芯1D
龍芯1D是面向超聲波熱表、水表和氣表測量的低功耗、低成本專用處理器。2013年6月完成設(shè)計,2014年3月19日,龍芯1D芯片的量產(chǎn)版本(LS1D4)完成流片封裝。
龍芯1D主頻8MHz,基于GS132R處理器核(8KB SRAM),片上存儲128KB Flash;集成超聲脈沖發(fā)生器、模擬比較器、時間數(shù)字轉(zhuǎn)換器、紅外收發(fā)器等功能部件。
龍芯1D采用0.13微米工藝制造,采用QFP80封裝,封裝尺寸14mm×14mm,功耗100uW。
▲龍芯1D▲
2011年11月,三川智慧與龍芯中科簽署《技術(shù)開發(fā)合同》,共同研發(fā)一款水氣熱計(測)量通用芯片(LS1D或龍芯1D),芯片采用0.13um實現(xiàn),處理器主頻8MHz。在每秒鐘進行2次測量的頻率下,采用3000mAH理論電量供電,能連續(xù)工作5年以上。合同有效期10年。
2018年5月27日三川智慧公告稱,公司與龍芯中科合作開發(fā)的水氣熱計(測)量通用芯片,能滿足公司目前的產(chǎn)品主要技術(shù)性能要求,保障特殊情勢下戰(zhàn)略安全,但與世界同類芯片先進水平尚有一定差距,能否進一步深入研發(fā)、突破核心技術(shù)存在一定的研發(fā)風險;同時,由于受使用環(huán)境、使用習慣、市場拓展等因素影響,對公司當前經(jīng)營業(yè)績不會產(chǎn)生重大影響。基于目前的判斷,該芯片市場前景尚不確定。
龍芯1G(音響)
龍芯1G是蘇州上聲(Sonavox)定制的一款汽車音響專用芯片。
龍芯1H(高溫鉆探)
2016年推出的龍芯1H高溫鉆探芯片是為中國石油集團渤海鉆探工程有限公司專門定制的一款處理器,設(shè)計目標是175攝氏度超高溫工作條件下的長時間可靠運行,主要用于石油鉆探隨鉆的溫度、轉(zhuǎn)速、傾角等參數(shù)采集設(shè)備。
龍芯1H主頻8MHz,采用單發(fā)射按序執(zhí)行32位處理器核(GS132),3級流水線,集成單精浮點協(xié)處理器、片上RAM/Flash/EEPROM、24位ADC、比較器、電源管理等模塊,以及定時器、SPI、UART、I2C、CAN等接口。
龍芯1H采用0.13微米工藝,采用QFP100封裝,封裝尺寸14mm×14mm,功耗50uW。
▲龍芯1H▲
龍芯2號家族
早期龍芯2號處理器采用4發(fā)射亂序執(zhí)行的64位處理器核。但龍芯2K處理器是雙發(fā)射亂序執(zhí)行的GS264處理器核的64位雙核處理器。
龍芯2F“PLA80”
2007年7月31日,龍芯2F(L2F)流片成功。為了紀念建軍80周年,龍芯2F代號為“PLA80”。
龍芯2F主頻800MHz,采用四發(fā)射亂序執(zhí)行的64位處理器核,具有64KB一級指令緩存和64KB一級數(shù)據(jù)緩存,512KB 二級緩存。
龍芯2F采用90納米工藝,包含5100萬晶體管,采用HSFCBGA452封裝,封裝尺寸27mm×27mm。
龍芯2F集成了DDR2內(nèi)存控制器和PCI接口,輔以適當?shù)腜CI外設(shè),2F可用于個人計算機、行業(yè)終端、工業(yè)控制、數(shù)據(jù)采集、網(wǎng)絡(luò)安全等領(lǐng)域。
▲龍芯2F▲
2007年12月26日,由中國科技大學基于“龍芯2F”處理器研制的萬億次高性能計算機“KD-50-I”通過鑒定,集成了330余顆“龍芯2F”處理器,理論峰值計算能力達到1萬億次。這是我國首臺國產(chǎn)萬億次高性能計算機。
2008年,中科龍夢推出采用龍芯2F處理器的福瓏2F迷你電腦。經(jīng)過多年的商業(yè)化推廣,龍芯2F的穩(wěn)定性已得到充分的驗證。可以說龍芯2F是龍芯家族中第一款成功的商用處理器。
龍芯2G
2010年,單核CPU龍芯2G(L2G)流片成功。
龍芯2G主頻1.0GHz,有64KB的指令和64KB數(shù)據(jù)的L1緩存,以及1MB的L2緩存;功耗3W。
龍芯2G采用65納米工藝,集成1億晶體管,采用BGA741封裝,封裝尺寸31mm×31mm。
▲龍芯2G▲
龍芯2GQ
有關(guān)龍芯2GQ的信息不多。
我們只能在中科夢蘭逸瓏8133筆記本的介紹中看到。
逸瓏8133筆記本內(nèi)置我國擁有自主知識產(chǎn)權(quán)的龍芯3A/2GQ四核高性能通用處理器,主頻900MHz。配備13.3顯示屏,分辨率為1366x768;1GB獨立顯存;采用AMD RS780E+SB710;2.5” SATA HDD 160/250/320/500 GB;操作系統(tǒng):紅旗/中標麒麟/中科方德/共創(chuàng)/Debian Linux。
據(jù)稱龍芯2GQ與龍芯3A1000的區(qū)別在于龍芯2GQ不支持多路互聯(lián)。
龍芯2H
2012年,單核64位CPU龍芯2H流片成功,2013年開始送樣,2014年正式推出。
龍芯2H是一款高集成度系統(tǒng)芯片,主頻達1GHz;片內(nèi)集成64位處理器核、3D GPU、VGA 和LCD顯示接口、媒體加速以及芯片組功能;有64KB的一級指令緩存和64KB一級數(shù)據(jù)緩存,512KB的二級緩存;實現(xiàn)了高級電源管理功能,支持多種電源級別和喚醒方式。
龍芯2H采用65納米工藝,采用FCBGA741封裝,封裝尺寸31mm×31mm。
龍芯2H能夠滿足安全適用計算機、云終端、網(wǎng)絡(luò)設(shè)備、消費類電子等領(lǐng)域需求,同時可作為Hyper Transport(HT)或者PCIE接口的全功能套片使用。
▲龍芯2H▲
龍芯2I
龍芯2I采用65納米工藝;集成8200萬晶體管;采用FCBGA500封裝。
龍芯2K1000
龍芯2K1000主頻達1GHz;集成兩個64位GS264處理器核和GPU圖形核心,峰值運算速度8GFlops,一級指令緩存32KB,一級數(shù)據(jù)緩存32KB,二級緩存共享1MB,功耗1-5W,并支持動態(tài)降頻降壓。是面向工業(yè)控制與終端等領(lǐng)域的低功耗通用處理器。
龍芯2K1000采用40納米工藝,集成約1.9億個晶體管,采用FCBGA608封裝,封裝尺寸27mm×27mm。
▲龍芯2K1000▲
龍芯2K0500
龍芯2K0500的主頻達500MHz;集成1個LA264處理器核。采用40納米工藝生產(chǎn)。
龍芯2K2000
據(jù)悉龍芯2K1000的升級版是龍芯2K2000,預計采用28納米工藝生產(chǎn),集成2個LA364處理器核,對主要接口進行升級,同時主頻將達到2GHz。
目前沒有更多消息。
龍芯2K3000
據(jù)悉龍芯2K2000的下一個版本是龍芯2K3000,預計采用12納米工藝生產(chǎn),集成2個LA364處理器核,同時主頻維持2GHz。
目前沒有更多消息。
龍芯3號家族
龍芯3處理器均為四發(fā)射亂序執(zhí)行的64位處理器核。目前,除了龍芯3B1500處理器為8核,其他的龍芯3號處理器均為4核。而最新版龍芯3C5000處理器會將處理器核數(shù)提高到16。
龍芯3A1000
2009年9月28日,我國首款商用四核處理器龍芯3A1000流片成功。
龍芯3A1000集成4個四發(fā)射亂序執(zhí)行的64位處理器核(GS464),9級流水線,有64KB一級數(shù)據(jù)緩存和64KB一級指令緩存,二級緩存共享4MB,最高主頻1GHz,功耗15w(支持動態(tài)降頻)。
龍芯3A1000中每個CPU核包含兩個浮點乘加部件,雙精度浮點性能峰值為16GFlops;可用于桌面、服務(wù)器、工業(yè)控制等領(lǐng)域。
龍芯3A1000采用65納米工藝,集成4.25億晶體管;采用FCBGA1121封裝,封裝尺寸40mm×40mm。
龍芯3A1000初期經(jīng)過兩次改版,第一次改版并于2010年10月流片成功,第二次改版于2012年8月中旬流片成功。
▲龍芯3A1000▲
2010年4月中國科學技術(shù)大采用80顆龍芯3A1000處理器構(gòu)建萬億次高性能計算機“KD-60”研制成功。
2010年4月23日,曙光公司宣布成功研制出基于國產(chǎn)龍芯處理器的高性能刀片服務(wù)器CB50-A。
2011年9月19日,曙光公司發(fā)布基于國產(chǎn)龍芯3A四核處理器的龍騰機架服務(wù)器、存儲服務(wù)器以及塔式服務(wù)器。
龍芯3B1000
2011年4月,首個8核CPU龍芯3B1000流片成功。
龍芯3B1000集成8個GS464處理器核,4MB的二級緩存,每個核包含兩個256位向量部件和1個128x256位的向量寄存器堆,峰值浮點性能達到128GFLOPS。
龍芯3B1000采用65納米工藝,比3A1000大73%;集成5.826億晶體管,比3A1000增加了37%;采用FCBGA1121封裝,封裝尺寸40mm×40mm。
▲龍芯3B1000▲
龍芯3B主要用于高性能計算機、高性能服務(wù)器、數(shù)字信號處理等領(lǐng)域。2012年12月29日,由中國科學技術(shù)大學與深圳大學聯(lián)合研制的首臺采用自主設(shè)計的“龍芯3B”八核處理器的萬億次高性能計算機“KD-90”在合肥通過專家組鑒定。“KD-90”采用單一機箱,集成了10顆龍芯3B處理器,成本低于20萬元,功耗低于900W,占地面積降低至0.12平方米,理論峰值計算能力高達每秒1萬億次。
龍芯3B1500
2012年8月,8核CPU龍芯3B1500第一次流片成功;2013年10月第一次改版的龍芯3B1500流片完成;2015年6月第二次改版的龍芯3B1500流片成功。
龍芯3B1500集成了8個四發(fā)射亂序執(zhí)行的64位GS464處理器核,主頻1.3-1.5GHz,9級流水線,每個處理器核有64KB的私有一級指令緩存和64KB的私有一級數(shù)據(jù)緩存,128KB私有二級緩存,有8MB三級共享緩存。單芯片雙精度浮點計算能力達到192GFlops。功耗30w(典型)/60w(向量)。
龍芯3B1500集成11億晶體管;采用FCBGA1121封裝,封裝尺寸40mm×40mm。
▲龍芯3B1500▲
龍芯3A2000
2015年8月18日,首款采用GS464E微結(jié)構(gòu)的處理器的龍芯3A2000/3B2000正式發(fā)布。
龍芯3A2000是龍芯3A1000的升級版,保持4核架構(gòu),但是處理器核升級為GS464E,主頻1GHz,緩存方面每核心一級指令64KB、數(shù)據(jù)64KB,二級緩存為256KB,三級是共享4MB。
2015年9月和2016年3月分別進行了龍芯3A2000的第一次改版設(shè)計和第二次改版設(shè)計。
龍芯3A2000采用40納米工藝,采用FCBGA1121封裝,封裝尺寸40mm×40mm。
▲龍芯3A2000▲
龍芯3B2000
龍芯3B2000在龍芯3A2000的基礎(chǔ)上支持多達四片全相聯(lián)結(jié)構(gòu)的多路一致性互連。
龍芯3B2000是龍芯3A1000的升級版,保持4核框架,但是處理器核升級為GS464E,主頻1GHz,緩存方面每核心一級指令64KB、數(shù)據(jù)64KB,二級緩存為256KB,三級是共享4MB。
龍芯3B2000采用40納米工藝,采用FCBGA1121封裝,封裝尺寸40mm×40mm。
龍芯3A3000“CZ80”
2016年10月17日,4核CPU龍芯3A3000流片成功。為了紀念長征勝利80周年,龍芯3A3000命名為“CZ80”。2017年4月25日正式發(fā)布。
龍芯3A3000主頻可達1.5GHz,采用4個四發(fā)射亂序執(zhí)行的64位超標量GS464E處理器核,采用12級超標量流水線;每核有2個定點單元、2個浮點單元和2個訪存單元。每個處理器核包含64KB私有一級指令緩存和64KB私有一級數(shù)據(jù)緩存,每個處理器包含256KB私有二級緩存;所有處理器核共享8MB三級緩存;峰值浮點性能24GFlops;典型功耗<[email protected]。
龍芯3A3000采用28納米工藝,采用FCBGA1121封裝,封裝尺寸40mm×40mm。
▲龍芯3A3000▲
龍芯3B3000
雙路服務(wù)器CPU龍芯3B3000在龍芯3A3000的基礎(chǔ)上支持多達四片全相聯(lián)結(jié)構(gòu)的多路一致性互連。
龍芯3B3000主頻可達1.5GHz,采用4個四發(fā)射亂序執(zhí)行的64位超標量GS464E處理器核,采用12級超標量流水線;每核有2個定點單元、2個浮點單元和2個訪存單元。每個處理器核包含64KB私有一級指令緩存和64KB私有一級數(shù)據(jù)緩存,每個處理器包含256KB私有二級緩存;所有處理器核共享8MB三級緩存;峰值浮點性能24GFlops;典型功耗<[email protected]。
龍芯3B3000采用28納米工藝,采用FCBGA1121封裝,封裝尺寸40mm×40mm。
龍芯3A4000
2019年4月15日龍芯3A4000第一次流片成功,2019年12月24日正式發(fā)布。
龍芯3A4000保持4核框架,但處理器核升級超標量GS464V,主頻得以提升至2GHz,支持支持128/256位向量指令;每核有2個定點單元、2個向量單元和2個訪存單元。每個處理器核包含64KB私有一級指令緩存和64KB私有一級數(shù)據(jù)緩存,每個處理器包含256KB私有二級緩存;所有處理器核共享8MB三級緩存;典型功耗<[email protected]、<[email protected]、<[email protected]。3A4000通用處理性能與AMD公司28nm工藝“挖掘機”處理器相當。
龍芯3A4000采用28納米工藝,采用FCBGA1211封裝,封裝尺寸37.5mm×37.5mm。
▲龍芯3A4000▲
▲摘自胡偉武董事長在龍芯3A4000發(fā)布會上的報告《龍芯不怕遠征難》
龍芯3B4000
2019年6月采用GS464Vv的龍芯3B4000第一次流片成功,2019年12月24日和龍芯3A4000同時發(fā)布。
龍芯3B4000屬于龍芯服務(wù)器CPU產(chǎn)品線,用于多路服務(wù)器整機產(chǎn)品,支持最多四路結(jié)構(gòu)的多路一致性互連。
龍芯3B4000支持雙路、四路服務(wù)器,即在一臺服務(wù)器主板上安裝2個或者4個龍芯3B4000芯片,一臺服務(wù)器最多包含16個處理器核。所有CPU之間通過高速總線接口直接互聯(lián),共享使用物理內(nèi)存。龍芯3B4000專門優(yōu)化了CPU之間的高速互連總線,跨片訪存實際帶寬提升400%以上。龍芯3B4000提升了對于大內(nèi)存容量支持,支持DDR4內(nèi)存,四路服務(wù)器最高內(nèi)存容量可達1TB。
龍芯3B4000的性能是龍芯3B3000四倍以上。
龍芯3B4000采用28納米工藝,采用FCBGA1211封裝,封裝尺寸37.5mm×37.5mm。
龍芯3A5000“KMYC70”
2021年7月,首款采用自主指令系統(tǒng)LoongArch的處理器芯片龍芯3A5000正式發(fā)布。2020年10月,基于全自主IP設(shè)計的龍芯3A5000第一次流片成功。為紀念抗美援朝70周年,龍芯3A5000芯片代號為“KMYC70”。
龍芯3A5000處理器主頻2.3GHz-2.5GHz,包含4個處理器核心,每個處理器核心采用64位超標量LA464自主微結(jié)構(gòu)。集成了2個支持ECC校驗的64位DDR4-3200控制器,4個支持多處理器數(shù)據(jù)一致性的HyperTransport 3.0控制器。支持主要模塊時鐘動態(tài)關(guān)閉,主要時鐘域動態(tài)變頻以及主要電壓域動態(tài)調(diào)壓等精細化功耗管理功能。龍芯3A5000處理器相較上一代龍芯3A4000處理器,性能提升50%以上,功耗降低30%以上。
龍芯3A5000采用12/14納米工藝節(jié)點,繼續(xù)保持4核設(shè)計,但主頻提升至2.5GHz。
▲龍芯3A5000▲
龍芯3B5000
龍芯3B5000在龍芯3A5000的基礎(chǔ)上支持多路互連。
龍芯3C5000L
16核龍芯3C5000L是由4顆3A5000封裝而成,支持四路3C5000L互連。
▲龍芯3C5000L▲
龍芯3C5000“CPC100”
基于龍芯3A5000核心的服務(wù)器專用芯片龍芯3C5000已經(jīng)于2021年上半年完成設(shè)計并交付流片。為慶祝建黨100周年,芯片代號為“CPC100”。
龍芯3C5000采用自主指令系統(tǒng)LoongArch,內(nèi)核數(shù)將從4核提升至16核,主頻為2.5GHz,支持2至16路服務(wù)器,具備高端服務(wù)器的商業(yè)競爭力。
龍芯3C6000
下一代產(chǎn)品是龍芯3A6000,主頻將超過2.5GHz,包含4個處理器核心,每個處理器核心采用64位超標量LA464自主微結(jié)構(gòu)。
龍芯橋片
龍芯7A1000
2017年10月,龍芯7A1000橋片流片成功。
龍芯7A1000橋片是面向龍芯3號處理器的第一款配套橋片,目標是替代AMD RS780+SB710芯片組,為龍芯處理器提供南北橋功能。
龍芯7A1000橋片通過HT3.0接口與處理器相連,集成GPU、顯示控制器和獨立顯存接口,外圍接口包括32路PCIE2.0、2路GMAC、3路SATA2.0、6路USB2.0和其它低速接口,可以滿足桌面和服務(wù)器領(lǐng)域?qū)O接口的應(yīng)用需求,并通過外接獨立顯卡的方式支持高性能圖形應(yīng)用需求。
龍芯7A1000采用40納米工藝,采用FCBGA804封裝,封裝尺寸31mm×31mm。
龍芯3A3000是第一款采用龍芯7A1000作為橋片的處理器。
▲龍芯7A1000▲
龍芯7A2000
龍芯7A2000橋片是龍芯7A1000橋片的升級版,作為龍芯3A5000的配套橋片。
龍芯7A2000橋片集成PCIE3.0、USB3.0、SATA3.0等接口,集成自研的圖形處理器。
后記
龍芯經(jīng)過20年的發(fā)展,形成了一個相對完整的處理器家族,可以應(yīng)用于石油鉆探、工業(yè)控制、網(wǎng)絡(luò)安全、桌面辦公、智能水表、生物識別等各種領(lǐng)域,為我國關(guān)鍵行業(yè)信息基礎(chǔ)設(shè)施提供了重要的技術(shù)支持。
誠然,與英特爾、AMD等處理器廠商相比,龍芯還只是個“成長中的孩子”。但是令人欣喜的是在曙光等國產(chǎn)服務(wù)器廠商與軟件廠商的支持之下,龍芯并不是孤軍奮戰(zhàn)。龍芯的發(fā)展已經(jīng)推動并形成了一條自主科技產(chǎn)業(yè)鏈,整個產(chǎn)業(yè)鏈無疑將形成一股更強大的力量來共同開拓自主創(chuàng)新的產(chǎn)業(yè)之路。