作者:admin 日期:2023-08-25 瀏覽: 次
自主研發(fā)國產(chǎn)高端企業(yè)云服務(wù)器,浪潮商用機(jī)器如何聚沙成塔?
沙子是半導(dǎo)體集成電路芯片的源材料,硅谷在近半個(gè)世紀(jì)以來利用世界上最普通的材料,制造出了世界上最高精尖的芯片,可以用“聚沙成寶”一詞形容西方科技史上這一奇跡般的成就。而中國在最近幾十年,特別是近二三十年,也在奮力追趕半導(dǎo)體和集成電路這一戰(zhàn)略級(jí)高科技領(lǐng)域的成就。其中之一,就體現(xiàn)在2018年5月2日開門營業(yè)的浪潮商用機(jī)器公司。
Power芯片是世界上最強(qiáng)的處理器之一,當(dāng)前全球排名第一和第二的超級(jí)計(jì)算機(jī)均采用的是POWER9芯片。POWER9處理器使用14納米制程工藝,集成了80億個(gè)晶體管,在芯片里實(shí)現(xiàn)了17層布線,系統(tǒng)內(nèi)的互聯(lián)帶寬達(dá)2.3倍內(nèi)存帶寬,可以實(shí)現(xiàn)7GB的片內(nèi)數(shù)據(jù)轉(zhuǎn)換。作為高端服務(wù)器芯片的最新一代技術(shù)結(jié)晶,POWER9芯片可以說是集大成。
自浪潮與IBM成立合資公司浪潮商用機(jī)器以來,浪潮商用機(jī)器基于之前浪潮長達(dá)25年的高端服務(wù)器K1的設(shè)計(jì)實(shí)踐和經(jīng)驗(yàn),結(jié)合POWER9芯片的高精尖工藝,自主創(chuàng)新設(shè)計(jì)了K1 Power系列企業(yè)級(jí)高端Unix服務(wù)器,可滿足金融、電信及互聯(lián)網(wǎng)、政府和制造業(yè)等對(duì)超高業(yè)務(wù)穩(wěn)定性、巨大數(shù)據(jù)吞吐、高數(shù)據(jù)一致性、頻繁的并發(fā)訪問能力和要求。
作為混合云時(shí)代的最高端科技成果之一,國產(chǎn)高端Unix服務(wù)器K1 Power的自研過程體現(xiàn)了當(dāng)代中國在自主科技創(chuàng)新方面的成就。2019年底,浪潮商用機(jī)器的技術(shù)專家分享了K1 Power的研發(fā)過程。
讓IBM驚訝的中國高端服務(wù)器
浪潮與IBM在技術(shù)方面的合作,早于浪潮商用機(jī)器公司的成立。浪潮早在1993年就研制出了中國首臺(tái)小型機(jī)服務(wù)器SMP2000,當(dāng)時(shí)該服務(wù)器基于X86架構(gòu)。后來,浪潮成立了高效能服務(wù)器和存儲(chǔ)技術(shù)國家重點(diǎn)實(shí)驗(yàn)室,并于2010年設(shè)計(jì)成功了高端安騰服務(wù)器,也是我國863計(jì)劃重大專項(xiàng)“高端容錯(cuò)計(jì)算機(jī)研制與應(yīng)用推廣”項(xiàng)目成果,這在當(dāng)時(shí)屬于一個(gè)重大科研突破。
2010年,400多位浪潮工程師耗費(fèi)4年研制成功K1小型機(jī),突破多項(xiàng)小型機(jī)核心技術(shù),使得中國成為除美國、日本之外全球第三個(gè)具備關(guān)鍵應(yīng)用主機(jī)研制能力的國家,浪潮成為全球第五家具備關(guān)鍵應(yīng)用主機(jī)研制能力的企業(yè)。K1安騰服務(wù)器克服的一大挑戰(zhàn)即多級(jí)處理器互聯(lián)過程中的Cache緩存一致性。浪潮自研了處理器協(xié)同芯片,集成了4.5億個(gè)晶體管、有2577根管腳,而Intel當(dāng)時(shí)最高端的通用處理器至強(qiáng)E7集成的晶體管數(shù)量也不過14億個(gè)、針腳數(shù)只有1567個(gè)。
正因?yàn)橛辛薑1關(guān)鍵應(yīng)用小型機(jī),當(dāng)浪潮把兩臺(tái)機(jī)器送到多倫多給IBM進(jìn)行DB2數(shù)據(jù)庫的移植時(shí),讓IBM對(duì)浪潮產(chǎn)品的研發(fā)能力有了新的認(rèn)知。當(dāng)時(shí),國際上認(rèn)為中國無法達(dá)到這么高精尖的工藝水平,以為K1是OEM惠普的機(jī)器,后來當(dāng)打開K1仔細(xì)研究后才發(fā)現(xiàn)與惠普的機(jī)器完全不一樣,出乎了IBM工程師的意料。
正是因?yàn)橛辛藢?duì)浪潮K1服務(wù)器創(chuàng)新能力的認(rèn)知,才有了后來2017年IBM與浪潮合資公司圍繞Power處理器開發(fā)K1 Power系列高端機(jī)。浪潮商用機(jī)器在北京、濟(jì)南建立了面向Power生態(tài)的K1 Power團(tuán)隊(duì),浪潮一半的K1研發(fā)團(tuán)隊(duì)整合到合資公司共同打造K1 Power服務(wù)器?,F(xiàn)在浪潮商用機(jī)器K1 Power研發(fā)團(tuán)隊(duì)有一百多位核心人員,該研發(fā)團(tuán)隊(duì)骨干精英全部擁有10年以上高端服務(wù)器設(shè)計(jì)經(jīng)驗(yàn),全程參與了浪潮K1、M13、4/8路X86高端服務(wù)器產(chǎn)品的研發(fā),具有從系統(tǒng)原理到主板PCB設(shè)計(jì)的全流程設(shè)計(jì)能力,可對(duì)結(jié)構(gòu)、電源、信號(hào)、散熱等服務(wù)器核心模塊進(jìn)行快速研發(fā)。
而K1 Power服務(wù)器除了芯片采用POWER9外,其余全部是浪潮商用機(jī)器自行研發(fā),浪潮商用機(jī)器北京、濟(jì)南兩大研發(fā)實(shí)驗(yàn)室投資上千萬元配備PCIe 4.0誤碼儀、59GHz 高速示波器、矢量網(wǎng)絡(luò)分析儀等頂級(jí)硬件研發(fā)測(cè)試設(shè)備,可進(jìn)行業(yè)界領(lǐng)先的高速信號(hào)仿真和測(cè)試。此外,實(shí)驗(yàn)室除了配備專業(yè)的電子設(shè)計(jì)自動(dòng)化工具(EDA),還配備了專業(yè)測(cè)試設(shè)備能快速診斷定位設(shè)計(jì)故障,打造可靠性高于99.9994%的高品質(zhì)高端服務(wù)器產(chǎn)品。
K1 Power服務(wù)器的四大特點(diǎn)
作為K1 Power服務(wù)器的代表作,K1 Power E980是浪潮商用機(jī)器自主研發(fā)的16路旗艦級(jí)關(guān)鍵應(yīng)用服務(wù)器,單臺(tái)E980最高可部署成192個(gè)邏輯分區(qū)或1000個(gè)微分區(qū),支撐更大規(guī)模虛擬機(jī)、更高吞吐、更高性能和更高擴(kuò)展性,通過云化的方式可將幾十乃至上百個(gè)應(yīng)用負(fù)載整合到一臺(tái)高端服務(wù)器上。而針對(duì)分布式大規(guī)模機(jī)器學(xué)習(xí),K1 Power面向加速器、異構(gòu)計(jì)算的Cache一致高速互聯(lián),可以實(shí)現(xiàn)多種領(lǐng)域中不同算法近10倍的性能加速;在大數(shù)據(jù)應(yīng)用場(chǎng)景中,也使得數(shù)據(jù)壓縮和解壓縮性能提高了440~740倍。
K1 Power服務(wù)器具有高可用、高品質(zhì)、高可靠和高安全的特點(diǎn)。首先,在高可用方面,POWER9處理器目前是業(yè)界性能最高的處理器之一,主頻方面可達(dá)到業(yè)界最高4Ghz,CPU之間、CPU與內(nèi)存之間、CPU與I/O之間具備更大的帶寬,相比X86可提高數(shù)倍。POWER9支持PCIe4.0協(xié)議,而X86 CPU只支持到PCIe3.0;POWER9原生支持NVLink2.0協(xié)議,保證CPU和I/O之間高帶寬,以滿足核心數(shù)據(jù)庫等高性能負(fù)載應(yīng)用的需求,對(duì)DB2、Oracle、SPARC等核心數(shù)據(jù)庫應(yīng)用系統(tǒng)都可提升兩倍以上性能,開源數(shù)據(jù)庫也有兩倍以上性能提升。在資源的整合方面,K1 Power服務(wù)器可以在一臺(tái)服務(wù)器上通過分區(qū)的形式滿足更多應(yīng)用需求,整機(jī)硬件負(fù)載效率高、使用效率高、資源整合能力強(qiáng);而X86服務(wù)器更多是一臺(tái)服務(wù)器承載一個(gè)應(yīng)用,再通過服務(wù)器集群滿足不同的應(yīng)用,單機(jī)負(fù)載效率并不高。
在高可靠方面,K1 Power不但保證強(qiáng)大的性能,更看重整個(gè)系統(tǒng)的長期高可靠性。這就是通常所說的RAS(可靠性、可用性、自診斷)設(shè)計(jì)理念:與X86不同,K1 Power服務(wù)器增強(qiáng)了硬件的冗余設(shè)計(jì),采用了外帶獨(dú)立的故障服務(wù)處理器,以及從部件、系統(tǒng)、測(cè)試、散熱等各個(gè)方面嚴(yán)格、高標(biāo)準(zhǔn)的測(cè)試,以保證整個(gè)系統(tǒng)的高可靠。冗余設(shè)計(jì)是K1 Power服務(wù)器的一大特色,主要從時(shí)間冗余、空間冗余和信息冗余三個(gè)維度實(shí)現(xiàn)了容錯(cuò)服務(wù)器。
除了冗余外,錯(cuò)誤捕獲是保障長期穩(wěn)定可靠的必要部件,一旦捕獲故障就可以立即隔離并修復(fù),整個(gè)K1 Power服務(wù)有多達(dá)16萬個(gè)故障檢查器,遍布系統(tǒng)各個(gè)方面以實(shí)時(shí)監(jiān)測(cè)系統(tǒng)運(yùn)行狀態(tài)。K1 Power服務(wù)器的首錯(cuò)數(shù)據(jù)捕獲機(jī)制FFDC(First Failure Data Capture),可以在設(shè)計(jì)階段進(jìn)行各類錯(cuò)誤模擬,在實(shí)際運(yùn)行階段進(jìn)行錯(cuò)誤捕獲,在維護(hù)階段對(duì)所有可能產(chǎn)生的錯(cuò)誤提前預(yù)警、備案和處理。K1 Power服務(wù)器在軟件層面提供糾錯(cuò)機(jī)制,包括內(nèi)存和緩存的糾錯(cuò)機(jī)制,對(duì)于沒有糾錯(cuò)機(jī)制的部件則提供重試機(jī)制,也就是有些偶發(fā)故障可能出現(xiàn)一次但不一定是真正的故障,則通過重試來判斷是否為真故障,內(nèi)存控制器和指令集的重試機(jī)制也是K1 Power服務(wù)器特有功能。對(duì)于發(fā)生的故障,K1 Power服務(wù)能做到更細(xì)膩度的隔離與修復(fù),例如X86處理器在內(nèi)部某個(gè)區(qū)域或者某個(gè)功能故障后整個(gè)CPU就宕掉了,而POWER9處理器可以做到CPU內(nèi)部某個(gè)核心故障就單獨(dú)把這個(gè)核心隔離出去,整個(gè)處理器還能繼續(xù)工作,對(duì)于內(nèi)存模塊或者是邏輯內(nèi)存塊也能做到故障的捕獲、隔離和修復(fù)。
通過全棧式的可靠保障,包括整個(gè)RAS冗余、基于FSP的故障檢測(cè)隔離機(jī)制以及在線修復(fù)更新等糾錯(cuò)機(jī)制,K1 Power系統(tǒng)在物理可靠性方面做到:可抗震、擴(kuò)低溫、抗粒子干擾;系統(tǒng)時(shí)鐘、OSP、FSP、PSU、Fan風(fēng)扇、Cable線纜等冗余;以及電源與散熱OCC等散熱可靠性;在軟錯(cuò)誤方面則能處理服務(wù)器處理器校驗(yàn)、MEM循環(huán)校驗(yàn)及冗余、I/O總線冗余、HDD冗余和RAID、Hyervisor虛擬機(jī)冗余、操作系統(tǒng)高可用以及災(zāi)備等。
在高品質(zhì)方面,K1 Power服務(wù)器則提供高達(dá)40層主板設(shè)計(jì)、高效散熱設(shè)計(jì)、高品質(zhì)和長壽命器件及部件、精確設(shè)計(jì)與仿真、高標(biāo)準(zhǔn)檢測(cè)、全面認(rèn)證和檢測(cè)等保證。其中,在高品質(zhì)部件方面,整個(gè)K1 Power系統(tǒng)底層,從元器件和部件選型的層級(jí)都采用更高標(biāo)準(zhǔn),例如:電阻采用了更嚴(yán)苛環(huán)境測(cè)試下、遠(yuǎn)超7年設(shè)計(jì)壽命的抗硫化電阻,從而提高電阻本身的壽命和可靠性;風(fēng)扇是鋁制框設(shè)計(jì),通常X86服務(wù)器都是塑料框體,而鋁框設(shè)計(jì)增加了整體可靠性,特別是增加自重以獲得更好的系統(tǒng)減震效果,因?yàn)檎饎?dòng)也會(huì)極大影響系統(tǒng)性能和運(yùn)行的可靠,同時(shí)穩(wěn)定的自身散熱系統(tǒng)能夠提升導(dǎo)熱效率,在硫化環(huán)境下能避免老化,這樣就能在風(fēng)扇工作周期內(nèi)大幅減少故障概率,讓風(fēng)扇達(dá)到甚至超過22年的設(shè)計(jì)使用壽命。
仿真對(duì)于K1 Power服務(wù)器的設(shè)計(jì)也很重要,K1 Power服務(wù)器的研發(fā)階段周期很長,通過大量仿真工作把各種可能的風(fēng)險(xiǎn)在設(shè)計(jì)階段規(guī)避掉。在系統(tǒng)高精度仿真方面,K1 Power服務(wù)器在設(shè)計(jì)階段就進(jìn)行了:結(jié)構(gòu)仿真,模仿靜態(tài)、形變、動(dòng)態(tài)跌落和沖擊等對(duì)系統(tǒng)的影響;散熱仿真則建立精度更高、粒度更細(xì)的散熱仿真模型,仿真各種可能影響散熱的因素,保障在各種條件下散熱的穩(wěn)定性;高速信號(hào)以及電源信號(hào)仿真,在仿真階段提前分析風(fēng)險(xiǎn),采取優(yōu)化措施規(guī)避風(fēng)險(xiǎn),確保信號(hào)傳輸質(zhì)量和抗干擾能力。
K1 Power服務(wù)器還采用了更高標(biāo)準(zhǔn)的檢測(cè)和測(cè)試,例如在生產(chǎn)測(cè)試上測(cè)試的老化時(shí)間更長、達(dá)到了48小時(shí),而普通的X86服務(wù)器的老化時(shí)間測(cè)試是6到8小時(shí)。Power服務(wù)器在出廠之前要求每臺(tái)服務(wù)器都要做到全檢測(cè),而且要求檢測(cè)的測(cè)試項(xiàng)要做到100%,相比許多X86服務(wù)器出廠前主要為抽檢模式。K1 Power服務(wù)器經(jīng)歷的是全自動(dòng)化測(cè)試腳本的執(zhí)行,即為了規(guī)避手動(dòng)測(cè)試偶發(fā)故障產(chǎn)生的可能。在K1 Power服務(wù)器自研部件的引入過程中,還對(duì)自研部件進(jìn)行階段性測(cè)試和整機(jī)測(cè)試,以保障自研部件質(zhì)量和性能達(dá)到業(yè)界最高標(biāo)準(zhǔn)。對(duì)一些核心部件,還會(huì)增加特殊測(cè)試以保障部件的高可靠性,例如PCB板的熱沖擊測(cè)試是急劇升溫維持一段時(shí)間后再降溫,而X86測(cè)試曲線則是緩慢升溫后再降溫。

在高安全方面,因?yàn)镵1 Power服務(wù)器主要是滿足核心數(shù)據(jù)庫和核心應(yīng)用,對(duì)安全性的考慮與X86服務(wù)器相比也有特殊的考慮。K1 Power服務(wù)器不會(huì)依賴于操作系統(tǒng)層面的安全性來保障機(jī)器或系統(tǒng)的安全性,而是在更底層技術(shù)層面做安全加固,例如在部件層通過全自主開發(fā)的部件來保證整個(gè)系統(tǒng)的穩(wěn)定,K1 Power服務(wù)器所有部件的維護(hù)都需要通過認(rèn)證,隨便外插部件不會(huì)被識(shí)別,而必須經(jīng)過認(rèn)證的安全機(jī)制。當(dāng)然,浪潮商用機(jī)器自研的K-UX操作系統(tǒng)是全球五大通過UNIX認(rèn)證的操作系統(tǒng)之一, K-UX本身也是通過安全認(rèn)證的可信操作系統(tǒng),還會(huì)通過自研的操作系統(tǒng)安全加固模塊,保證操作系統(tǒng)層面系統(tǒng)級(jí)安全可靠。
浪潮商用機(jī)器有限公司產(chǎn)品研發(fā)部副總經(jīng)理尹宏偉表示,K1 Power服務(wù)器從很多維度保證了系統(tǒng)的安全可靠和高性能,而大量的研發(fā)工作難以從外部直接感知,只有在產(chǎn)品運(yùn)行很長時(shí)間之后才能發(fā)現(xiàn)高可用、高可靠、高品質(zhì)、高安全的服務(wù)器與普通服務(wù)器的差距。
K1 Power服務(wù)器的自研挑戰(zhàn)
K1 Power作為國產(chǎn)自研的高端關(guān)鍵應(yīng)用服務(wù)器,在產(chǎn)品設(shè)計(jì)、生產(chǎn)和制造方面的故事可以說舉不勝舉,前面已經(jīng)提及高可用、高可靠、高品質(zhì)和高安全,而在這四個(gè)領(lǐng)域的每個(gè)領(lǐng)域都可以深入再詳細(xì)展開諸多細(xì)節(jié)設(shè)計(jì)。以下從幾個(gè)關(guān)鍵細(xì)節(jié)的深入了解,即可知道為什么關(guān)鍵應(yīng)用服務(wù)器是國家級(jí)戰(zhàn)略科技重點(diǎn)。
首先,冗余是K1 Power服務(wù)器的一大特色,也極具挑戰(zhàn)。在空間冗余方面,K1 Power服務(wù)器通過VRM虛擬資源管理實(shí)現(xiàn)了DRAM芯片冗余,而在多級(jí)CPU之間的I/O通信則采用了總線冗余,CPU與DRAM之間則為內(nèi)存總線冗余,此外還有I/O控制器、I/O柜、I/O柜鏈路、電源、SMP線纜、FSP模塊等多種關(guān)鍵部件、路徑等的冗余。例如,電源的穩(wěn)壓模塊做到了N+2冗余設(shè)計(jì),相當(dāng)于有多套變壓器把系統(tǒng)12伏電壓分給板機(jī)的各個(gè)元器件使用,而X86則是一套變壓器。
在時(shí)間冗余方面,K1 Power服務(wù)器的每個(gè)系統(tǒng)控制單元中有兩個(gè)冗余的時(shí)鐘卡,通過線纜對(duì)系統(tǒng)提供冗余的時(shí)鐘,當(dāng)任意一個(gè)時(shí)鐘卡出現(xiàn)故障時(shí),另一組時(shí)鐘可以無縫切換保持系統(tǒng)穩(wěn)定運(yùn)行。在電源時(shí)序控制信號(hào)冗余方面,對(duì)Enable、Power good等信號(hào)進(jìn)行了冗余設(shè)計(jì),實(shí)現(xiàn)更加可靠的電源開關(guān)控制。這里要強(qiáng)調(diào)的是,系統(tǒng)時(shí)鐘冗余本身是一個(gè)小概率事件,對(duì)于X86服務(wù)器的設(shè)計(jì)沒有必要這樣做,但是K1 Power服務(wù)器對(duì)可靠性的要求特別高,所以即使是系統(tǒng)時(shí)鐘這種極小概率故障也要做到冗余。加上電源持續(xù)信號(hào)控制冗余,說明K1 Power服務(wù)器系統(tǒng)對(duì)小電路或者器件的設(shè)計(jì)都要做到冗余,確保萬無一失。
在信息冗余方面,例如Power服務(wù)器的校驗(yàn)數(shù)據(jù)很多,當(dāng)一部分校驗(yàn)數(shù)據(jù)無法讀出時(shí),可以通過校驗(yàn)計(jì)算恢復(fù)回來。
總體來說,K1 Power服務(wù)器承載的都是高價(jià)值業(yè)務(wù),而當(dāng)服務(wù)器系統(tǒng)規(guī)模增大之后半導(dǎo)體失效是必然的,怎樣把失效控制在局部范圍并且能夠在線地修復(fù),這是K1 Power服務(wù)器設(shè)計(jì)耗費(fèi)大量設(shè)計(jì)時(shí)間和精力所在,也是K1 Power服務(wù)器RAS的精華所在。與實(shí)現(xiàn)計(jì)算和存儲(chǔ)等功能相比,K1 Power服務(wù)器的RAS設(shè)計(jì)工作量更大。例如捕獲故障再隔離出來就非常困難,一方面要從硬件芯片角度能處理,另一方面從板機(jī)到系統(tǒng)、操作系統(tǒng)固件、操作系統(tǒng)BIOS等都需要與操作系統(tǒng)同時(shí)實(shí)現(xiàn),還要在操作系統(tǒng)加入更有針對(duì)性的內(nèi)核驅(qū)動(dòng)去處理這些故障。
浪潮商用機(jī)器有限公司副總經(jīng)理黃家明表示,設(shè)計(jì)一臺(tái)服務(wù)器實(shí)現(xiàn)計(jì)算、存儲(chǔ)等功能,本身不是太大問題,但是如何處理必然的失效,其實(shí)體現(xiàn)了K1 Power服務(wù)器與X86服務(wù)器的巨大不同,其中也蘊(yùn)含著巨大的工作量,這些工作量也不是一個(gè)部門、一個(gè)團(tuán)隊(duì)就能處理的,需要專門面向高可靠性設(shè)計(jì)的團(tuán)隊(duì)聯(lián)合在一起來實(shí)現(xiàn),這也是最困難的一部分。
其次,40層主板的設(shè)計(jì)。為什么K1 Power服務(wù)器要做40層主板設(shè)計(jì)?因?yàn)镻ower的信號(hào)都是高速信號(hào),高速信號(hào)對(duì)信號(hào)之間的干擾更敏感。為了完全隔絕高速信號(hào)相互的影響,保證高速信號(hào)的完整性,要做到每?jī)蓪有盘?hào)之間都是有一個(gè)D層,總體板機(jī)層數(shù)就特別高,而X86服務(wù)器通常是表面和底層為D層,中間都是多層信號(hào)。除了工藝的挑戰(zhàn)之外,K1 Power服務(wù)器也經(jīng)過了更嚴(yán)苛的板機(jī)測(cè)試,以保障出貨的良品率。因?yàn)橐魬?zhàn)新工藝,不可避免的是良品率的降低,但可以通過技術(shù)手段來保障整個(gè)成品的良品率。
第三是高效散熱的設(shè)計(jì)。整個(gè)K1 Power服務(wù)器系統(tǒng)很復(fù)雜,包括了各類的元器件。系統(tǒng)可靠性與熱量密切相關(guān),散熱是影響系統(tǒng)可靠性的一個(gè)重要指標(biāo)。K1 Power服務(wù)器用更高效的散熱設(shè)計(jì)和更高效的散熱管理,從散熱角度提升整個(gè)系統(tǒng)的可靠性。例如在導(dǎo)熱材質(zhì)方面,X86在CPU和散熱器之間采用的是導(dǎo)熱膏,而K1 Power服務(wù)器采用的是銦片。為什么選銦片?因?yàn)殂熎姆€(wěn)定性和可靠性。導(dǎo)熱膏可能一年之后就揮發(fā)了,性能會(huì)逐漸下降,而金屬銦片可長期運(yùn)行,對(duì)可靠性是極大的保障。K1 Power服務(wù)器系統(tǒng)對(duì)熱的管理采用了動(dòng)態(tài)分區(qū)散熱控制技術(shù),這種動(dòng)態(tài)、智能化的散熱控制,提高了散熱的效率,也保障了CPU等元器件工作在舒適的溫度里,從而提高器件的壽命。
第四是安全。K1 Power能保持系統(tǒng)一致性,不被篡改。在Secure Boot模式中,X86服務(wù)器通常可以用U盤引導(dǎo)服務(wù)器啟動(dòng),引導(dǎo)啟動(dòng)后就可以把硬盤拷貝走,而K1 Power服務(wù)器的每一個(gè)部件都有類似于可信計(jì)算的模式,部件的指紋信息在TPM芯片里面已經(jīng)內(nèi)置好,如果更換的部件或者硬盤不在指紋庫里,就無法通過該部件引導(dǎo)系統(tǒng)重啟。也就是說,雖然K1 Power服務(wù)器可以使用標(biāo)準(zhǔn)的商業(yè)部件,但也要刷入key、指紋信息等,從系統(tǒng)部件角度保證安全性。這樣,即使固件被篡改過,例如從網(wǎng)站下載一個(gè)固件再修改,就無法通過K1 Power服務(wù)器的認(rèn)證了,因?yàn)檎麄€(gè)固件是經(jīng)過校驗(yàn)過且校驗(yàn)信息是在工廠模式時(shí)寫進(jìn)去的,在使用用戶模式下無法修改,從而避免惡意軟件直接被內(nèi)置到系統(tǒng)固件層面。
第五是K1 Power供應(yīng)鏈整合了原先浪潮K1的供應(yīng)鏈以及IBM供應(yīng)鏈。例如工藝管控方面包括熱沖擊實(shí)驗(yàn)管控就從國內(nèi)測(cè)試轉(zhuǎn)到IBM實(shí)驗(yàn)室測(cè)試。本身K1 Power的PCB熱沖擊實(shí)驗(yàn)是交由國內(nèi)頂級(jí)實(shí)驗(yàn)室,開始的時(shí)候?qū)嶒?yàn)室認(rèn)為浪潮X86服務(wù)器都可以測(cè)試,K1 Power服務(wù)器也沒有問題,結(jié)果K1 Power服務(wù)器要求產(chǎn)品溫度在一分鐘之內(nèi)上升到300多度,接近玻璃融化溫度,而且要保持兩分鐘再降溫,然后一直做循環(huán),結(jié)果幾次測(cè)試后對(duì)方領(lǐng)導(dǎo)說再做的話測(cè)試機(jī)器就廢了,于是轉(zhuǎn)由IBM實(shí)驗(yàn)室提供測(cè)試服務(wù)。
此外,在板機(jī)的生產(chǎn)和設(shè)計(jì)等方面,實(shí)際上X86極致的設(shè)計(jì)能力已經(jīng)很強(qiáng)了,因?yàn)閄86本身是成本敏感型的設(shè)計(jì),要求板層減到最少的同時(shí)保證穩(wěn)定性,對(duì)布線的能力和要求都有提升。K1 Power服務(wù)器在設(shè)計(jì)的時(shí)候,也會(huì)引入原來在X86大規(guī)模環(huán)境下驗(yàn)證過的設(shè)計(jì),然后再增加新工藝、新材料。不同的K1 Power服務(wù)器產(chǎn)品體現(xiàn)了不同的自研程度,比如E950 4路和E924 2路服務(wù)器就體現(xiàn)了更多浪潮的設(shè)計(jì),基本上重新設(shè)計(jì)了。浪潮商用機(jī)器希望從用戶端和客戶端保持K1和Power的口碑,在繼承IBM Power設(shè)計(jì)的同時(shí),更多地融入浪潮原先K1的設(shè)計(jì)經(jīng)驗(yàn)和實(shí)踐。
浪潮商用機(jī)器有限公司產(chǎn)品營銷部總經(jīng)理江豫京介紹,浪潮商用機(jī)器的產(chǎn)品線總體來說分為兩大品牌和兩大產(chǎn)品線:兩大品牌是K1 Power與Inspur Power,兩大產(chǎn)品線為縱向擴(kuò)展(Scale up)、橫向擴(kuò)展(Scale out),其中K1 Power為基于POWER9芯片的機(jī)器,而Inspur Power則為基于OpenPOWER9芯片的機(jī)器。除了E950和E980以外,其它所有機(jī)型都為橫向擴(kuò)展產(chǎn)品線。目前,浪潮商用機(jī)器在國內(nèi)非X86的小型機(jī)市場(chǎng)占有率達(dá)到了65%,獲得了市場(chǎng)的認(rèn)可。在關(guān)鍵應(yīng)用場(chǎng)景下面,K1 Power有很好的縱向擴(kuò)展性能,能夠承載大量業(yè)務(wù)并發(fā)情況;對(duì)于新興業(yè)務(wù)場(chǎng)景,包括分布式存儲(chǔ)、大數(shù)據(jù)、AI等,Power服務(wù)器也有其優(yōu)勢(shì)。
整體來說,2020年是私有云和混合云的大年,不少企業(yè)級(jí)應(yīng)用從公共云回歸到企業(yè)本地部署,而K1 Power服務(wù)器系列及虛擬化和云化解決方案,在一個(gè)芯片架構(gòu)下就可實(shí)現(xiàn)從物理機(jī)到多云/混合云的多種云平臺(tái)形態(tài),滿足企業(yè)縱向(核心應(yīng)用)和橫向(云化應(yīng)用)的擴(kuò)展需求,這為K1 Power和Inspur Power服務(wù)器在混合云時(shí)代提供了廣闊的市場(chǎng)空間,而浪潮商用機(jī)器則演繹著新時(shí)代的“聚沙成塔”。
更多內(nèi)容請(qǐng)?jiān)L問“云科技時(shí)代”網(wǎng)站:
www.cloudtimemag.com
“云科技時(shí)代”的文章還廣泛出現(xiàn)在:
微信公眾號(hào)、天天快報(bào)、今日頭條號(hào)、微博號(hào)、知乎專欄、搜狐新聞端、網(wǎng)易客戶端、百度百家、百家號(hào)、中關(guān)村在線回響、北京時(shí)間科技頻道、一點(diǎn)號(hào)、界面、51CTO博客、e-works博客、UC訂閱號(hào)、新浪財(cái)經(jīng)頭條、新浪看點(diǎn)、艾瑞網(wǎng)專欄、TechWeb博客等。
“云科技時(shí)代”是今日頭條優(yōu)質(zhì)科技作者、入選今日頭條精選頻道