世界環(huán)境日|如何馴服AI大模型這匹“能耗巨獸”?
世界環(huán)境日|如何馴服AI大模型這匹“能耗巨獸”?

自從ChatGPT驚艷全球,世界范圍內(nèi)開始掀起AI大模型開發(fā)熱潮。但人們正在逐漸發(fā)現(xiàn),無論訓(xùn)練還是應(yīng)用,大模型都電耗極高,不僅成本高企,對環(huán)境也帶來了巨大壓力。如今,雙碳發(fā)展已是全球共識,為大模型節(jié)能降碳刻不容緩。
根據(jù)斯坦福大學(xué)人工智能技術(shù)研究室(HAI)近日公布的《2023年人工智能指數(shù)報告》,GPT-3是當(dāng)前大模型中有據(jù)可依的第一大“電老虎”,光是訓(xùn)練GPT-3,就消耗了128.7萬千瓦時電量,產(chǎn)生了550噸碳排放,相當(dāng)于數(shù)百輛汽車一整年的排放量。如今ChatGPT熱度居高不下,根據(jù)OpenAI官方博客,ChatGPT在今年1月份共處理了約30億次查詢,參考BLOOM(與ChatGPT底層語言模型大小相似)模型執(zhí)行推理的能耗,每次查詢耗電0.00396千瓦時,這意味著ChatGPT一個月就消耗了約1188萬千瓦時的電力,堪比一座小城鎮(zhèn)。
怪不得曾經(jīng)有戲言稱,馬斯克為了節(jié)約制冷和耗能,計劃用SpaceX把超級計算機(jī)搬上太空。隨著時代發(fā)展對算力的要求越來越高,數(shù)據(jù)中心節(jié)能降耗刻不容緩。近日,財政部、生態(tài)環(huán)境部、工業(yè)和信息化部聯(lián)合印發(fā)關(guān)于《綠色數(shù)據(jù)中心政府采購需求標(biāo)準(zhǔn)(試行)》的通知,明確要求今年6月起數(shù)據(jù)中心PUE(電能比)不高于1.4,2025年起數(shù)據(jù)中心PUE不高于1.3,綠色低碳是數(shù)據(jù)中心發(fā)展的必然方向。
聯(lián)想溫水水冷技術(shù)
AI大模型節(jié)能降耗“神助攻”
數(shù)據(jù)中心的能耗結(jié)構(gòu)中,制冷系統(tǒng)的能耗僅次于信息設(shè)備能耗,因此降低數(shù)據(jù)中心的制冷能耗,是降低PUE的關(guān)鍵。隨著AI、云計算等技術(shù)升級,數(shù)據(jù)中心功率密度逐漸提升,規(guī)?;厔菝黠@,傳統(tǒng)風(fēng)冷技術(shù)已無法滿足其散熱需求,而液冷技術(shù)由于散熱介質(zhì)比熱容更大,制冷量大,制冷效率高,成為提升數(shù)據(jù)中心效能的重要條件。據(jù)統(tǒng)計,液冷技術(shù)最高可降低數(shù)據(jù)中心近90%的散熱能耗,液冷已經(jīng)為近年來發(fā)展最快的數(shù)據(jù)中心節(jié)能制冷技術(shù)。
在數(shù)據(jù)中心行業(yè)深耕多年的聯(lián)想集團(tuán),早在二十多年前便發(fā)布了溫水水冷技術(shù), 2011年部署了世界第一臺大規(guī)模溫水水冷系統(tǒng)高性能計算機(jī),如今相關(guān)產(chǎn)品已經(jīng)迭代到了第五代,在全球部署超6萬臺。溫水水冷技術(shù)是指通過去離子水對數(shù)據(jù)中心服務(wù)器進(jìn)行散熱的液冷解決方案,是材料學(xué)、微生物學(xué)、流體力學(xué)、傳熱學(xué)等學(xué)科的技術(shù)結(jié)晶。聯(lián)想溫水水冷技術(shù)在節(jié)能降耗、性能提升、安裝運(yùn)維方面均有出色表現(xiàn)。
01 助力節(jié)能降耗,數(shù)據(jù)中心PUE降至1.1
出色水回路
聯(lián)想溫水水冷技術(shù)的重要優(yōu)勢在于出色的水回路設(shè)計,利用去離子水作為導(dǎo)熱介質(zhì),對CPU、GPU等采用微通道(通道當(dāng)量直徑在10~1000μm)散熱器;針對內(nèi)存、較低功耗的I/O板卡等部件采用導(dǎo)熱板散熱技術(shù),能夠?qū)崿F(xiàn)高達(dá)50度的進(jìn)水溫度,并達(dá)成更高的能源再利用率,將熱移除效率整體提升至近100%,數(shù)據(jù)中心PUE可達(dá)1.1。
可適應(yīng)水溫2-50度
聯(lián)想溫水水冷系統(tǒng),去離子水在2-50度溫度范圍內(nèi)皆可運(yùn)行,對散熱介質(zhì)溫度與機(jī)房環(huán)境溫度要求很低,降低散熱介質(zhì)溫度控制成本進(jìn)一步節(jié)約能耗。
支持熱能回收
聯(lián)想溫水水冷系統(tǒng)可支持熱能回收進(jìn)行樓宇供暖等,不同于業(yè)內(nèi)常見的水溫保持在40~45攝氏度,聯(lián)想通過大量實(shí)驗(yàn)數(shù)據(jù)分析認(rèn)為,進(jìn)水的溫度最高50度,出水溫度58度左右,可以獲得最佳的能耗比和經(jīng)濟(jì)效用。一方面室外側(cè)散熱效率更高,甚至可實(shí)現(xiàn)自然冷卻;另一方面可直接滿足城市地暖、熱水供應(yīng)對水溫的要求,利于數(shù)據(jù)中心余熱利用。
標(biāo)準(zhǔn)化單元交付,減少包裝浪費(fèi)
聯(lián)想溫水水冷計算產(chǎn)品統(tǒng)一在工廠進(jìn)行機(jī)柜整裝,成系統(tǒng)、標(biāo)準(zhǔn)化交付,免除服務(wù)器等產(chǎn)品的分散包裝,進(jìn)一步降低客戶間接能耗與碳排放。
02 數(shù)據(jù)中心高性能穩(wěn)定運(yùn)行,Linpack效率近90%
并行水回路設(shè)計,防止系統(tǒng)抖動
聯(lián)想溫水水冷系統(tǒng)對服務(wù)器主要部件并行的水回路設(shè)計,即服務(wù)器中的兩顆CPU由并行的兩個水回路散熱,兩顆CPU溫度保持一致,進(jìn)而保證性能一致,通過提升頻率來提升性能,在確保溫度均勻性的同時防止熱抖動,從而保證CPU具有穩(wěn)定的性能表現(xiàn)。據(jù)測試,聯(lián)想為吉利部署的高性能計算中心,Linpack效率可近90%。
高散熱率下的高計算密度
與風(fēng)冷系統(tǒng)相比,聯(lián)想溫水水冷系統(tǒng)最高可達(dá)98%的熱移除效率,與極致的內(nèi)部空間利用率,讓數(shù)據(jù)中心在有限的空間內(nèi)可以容納更多服務(wù)器節(jié)點(diǎn),例如一個標(biāo)準(zhǔn)的42U企業(yè)級機(jī)柜,聯(lián)想溫水水冷系統(tǒng)可實(shí)現(xiàn)安裝72個計算節(jié)點(diǎn)。更高的計算密度,對于高性能計算這種動輒上千個節(jié)點(diǎn)的集群來說,可以大大節(jié)省空間。
無風(fēng)扇設(shè)計,散熱系統(tǒng)機(jī)械故障率接近于0
傳統(tǒng)風(fēng)冷散熱模塊的主要由風(fēng)扇組成,由于高性能計算中心運(yùn)算量大、運(yùn)算時間長,非常依賴計算單元的穩(wěn)定運(yùn)行。但傳統(tǒng)散熱機(jī)械機(jī)構(gòu),長時間在高溫度的環(huán)境下運(yùn)行,容易損壞,進(jìn)而影響服務(wù)器的計算效率甚至導(dǎo)致宕機(jī)。聯(lián)想溫水水冷服務(wù)器,取消了散熱模塊機(jī)械結(jié)構(gòu),使用了更加穩(wěn)定的水回路結(jié)構(gòu),極大降低了散熱模塊的故障率。
03 標(biāo)準(zhǔn)交付與安裝,極大降低安裝運(yùn)維成本
標(biāo)準(zhǔn)化交付與安裝
聯(lián)想溫水水冷系統(tǒng)計算產(chǎn)品統(tǒng)一在工廠進(jìn)行標(biāo)準(zhǔn)化機(jī)柜預(yù)裝(LESI),現(xiàn)場只需簡單安裝與部署,客戶幾乎可做到開箱即用,且標(biāo)準(zhǔn)化服務(wù)器機(jī)柜單元,后期運(yùn)維簡單明了,方便快捷。
支持熱插拔0滴漏
聯(lián)想溫水水冷系統(tǒng)支持熱插拔,0滴漏,符合數(shù)據(jù)中心傳統(tǒng)運(yùn)維、檢修習(xí)慣。
散熱介質(zhì)為溫水,成本低
相較于浸沒式液冷技術(shù),聯(lián)想溫水水冷技術(shù)的導(dǎo)熱介質(zhì)為去離子水,材料成本極低且綠色安全無毒。
更高兼容性提高利舊率
與標(biāo)準(zhǔn)機(jī)架和服務(wù)器兼容,對傳統(tǒng)數(shù)據(jù)中心的改造成本更低,提高利舊率。
通過聯(lián)想溫水水冷技術(shù)的應(yīng)用,可減少對精密空調(diào)和系統(tǒng)風(fēng)扇的需求,為數(shù)據(jù)中心節(jié)約42%的能耗和間接碳排放,也就是說,如果ChatGPT大模型采用了聯(lián)想溫水水冷技術(shù),每月最高可省電近500萬度,大約是10,000個家庭的月度電耗。而且與普通的風(fēng)冷系統(tǒng)PUE2.0相比,聯(lián)想PUE(數(shù)據(jù)中心總能耗/IT設(shè)備能耗)可以做到1.2甚至1.1以內(nèi),即1度電用于計算,只要0.1度電或者是0.2度電用于散熱,能源再利用效率ERE更是達(dá)到了業(yè)界領(lǐng)先。聯(lián)想溫水水冷技術(shù)融合科學(xué)計算和智能計算,打造覆蓋全行業(yè)的綠色低碳的智能基礎(chǔ)設(shè)施解決方案,目前已在多個高性能計算中心得到應(yīng)用。
聯(lián)想助力綠色冬奧
高性能計算系統(tǒng)年用電減少近200萬度
在北京冬奧會上,聯(lián)想為北京氣象局搭建了綠色高性能計算系統(tǒng),讓這次冰雪盛會可以做到每隔10分鐘更新一次氣象狀況,甚至可做到每分鐘更新。正是氣象高性能計算的“黑科技”支撐,北京奧運(yùn)會創(chuàng)造了冬奧會賽事服務(wù)史上的最高標(biāo)準(zhǔn)。通過“溫水水冷”技術(shù)的運(yùn)用,系統(tǒng)核心算力提升近20倍,滿足了7×24小時無休的天氣、氣候及環(huán)境氣象業(yè)務(wù)應(yīng)用需求,為復(fù)雜的山地百米級、分鐘級預(yù)報提供了算力保障,解決了這個國際公認(rèn)的難題。同時達(dá)到年用電減少近200萬度,相當(dāng)于節(jié)省了北京6000戶家庭一個月的用電量和100多萬棵樹的碳排放量。
上海交通大學(xué)“思源一號”
高性能計算集群 實(shí)現(xiàn)42%節(jié)能減排
以采用溫水水冷技術(shù)打造的上海交通大學(xué)“思源一號”綠色水冷高性能計算集群為例,“思源一號”總計算力為6千萬億次/秒(雙精度),在中國高校高性能計算排名第一,算力超過哈佛、劍橋等國際名校?!八荚匆惶枴本邆涑哂嬎忝芏扰c功耗密度、綠色節(jié)能、能源可循環(huán)利用三大技術(shù)特色:在計算密度方面,“思源一號”計算密度是通用數(shù)據(jù)中心的5倍,需要的機(jī)房面積不足通用機(jī)房的1/10;在綠色節(jié)能方面,“思源一號”采用第五代溫水水冷技術(shù),PUE降低至1.1左右,實(shí)現(xiàn)42%的節(jié)能減排;在能源利用方面,用余熱回收技術(shù),計算機(jī)運(yùn)算過程中產(chǎn)生的余熱,能夠用于研究所球形大廳的冬季供暖、食堂廚房的熱水加熱、地下室除濕,以及實(shí)驗(yàn)室的空調(diào)溫控,實(shí)現(xiàn)每年950噸的額外碳補(bǔ)償。
吉利汽車高性能計算集群:
中國制造行業(yè)首個水冷仿真集群
Linpack效率近90%
汽車仿真計算是高性能計算機(jī)的一個重要應(yīng)用場景,在聯(lián)想為吉利汽車打造的高性能計算集群中,全面采用聯(lián)想第五代溫水水冷技術(shù),理論峰值可達(dá)3.536PFlops,Linpack效率高達(dá)近90%,為吉利汽車的汽車設(shè)計、生產(chǎn)與測試等提供了強(qiáng)勁的算力保障。同時,此項(xiàng)目還開創(chuàng)了高性能計算與xCloud云計算相結(jié)合的先例,讓高性能算力更靈活的助力業(yè)務(wù)實(shí)際應(yīng)用。基于共同的低碳理念與先進(jìn)技術(shù),聯(lián)想與吉利將持續(xù)深化合作,共同打造綠色低碳在制造行業(yè)的最佳實(shí)踐。
目前,聯(lián)想溫水水冷技術(shù)已連續(xù)多年入選工業(yè)和信息化部編制的《國家綠色數(shù)據(jù)中心先進(jìn)適用技術(shù)產(chǎn)品名錄》,并被選入國家互聯(lián)網(wǎng)信息辦公室主辦的首部《攜手構(gòu)建網(wǎng)絡(luò)空間命運(yùn)共同體實(shí)踐案例集》。聯(lián)想溫水水冷技術(shù)已成為我國推廣高效節(jié)能技術(shù)的卓越實(shí)踐與行業(yè)標(biāo)桿。
憑借業(yè)內(nèi)領(lǐng)先的低碳節(jié)能技術(shù)與業(yè)務(wù)布局,聯(lián)想已經(jīng)成為高性能計算產(chǎn)業(yè)綠色發(fā)展的領(lǐng)導(dǎo)者。未來,聯(lián)想也將持續(xù)以綠色算力釋放行業(yè)新動能,助力百業(yè)千行綠色低碳轉(zhuǎn)型,賦能數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展。