圖片來源:世界經(jīng)濟(jì)論壇官網(wǎng)
科技日報(bào)記者?劉霞
世界經(jīng)濟(jì)論壇官網(wǎng)近日報(bào)道指出,為讓人工智能(AI)發(fā)揮其變革潛力、提高生產(chǎn)力水平及社會(huì)福祉,人類必須確保它可持續(xù)地發(fā)展。這一愿景面臨的核心難題在于,隨著算力和性能的不斷提升,能耗也在快速增長。
AI生態(tài)系統(tǒng),從硬件、訓(xùn)練協(xié)議到操作技術(shù),都會(huì)耗費(fèi)大量能源。鑒于此,科學(xué)家正在設(shè)法讓其更節(jié)能。措施包括改變AI的運(yùn)行策略、研制更節(jié)能的算法和芯片等。
能源“吞金獸”
AI是能源密集型技術(shù)。它究竟有多耗能?數(shù)據(jù)給出了答案。
據(jù)法國《回聲報(bào)》網(wǎng)站報(bào)道,AI平臺(tái)“抱抱臉”研究員兼環(huán)境問題主管薩沙·盧喬尼表示,Midjourney或Dall-E等AI算法生成一張圖片消耗的電力,相當(dāng)于給一部智能手機(jī)充滿電。一塊英偉達(dá)H100型圖形處理單元一年消耗的電量,比一個(gè)中等規(guī)模的美國家庭一年所耗的電量還要多。
美國《哈佛雜志》網(wǎng)站提出,大語言模型在生成類似人類、連貫且符合上下文邏輯的文本方面做得更好。但這種改進(jìn)也有代價(jià),訓(xùn)練GPT-3消耗的能源相當(dāng)于120個(gè)美國家庭一年消耗的能源。美國《紐約時(shí)報(bào)》的報(bào)道更是驚人,ChatGPT每天要響應(yīng)大約2億個(gè)請求,這一過程中消耗超過50萬度電。
世界經(jīng)濟(jì)論壇的數(shù)據(jù)顯示,運(yùn)行AI任務(wù)所需的能源消耗,年增長率介于26%至36%之間。這意味著到2027年,AI行業(yè)消耗的能源堪比冰島或荷蘭等國家一年的能耗。
改變運(yùn)行策略
讓AI更節(jié)能勢在必行。
首先是調(diào)整AI運(yùn)行策略。世界經(jīng)濟(jì)論壇官網(wǎng)指出,AI運(yùn)行一般分兩個(gè)主要階段:訓(xùn)練階段和推理階段。在訓(xùn)練階段,模型通過消化大量數(shù)據(jù)來學(xué)習(xí)和開發(fā);經(jīng)過訓(xùn)練后,它們進(jìn)入推理階段,用于解決使用者提出的問題。在這兩個(gè)階段限制能耗,可將AI運(yùn)行總能耗降低12%到15%。
美國俄勒岡州立大學(xué)電氣工程與計(jì)算機(jī)科學(xué)學(xué)院托馬斯·迪特瑞克教授指出,另一個(gè)有效的策略是優(yōu)化調(diào)度以節(jié)省能源。例如,在夜間運(yùn)行輕量級的任務(wù),或在寒冷的月份運(yùn)行更大的項(xiàng)目等,也可節(jié)省大量能源。此外,將AI處理轉(zhuǎn)移到數(shù)據(jù)中心也有助于減少其碳排放,因?yàn)閿?shù)據(jù)中心的運(yùn)行效率非常高,其中有些運(yùn)行使用了綠色能源。
從長遠(yuǎn)看,促進(jìn)AI與新興量子技術(shù)的協(xié)同也是引導(dǎo)AI走向可持續(xù)發(fā)展的重要戰(zhàn)略。傳統(tǒng)計(jì)算能耗隨計(jì)算需求增加呈指數(shù)級增長,而量子計(jì)算和能耗之間呈線性增長。
此外,量子技術(shù)可使AI模型更緊湊、學(xué)習(xí)效率更高并可改善其整體功能。
新模型和新器件
AI公司之間競爭的一個(gè)驅(qū)動(dòng)力是相信越大越好,這也意味著參數(shù)越來越多,能耗越來越大。例如,GPT-4擁有1.8萬億個(gè)參數(shù),而其“前身”GPT-3擁有1750億個(gè)參數(shù)。因此,為讓AI更節(jié)能,不少科學(xué)家正在嘗試找出不需要那么多參數(shù)的算法。
HawAI.tech公司使用了新型電子元器件和基于概率論的AI技術(shù)來節(jié)省能耗。在相同時(shí)段和能耗下,新器件運(yùn)算速度是英偉達(dá)Jeston芯片的6.4倍。該公司聯(lián)合創(chuàng)始人兼首席執(zhí)行官拉斐爾·弗里施表示,結(jié)合概率論和更優(yōu)化的電子元器件,他們的解決方案所用的數(shù)據(jù)和能源會(huì)更少。
此外,模擬人腦功能的神經(jīng)形態(tài)芯片也有望提升AI的效率。近日,英特爾公司發(fā)布了名為Hala Point的大型神經(jīng)擬態(tài)系統(tǒng)。其內(nèi)置1152個(gè)基于Intel四制程的Loihi 2處理器,支持多達(dá)11.5億個(gè)神經(jīng)元和1280億個(gè)突觸,每秒可處理超過380萬億個(gè)8位突觸和超過240萬億個(gè)神經(jīng)元操作。它獨(dú)特的功能可實(shí)現(xiàn)未來AI應(yīng)用的實(shí)時(shí)持續(xù)學(xué)習(xí),如解決科學(xué)和工程問題、物流、智能城市基礎(chǔ)設(shè)施管理、大語言模型和AI代理等。