电竞比分网-中国电竞赛事及体育赛事平台

分享

Google使用機器學(xué)習(xí)助力數(shù)據(jù)中心節(jié)能

 好吃好看分子 2016-12-19

虛擬的網(wǎng)絡(luò)世界都是以現(xiàn)實世界為基礎(chǔ)的。當(dāng)我們?yōu)g覽網(wǎng)站、發(fā)送郵件、上傳視頻灌水論壇時,這些數(shù)據(jù)都將流經(jīng)占地面積超過足球場的數(shù)據(jù)中心。數(shù)據(jù)中心內(nèi)成千上萬臺服務(wù)器每秒鐘消耗的能源都非常驚人。全世界所有的數(shù)據(jù)中心消耗的能源總和約占全世界用電量的2%,如果不加以控制,能源的消耗也將會如同互聯(lián)網(wǎng)使用一樣大爆發(fā)。所以,給數(shù)據(jù)中心能源消耗瘦身這一任務(wù)迫在眉睫。

好在近些年來出現(xiàn)了各種提升能源效率的方法,盡管數(shù)據(jù)中心的規(guī)模不斷擴大,但其總電能消耗已經(jīng)趨于平和。數(shù)據(jù)中心的能源消耗標(biāo)準(zhǔn)衡量單位PUE(電力使用效率)受很多因素影響。一個典型的數(shù)據(jù)中心需要配備多種設(shè)備,比如水機組、冷卻塔、水泵、換熱器和控制系統(tǒng),每個設(shè)備都有各自的設(shè)置,并且它們相互影響、錯綜復(fù)雜。外加空氣溫度、風(fēng)扇轉(zhuǎn)速等因素,整個系統(tǒng)的復(fù)雜度成為天文數(shù)字。我們簡單假設(shè)這個機房只有10套設(shè)備,每個設(shè)備有10組參數(shù),那就有10^10組配置參數(shù),即達到了百億級別。但真實環(huán)境下的可能配置項遠不止這些。

Google使用機器學(xué)習(xí)助力數(shù)據(jù)中心節(jié)能

位于比利時數(shù)據(jù)中心的冷卻塔

谷歌在規(guī)劃數(shù)據(jù)中心的時候,都將數(shù)據(jù)中心的能源效率一并考慮。很久以前,谷歌就決定從頭開始自行設(shè)計和建設(shè)數(shù)據(jù)中心,以便于應(yīng)用最先進的冷卻技術(shù)和運行策略。谷歌的數(shù)據(jù)中心盡可能采用先進的蒸發(fā)式冷卻和外部空氣冷卻來替代傳統(tǒng)的機械式冷水機。他們安裝了智能溫控和光控系統(tǒng),并重新設(shè)計電力布線。他們的定制化高性能服務(wù)器砍去了視頻卡等不必要組件,提高服務(wù)器的使用率,諸多的舉措都為了減少能源損失。

截至2014年春,谷歌數(shù)據(jù)中心的能耗只有業(yè)界平均水平的50%。那么,接下去的問題就是如何進一步瘦身。一位名叫Jim Gao的谷歌工程師,受到網(wǎng)上機器學(xué)習(xí)課程的啟發(fā),決心找出問題的答案。

機器學(xué)習(xí)的核心在于教會計算機如何從大量數(shù)據(jù)中自學(xué)知識,而不需要工程師開發(fā)代碼去告訴計算機這些知識。谷歌早已用機器學(xué)習(xí)來改善谷歌翻譯、圖像識別等產(chǎn)品。

Google使用機器學(xué)習(xí)助力數(shù)據(jù)中心節(jié)能

數(shù)據(jù)中心內(nèi)的水閥和壓力傳感器

Gao希望用“探索數(shù)據(jù)內(nèi)部奧秘”的方法來幫助他更好地理解數(shù)據(jù)中心的海量信息。在日以繼夜地忙碌了6個月之后,他終于為數(shù)據(jù)中心內(nèi)的所有組件搭建了一套概念證明模型。他說“這只是個非?;A(chǔ)的原型,用以證明我的想法是可行的,值得去繼續(xù)探索”。

最初的結(jié)果并不十分理想“第一次預(yù)測完全失敗”,Gao自己承認“model在預(yù)測PUE和我們的行為序列時表現(xiàn)的不好”。模型認為使得節(jié)能最大化的辦法是關(guān)閉整套系統(tǒng),然而這個建議對工程師們并沒有什么用。于是,Gao重新仿真運行,不斷調(diào)整模型使得其預(yù)測結(jié)果最接近有效的配置,這也意味著達到了節(jié)能最大化的目標(biāo)。當(dāng)他覺得自己的模型已經(jīng)足夠準(zhǔn)確之后,Gao發(fā)表了一份 白皮書 ,然后與駐場運維團隊一起實現(xiàn)此系統(tǒng)。

與此同時,谷歌的人工智能研究團隊DeepMind發(fā)表的一篇關(guān)于DQN的 論文 引起了不小的轟動,這是一個會玩Atari游戲的機器人,所有Atari游戲。訓(xùn)練會玩一種游戲的模型是一回事,讓程序自學(xué)掌握所有的游戲的難度則有天壤之別。這是機器學(xué)習(xí)社區(qū)的一個重磅消息,當(dāng)Gao聽聞此消息之后,他立即給DeepMind的領(lǐng)導(dǎo)Mustafa Suleyman寫了封郵件,主題為“機器學(xué)習(xí)+數(shù)據(jù)中心=搞一個大新聞?”

Suleyman支持Gao的想法,DeepMind開始于Gao的數(shù)據(jù)中心智能化(DCIQ)團隊合作研發(fā)更穩(wěn)健和通用的模型。

Google使用機器學(xué)習(xí)助力數(shù)據(jù)中心節(jié)能

Jim Gao在工作現(xiàn)場

18個月之后,他們合作研發(fā)的模型已經(jīng)用在了多個系統(tǒng)中,并且使得冷卻系統(tǒng)減少了40%的能耗,總體能耗下降15%。DCIQ團隊認為這只是一些微不足道的成績,機器學(xué)習(xí)還能在這個領(lǐng)域發(fā)揮出更大的作用。谷歌的環(huán)保團隊希望模型能降低系統(tǒng)的碳排放量,硬件運維希望降低設(shè)備的故障率,平臺團隊更關(guān)心服務(wù)器的能源消耗。機器學(xué)習(xí)能幫助大家實現(xiàn)各自的愿望。

Gao說道“我們堅信我們正在做的工作可以造福所有人”。即將發(fā)布的第二本白皮書將會介紹更多關(guān)于DCIQ的細節(jié),也許對很多其他企業(yè)也會有幫助,比如發(fā)電廠、工廠等等。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多