智算中心建設面臨閑置與虧損問題,政府調(diào)整投資節(jié)奏與能耗指標政策
智算中心在全國各地陸續(xù)建立,卻不幸陷入了諸多困境。不論是國內(nèi)的還是依賴英偉達的設施,閑置和虧損都成為了明顯的難題。政府已經(jīng)注意到了這個問題,那么,我們是否應該重新考慮智算中心的布局和發(fā)展步伐?
智算中心的閑置現(xiàn)狀
多地智算中心建設初期便顯現(xiàn)出閑置問題。一些城市不惜投入巨資建設,動用了眾多資源。然而,由于種種原因,這些智算中心設備多數(shù)時間閑置,未能充分發(fā)揮效用。觀察運營主體,雖然投入了大量資金,卻因業(yè)務量不足而出現(xiàn)虧損,部分運營主體甚至陷入收支不平衡的困境。
各地情況不一,有的地方因能耗指標等原因與供應商協(xié)商耗時過長,建設進度因而緩慢;另一些地方雖然建設迅速,卻因需求不足而虧損嚴重,這些問題亟需解決,高層也開始重視這一問題。
算力需求的不平衡
大模型的算力需求情形相對復雜。在超大規(guī)模大模型訓練方面,算力供應明顯不足。然而,在其他大模型的算力需求上,情況并非緊急。眾多企業(yè)實際上能夠采用國產(chǎn)AI芯片,無需依賴最新的英偉達GPU。綜合考慮成本、價格以及易用性等因素,當前形勢下,企業(yè)有其他選擇。
不少企業(yè)在多種場合下會選用消費級顯卡,這樣做既減少了開支,又能夠滿足使用需求。消費者可以觀察到,并非所有情況下都必須追求最頂級的設備,這種選擇是企業(yè)根據(jù)自身需要做出的考量。
網(wǎng)絡與調(diào)度的難題
網(wǎng)絡對大模型有了全新的要求。以往未曾出現(xiàn)如此需求模式,因此目前尚無完全成熟的網(wǎng)絡解決方案。各種網(wǎng)絡方案正邊探索邊實施。實際上,網(wǎng)絡技術對智算中心的規(guī)模構建起著決定性的影響。
然而,當算力集群規(guī)模較小時,網(wǎng)絡處理相對簡單,但規(guī)模與效率難以兼顧。為此,我們亟需一種高靈活度的計算任務調(diào)度策略,以提升資源利用率,并使算力價格更為公道。然而,要實現(xiàn)這一目標,必須攻克眾多技術難關。
海外生態(tài)體系依賴
我國智算中心普遍依賴海外生態(tài)體系。目前看來,還需大約三到五年的時間來過渡。若此刻盲目加快智算中心的建設步伐,必將造成嚴重資源浪費。類似的情況,許多企業(yè)囤積英偉達卡,卻缺少構建智算中心所需的網(wǎng)絡、調(diào)度及運維能力,結果只能是算力被浪費。
我國在智算中心技術領域與國外相比還有較大差距,目前我們正處于依賴階段,要想實現(xiàn)完全自給自足尚有難度。然而,行動的起點應當從現(xiàn)在開始。
運營管理的欠缺
智算中心的運營管理現(xiàn)狀并不理想。其中,專業(yè)技術人才的短缺和高效管理團隊的缺失,都可能導致一系列問題。若缺乏相應的人才支持,智算中心的設備效能恐難得到充分發(fā)揮。
現(xiàn)實中有一個鮮明的例子,那就是設備閑置和資源浪費的現(xiàn)象時有發(fā)生。這就像擁有了精良的武器卻無人能駕馭,智算中心雖然配備了強大的設備和卓越的性能,卻因缺乏人才而無法充分發(fā)揮其潛力。
政策調(diào)整的新導向
從政策的角度來看,政府對智算中心的要求如今更為嚴格。以往,只要建成即可,但如今,從建設之初就必須考慮選擇合適的運營方,或者選擇建設與運營相結合的模式。這一做法旨在提升算力的利用率。
當前市場狀況下,眾多大型模型制造商削減了預訓練規(guī)模,那些以往熱衷于囤積算力的企業(yè),如今亦無需大量租用外部算力。在這種背景下,智算中心唯有拓展推理應用場景,落地更多實際應用,并使終端用戶更加分散,方能更有利于市場的整體健康發(fā)展。那么,大家覺得智算中心應如何突破這一困境?期待大家的分享與點贊,共同探討。
作者:小藍
鏈接:http://www.yunyix1.cn/content/4897.html
本站部分內(nèi)容和圖片來源網(wǎng)絡,不代表本站觀點,如有侵權,可聯(lián)系我方刪除。