挑戰(zhàn)英偉達(dá)?微軟擬推AI芯片雅典娜:訓(xùn)練大語言模型 成本能省三分之一
為突圍芯片短缺困境,微軟擬推出自研人工智能芯片。
(相關(guān)資料圖)
當(dāng)?shù)貢r(shí)間4月18日,據(jù)美國科技媒體The Information報(bào)道,微軟(Microsoft)準(zhǔn)備推出人工智能芯片,為負(fù)責(zé)理解和生成類人語言的大型語言模型(LLM)提供動(dòng)力。
兩位直接了解相關(guān)項(xiàng)目的人士透露,微軟自2019年開始開發(fā)內(nèi)部代號(hào)為“雅典娜”(Athena)的芯片。據(jù)悉,微軟已向一小部分微軟與OpenAI員工提供這款芯片,他們正在測(cè)試這項(xiàng)技術(shù)。微軟希望這款芯片比目前從其他供應(yīng)商出采購的芯片性能更好,從而為其昂貴的人工智能研發(fā)節(jié)省時(shí)間和金錢。
雅典娜芯片將用于生成式人工智能所需的大型語言模型訓(xùn)練。目前,英偉達(dá)(Nvidia)在此類芯片市場(chǎng)上占據(jù)主導(dǎo)地位。據(jù)估計(jì),OpenAI需要3萬多個(gè)英偉達(dá)的A100 GPU來實(shí)現(xiàn)ChatGPT的商業(yè)化,而英偉達(dá)最新的H100 GPU在eBay上售價(jià)超過4萬美元。
據(jù)了解,亞馬遜、谷歌和Facebook等科技巨頭也在自主開發(fā)人工智能芯片,但仍需依賴英偉達(dá)的的芯片來支持大型語言模型的訓(xùn)練。The Information稱,整個(gè)科技行業(yè)正在面臨的芯片短缺迫使微軟只能定量供應(yīng)部分內(nèi)部團(tuán)隊(duì)的電腦。
雖然微軟為其云計(jì)算業(yè)務(wù)開發(fā)服務(wù)器芯片的消息廣為人知,但此前從未有過關(guān)于雅典娜芯片的報(bào)道。知情人士聲稱,微軟至少有300人在開發(fā)雅典娜芯片。研究公司SemiAnalysis首席分析師迪倫·帕特爾(Dylan Patel)表示,開發(fā)類似于雅典娜的芯片可能每年需要花費(fèi)1億美元左右。
帕特爾認(rèn)為,ChatGPT每天的運(yùn)營成本約為70萬美元,大部分成本是基于他們所需的昂貴服務(wù)器?!叭绻诺淠刃酒c英偉達(dá)的產(chǎn)品擁有同等競(jìng)爭(zhēng)力,每個(gè)芯片的成本可以降低三分之一。”
“微軟希望將大語言模型應(yīng)用于包括必應(yīng)、Office 365(現(xiàn)在的Microsoft 365)、GitHub在內(nèi)的所有應(yīng)用程序中。如果使用現(xiàn)成的硬件進(jìn)行大規(guī)模部署,每年將花費(fèi)數(shù)百億美元。”帕特爾補(bǔ)充道。
今年2月,微軟推出搭載ChatGPT同源功能的新版必應(yīng)(Bing),嘗試通過與OpenAI的合作關(guān)系從谷歌手中奪取搜素引擎的市場(chǎng)份額。
據(jù)知情人士透露,最早在明年,微軟可能就會(huì)將雅典娜芯片廣泛應(yīng)用于公司內(nèi)部和OpenAI,但微軟仍在討論是否向其Azure云計(jì)算服務(wù)的客戶提供這些芯片。
2019年起,微軟宣布向OpenAI進(jìn)行數(shù)十億美元的投資,同時(shí)微軟Azure也成為了OpenAI的獨(dú)家云計(jì)算服務(wù)商。同一時(shí)期,微軟高層開始規(guī)劃需要多少GPU來支持所有的人工智能方面的工作。
目前微軟為OpenAI打造的超級(jí)計(jì)算系統(tǒng)主要依賴于英偉達(dá)的芯片。去年11月,微軟和英偉達(dá)宣布了一項(xiàng)為期多年的合作計(jì)劃,共同打造下一代超級(jí)計(jì)算機(jī)。因此,微軟對(duì)雅典娜芯片的開發(fā)對(duì)于雙方關(guān)系而言較為敏感。
一位直接了解該項(xiàng)目的人士透露,微軟已經(jīng)為未來幾代雅典娜芯片制定了技術(shù)路線圖,預(yù)計(jì)初代芯片將基于5納米工藝。如果雅典娜芯片于明年投入量產(chǎn),這種芯片制造工藝將比最先進(jìn)的工藝落后一代。
“微軟不認(rèn)為自己的人工智能芯片可以全面取代英偉達(dá)的產(chǎn)品。如果微軟在自研芯片上的努力獲得成功,也有可能有助于在未來與英偉達(dá)談判獲取更多的話語權(quán)?!痹撝槿耸勘硎尽?/p>