【文/觀察者網(wǎng) 呂棟】
(相關(guān)資料圖)
到目前為止,如果要評(píng)選2023年最熱的概念,非AI大模型莫屬。這輪由ChatGPT引爆的技術(shù)熱潮,經(jīng)過一段時(shí)間的發(fā)酵,已在國(guó)內(nèi)迎來爆發(fā)期,互聯(lián)網(wǎng)大廠紛紛躬身入局。人們也似乎越來越認(rèn)識(shí)到,大模型是通往通用人工智能(AGI)最明確的路徑。
在此背景下,商湯科技也厚積薄發(fā),于近期正式推出了自研AI大模型體系“日日新SenseNova”,其中不僅包含語(yǔ)言大模型,還擁有AI文生圖創(chuàng)作、2D/3D數(shù)字人生成、大場(chǎng)景/小物體生成等一系列生成式AI模型及應(yīng)用。
在這輪AI大模型浪潮中,由于ChatGPT率先出圈,不少人認(rèn)為,中國(guó)企業(yè)只是隨波逐流,跟風(fēng)模仿,甚至只是概念炒作。但實(shí)際上,想要推出一個(gè)經(jīng)得起考驗(yàn)的大模型,絕不可能一蹴而就。國(guó)內(nèi)已推出大模型的企業(yè)中,均有著長(zhǎng)期規(guī)劃,商湯自然也早有準(zhǔn)備。
在算力、數(shù)據(jù)和應(yīng)用場(chǎng)景等大模型核心能力上,商湯科技已處于國(guó)內(nèi)B端第一梯隊(duì)。其前瞻布局的AI大裝置SenseCore,擁有2.7萬(wàn)塊GPU,可以輸出5.0 exaFLOPS的總算力,是亞洲目前最大的智算平臺(tái)之一,也是商湯自研大模型體系的關(guān)鍵基礎(chǔ)設(shè)施。
基于“大模型+大算力”雙輪布局,無(wú)論在當(dāng)下還是未來,商湯科技都對(duì)中國(guó)AI產(chǎn)業(yè)界具有重要的戰(zhàn)略價(jià)值和意義。
千億參數(shù)大模型,驚艷亮相
4月10日,在距上海市中心近百公里的臨港,商湯科技在自己的智算中心舉辦技術(shù)交流日,現(xiàn)場(chǎng)投資者、分析師、記者等人流攢動(dòng),座無(wú)虛席。在大模型持續(xù)爆火幾個(gè)月后,大家依然非常期待這個(gè)人工智能領(lǐng)域的頭部企業(yè)能拿出更亮眼的作品。
商湯科技不負(fù)眾望,董事長(zhǎng)兼CEO徐立登場(chǎng)后,正式發(fā)布了國(guó)內(nèi)首個(gè)大模型體系——“日日新SenseNova”。該名稱出自《禮記·大學(xué)》中湯之《盤銘》:茍日新、日日新、又日新。這個(gè)名字也承載了商湯對(duì)大模型快速迭代、走向通用人工智能(AGI)的希冀。
由于ChatGPT持續(xù)火熱,加之百度和阿里相繼推出“文心一言”和“通義千問”,語(yǔ)言類大模型為人所熟知。在最新的大模型體系中,商湯也推出了自研語(yǔ)言大模型“商量SenseChat”。
與之前語(yǔ)音交互、圖像識(shí)別等AI應(yīng)用類似,語(yǔ)言大模型也被用于人機(jī)交互,人們能通過文字和機(jī)器對(duì)話,獲得內(nèi)容。但語(yǔ)言大模型的突破之處在于,它是真正在嘗試?yán)斫馊藗兊南敕?,并基于大?shù)據(jù)集生成內(nèi)容,而不是簡(jiǎn)單對(duì)比和匹配,這意味著AI擁有了一定的自學(xué)習(xí)能力。