速度翻倍、安全加密、調(diào)用GPT-4無(wú)上限,今天凌晨,OpenAI官宣的企業(yè)專用版ChatGPT堪稱“最強(qiáng)ChatGPT版本”!
(相關(guān)資料圖)
同普通版ChatGPT相比,企業(yè)版性能更加強(qiáng)大,包括:提供無(wú)限制的GPT-4訪問(wèn),速度提升2倍,支持無(wú)限制高級(jí)數(shù)據(jù)分析,支持可用于4倍輸入和文件的32k Tokens上下文窗口,提供可共享的聊天模板和免費(fèi)的API接口、保證企業(yè)的數(shù)據(jù)隱私和安全等。
除了目前適合大型企業(yè)的版本之外,OpenAI還將很快推出適用于各類小型團(tuán)隊(duì)的自助式 ChatGPT Business 產(chǎn)品,服務(wù)于所有規(guī)模和類型的組織。也就是說(shuō),從今天開始,OpenAI已然吹響了向B端市場(chǎng)全面進(jìn)攻的號(hào)角。
自然,這就帶來(lái)了一個(gè)問(wèn)題:面向企業(yè)的B端AI大模型市場(chǎng),會(huì)“贏家通吃”嗎?
最近,美國(guó)光速創(chuàng)投(Lightspeed Venture Partners)合伙人Guru Chahal深度分析了這一問(wèn)題。
作者認(rèn)為,B端最有可能的路徑,是企業(yè)在探索階段使用大型模型,隨著在實(shí)際使用中對(duì)大模型理解的加深,逐漸轉(zhuǎn)向生產(chǎn)階段使用更小型、專業(yè)化(調(diào)整+精煉)的模型。
Chahal還提到了企業(yè)在選擇模型時(shí)需要考慮的因素,以及AI基礎(chǔ)設(shè)施的發(fā)展機(jī)遇,包括評(píng)估框架、模型運(yùn)行與維護(hù)、增強(qiáng)系統(tǒng)、運(yùn)維工具、數(shù)據(jù)利用等各個(gè)方面。
文章干貨很足,相信對(duì)想了解B端AI市場(chǎng)、AI基礎(chǔ)設(shè)施、未來(lái)機(jī)遇等方面的朋友一定大有裨益。
以下為全文內(nèi)容,大家enjoy~[gf]270c[/gf][gf]fe0f[/gf]
目錄:
在過(guò)去的十?dāng)?shù)年里,作為L(zhǎng)ightspeed團(tuán)隊(duì)一員,我親歷了人工智能和機(jī)器學(xué)習(xí)領(lǐng)域的驚人創(chuàng)新,這主要?dú)w功于我們與卓越創(chuàng)業(yè)者的深度合作。
現(xiàn)在,我們與他們的公司、所構(gòu)建的平臺(tái),以及服務(wù)的客戶進(jìn)一步合作交流,以便更系統(tǒng)地了解企業(yè)如何思考生成式AI。
具體來(lái)說(shuō),我們深入探究了大模型生態(tài)系統(tǒng),嘗試探討諸如“性能最強(qiáng)大模型是否會(huì)贏家通吃?”、“企業(yè)在使用時(shí)是否會(huì)一味依賴OpenAI的API,還是選擇更加多樣化的實(shí)際用例?”這一類問(wèn)題。
這些問(wèn)題的答案,將決定該未來(lái)大模型生態(tài)系統(tǒng)的增長(zhǎng)方向,以及算力、人才和資金的流向。
大模型生態(tài)系統(tǒng)分類
根據(jù)我們的研究,我們認(rèn)為,人工智能領(lǐng)域正在經(jīng)歷一次“寒武紀(jì)式”的模型大爆發(fā)。未來(lái),開發(fā)者和企業(yè)將根據(jù)實(shí)際需求選擇最適合的模型,盡管在探索階段的使用的可能更加集中。
B端最有可能的路徑,是企業(yè)在探索階段使用大型模型,隨著在實(shí)際使用中對(duì)大模型理解的加深,逐漸轉(zhuǎn)向生產(chǎn)階段使用更小型、專業(yè)化(調(diào)整+精煉)的模型。
下圖展示了我們對(duì)基礎(chǔ)模型生態(tài)系統(tǒng)演化的看法。
我們認(rèn)為,人工智能模型領(lǐng)域可以分為三個(gè)主要、但又有些交叉的類別:
類別1:巨腦模型
這些是最優(yōu)秀的模型,也是模型領(lǐng)域的先驅(qū)。它們產(chǎn)生了令人驚嘆的演示效果,深深吸引了我們的注意。當(dāng)開發(fā)者試圖探索人工智能對(duì)其應(yīng)用的潛力極限時(shí),這些模型往往是默認(rèn)的起點(diǎn)。
這些模型的訓(xùn)練成本高,維護(hù)和擴(kuò)展復(fù)雜。但同一個(gè)模型可以應(yīng)對(duì)法學(xué)院入學(xué)考試(LSAT)、醫(yī)學(xué)院入學(xué)考試(MCAT),撰寫高中論文,并像聊天機(jī)器人朋友一樣與你互動(dòng)。目前,開發(fā)者正在這些模型上進(jìn)行實(shí)驗(yàn),并評(píng)估在企業(yè)應(yīng)用中的人工智能使用情況。
需要注意的是,這些模型的使用成本高,推理延遲較大,并且在明確定義的受限用例中可能過(guò)于復(fù)雜。
同時(shí),這些模型是通用模型,可能在專業(yè)任務(wù)上不夠準(zhǔn)確(例如,參見(jiàn)康奈爾大學(xué)等的綜合研究)。
而且,它們也是黑匣子,可能給企業(yè)帶來(lái)隱私和安全挑戰(zhàn),企業(yè)正在探索如何在不泄露數(shù)據(jù)的情況下利用這些模型。
OpenAI、Anthropic、Cohere都屬于這一類別。
類別2:挑戰(zhàn)者模型
這些模型同樣具有高能力,僅次于領(lǐng)先模型。Llama 2和Falcon是這一類別中的佼佼者。它們通常與類別1模型中的“N-1”或“N-2”模型一樣優(yōu)秀。
據(jù)某些基準(zhǔn)測(cè)試,Llama 2 甚至與GPT-3.5-turbo相媲美。通過(guò)在企業(yè)數(shù)據(jù)上進(jìn)行調(diào)整,這些模型在特定任務(wù)上的能力可與類別1中模型相當(dāng)。
其中許多模型是開源的(或非常接近)。一旦發(fā)布,它們往往會(huì)被開源社區(qū)迅速改進(jìn)和優(yōu)化。
類別3:長(zhǎng)尾模型
這些是“專家”模型。它們專為特定目標(biāo)構(gòu)建,例如對(duì)文件進(jìn)行分類、識(shí)別圖像或視頻中的特定屬性、識(shí)別商業(yè)數(shù)據(jù)中的模式等。這些模型靈活,訓(xùn)練和使用成本低,可以在數(shù)據(jù)中心或邊緣上運(yùn)行。
僅需瀏覽Hugging Face,即可窺見(jiàn)這一生態(tài)系統(tǒng)的廣度之大,未來(lái)還會(huì)因?yàn)樗鼮楦鞣N用例提供服務(wù)而不斷擴(kuò)大!
將用例與模型匹配
盡管尚處于早期階段,但我們已經(jīng)看到一些領(lǐng)先的開發(fā)團(tuán)隊(duì)和企業(yè)開始以這種精細(xì)的方式思考這個(gè)生態(tài)系統(tǒng)。他們渴望將用例與最適合的模型匹配,甚至可能在更復(fù)雜的用例中使用多個(gè)模型。
在選擇使用哪個(gè)/哪些模型方面,通常會(huì)考慮以下因素:
a. 數(shù)據(jù)隱私和合規(guī)要求,這會(huì)影響模型是在企業(yè)基礎(chǔ)架構(gòu)中運(yùn)行,還是數(shù)據(jù)可以發(fā)送到外部托管的推理終端。
b. 能否對(duì)模型進(jìn)行微調(diào)對(duì)這個(gè)用例是否至關(guān)重要或者強(qiáng)烈希望進(jìn)行微調(diào)。
c. 期望的推理“性能”水平(延遲、準(zhǔn)確性、成本等)。
實(shí)際清單通常比上述內(nèi)容更長(zhǎng),反映了開發(fā)者希望利用人工智能解決的各種多樣用例。
機(jī)遇在哪里
這一新興生態(tài)系統(tǒng)產(chǎn)生了幾個(gè)重要影響:
① 評(píng)估框架:企業(yè)將需要工具和專業(yè)知識(shí),來(lái)評(píng)估哪個(gè)模型適合哪個(gè)用例。
開發(fā)者需要決定如何最好地評(píng)估特定模型是否適合“所需工作”。評(píng)估需要考慮多個(gè)因素,不僅包括模型性能,還包括成本、可以行使的控制水平等。
② 運(yùn)行和維護(hù)模型:預(yù)計(jì)將出現(xiàn)用于幫助企業(yè)訓(xùn)練、微調(diào)和運(yùn)行模型的平臺(tái),特別是第三類長(zhǎng)尾模型。
這些平臺(tái)過(guò)去通常被稱為ML Ops平臺(tái),我們預(yù)計(jì)這個(gè)定義將擴(kuò)展到包括生成式人工智能。Databricks、Weights and Biases、Tecton等平臺(tái)正在迅速朝這個(gè)方向發(fā)展。
③ 增強(qiáng)系統(tǒng):模型,特別是托管的LLM(檢索增強(qiáng)模型),需要通過(guò)增強(qiáng)生成提供卓越的結(jié)果。
這涉及做出次級(jí)決策,包括:
o 數(shù)據(jù)和元數(shù)據(jù)攝?。?/strong>如何連接結(jié)構(gòu)化和非結(jié)構(gòu)化的企業(yè)數(shù)據(jù)源,然后攝取數(shù)據(jù)以及關(guān)于訪問(wèn)策略等方面的元數(shù)據(jù)。
o 生成和存儲(chǔ)嵌入:選擇用于為數(shù)據(jù)生成嵌入的模型。然后,如何存儲(chǔ)這些嵌入:根據(jù)所需性能、規(guī)模和功能選擇哪個(gè)向量數(shù)據(jù)庫(kù)?
在這里,存在機(jī)會(huì)來(lái)構(gòu)建面向企業(yè)的RAG(檢索增強(qiáng)生成)平臺(tái),以簡(jiǎn)化選擇和組合這些平臺(tái)所帶來(lái)的復(fù)雜性:
① 運(yùn)維工具:企業(yè)IT部門需要為工程團(tuán)隊(duì)建立監(jiān)管措施,管理成本等。
與今天為軟件開發(fā)所做的所有工作一樣,他們需要擴(kuò)展這些任務(wù),以包括人工智能的使用。IT感興趣的領(lǐng)域包括:
o 可觀測(cè)性:模型在生產(chǎn)環(huán)境中的表現(xiàn)如何?它們的性能是否隨時(shí)間改善/惡化?是否存在可能影響未來(lái)應(yīng)用程序版本中模型選擇的使用模式?
o 安全性:如何確保AI本地應(yīng)用程序的安全性。這些應(yīng)用程序是否容易受到新的攻擊方式的攻擊,需要新的平臺(tái)?
o 合規(guī)性:我們預(yù)計(jì)AI本地應(yīng)用程序和LLM的使用將需要符合相關(guān)主管機(jī)構(gòu)已開始制定的框架。這是除了隱私、安全、消費(fèi)者保護(hù)、公平性等現(xiàn)有合規(guī)性制度之外的。企業(yè)將需要平臺(tái)來(lái)幫助他們保持合規(guī)性、進(jìn)行審計(jì)、生成合規(guī)性證明等相關(guān)任務(wù)。
② 數(shù)據(jù):預(yù)計(jì)將迅速采用幫助企業(yè)了解其數(shù)據(jù)資產(chǎn)以及如何通過(guò)使用新型人工智能模型從這些資產(chǎn)中提取最大價(jià)值的平臺(tái)。
正如地球上最大的軟件公司之一曾對(duì)我們說(shuō)的那樣,“我們的數(shù)據(jù)是我們的壕溝,我們的核心IP,我們的競(jìng)爭(zhēng)優(yōu)勢(shì)?!?/p>
通過(guò)利用人工智能將這些數(shù)據(jù)貨幣化,以一種在不削弱防御能力的情況下推動(dòng)“差異化”的方式,將是關(guān)鍵。Snorkel等平臺(tái)在其中發(fā)揮著關(guān)鍵作用。
我們認(rèn)為,現(xiàn)在正是構(gòu)建人工智能基礎(chǔ)設(shè)施平臺(tái)的絕佳時(shí)機(jī)。
盡管人工智能的應(yīng)用將繼續(xù)改變整個(gè)行業(yè),但要想使每個(gè)企業(yè)都能采用這一強(qiáng)大技術(shù),就需要支持基礎(chǔ)設(shè)施、中間件、安全性、可觀測(cè)性和操作平臺(tái)。
本文來(lái)源:硬AI