中國有 5 至 10 年時間備戰(zhàn) AI 沖擊
首先,ChatGPT是 一個巨大的數(shù)據(jù)庫及語料庫。 與傳統(tǒng)系統(tǒng)不同的是,傳統(tǒng)系統(tǒng)的數(shù)據(jù)輸入需要按人類的規(guī)則形成一定結(jié)構(gòu)。 在查詢?nèi)魏螖?shù)據(jù)時,傳統(tǒng)系統(tǒng)還需要一個搜索引擎,按人類預(yù)先設(shè)定的規(guī)則及標(biāo)簽讀取。 而基于神經(jīng)網(wǎng)絡(luò)的ChatGPT系統(tǒng)的數(shù)據(jù)輸入,無需任何人為的規(guī)則或結(jié)構(gòu)。 神經(jīng)網(wǎng)絡(luò)會按自己的網(wǎng)絡(luò)結(jié)構(gòu)合理地存儲數(shù)據(jù)。此外,神經(jīng)網(wǎng)絡(luò)也不需要任何搜索引擎,數(shù)據(jù)能通過網(wǎng)絡(luò)架構(gòu)高效地獲取 。
(相關(guān)資料圖)
畢奇
ChatGPT的另一個更重要的特點,還在于它不單是一個強(qiáng)大的數(shù)據(jù)庫和語料庫。它還是一個完整的神經(jīng)網(wǎng)絡(luò)大模型。 有了這個模型的功能,ChatGPT就有了傳統(tǒng)數(shù)據(jù)庫與語料庫無法匹敵的填空能力。 根據(jù)一組數(shù)據(jù)形成一個數(shù)學(xué)模型來填補(bǔ)空缺的數(shù)據(jù),數(shù)學(xué)上叫“插值”,已經(jīng)有較長的歷史。但根據(jù)輸入填補(bǔ)一句話,就是問答系統(tǒng)。
填一段話、一篇文章、一組圖像,就變成生成式的人工智能。這種通過運(yùn)用大模型的學(xué)習(xí),在語言、圖像等方面舉一反三的能力,成為舉世矚目的“生成式”或“創(chuàng)造般”的能力。盡管如此,ChatGPT的“生成式”神經(jīng)網(wǎng)絡(luò)大模型,與數(shù)學(xué)上的數(shù)據(jù)插值相比,有許多類似之處。其發(fā)展是一個漸進(jìn)的演進(jìn),只是由于其存儲語料庫的巨大,量變產(chǎn)生質(zhì)變,輸出超出大家預(yù)期。
從目前的AI發(fā)展來看,ChatGPT僅僅還是人類眾多的工具之一,與人類的智慧及創(chuàng)造力完全不在一個等級上。具體來說,ChatGPT邏輯推理能力遠(yuǎn)不及人類。它的推理能力還局限于人類設(shè)定的規(guī)則,邏輯推理的模型還未能建立,邏輯推理填空能力缺乏。
目前為止,被認(rèn)為強(qiáng)大無比的ChatGPT還未能推導(dǎo)出任何一個新的數(shù)學(xué)定理。 由于邏輯推理模型的缺失,ChatGPT的分析能力也局限于概率計算,不能根據(jù)前因后果自行得出合理結(jié)論。 這就是為什么ChatGPT對一些問題的回答,在我們看來是“一本正經(jīng)地胡說八道”。沒有這個能力,創(chuàng)造力就大打折扣。
有了邏輯推理能力,接下來最重要的還是自我驅(qū)動力。人類能夠確立自己的目標(biāo),并通過努力完成既定的任務(wù),但ChatGPT不具備自我驅(qū)動能力,類似人類大腦的功能是缺失的,就只是人類一個被動的工具,與人類不可能是競爭關(guān)系。
但是,當(dāng)包括ChatGPT在內(nèi)的人工智能工具,具備了自我學(xué)習(xí)、自我驅(qū)動,那它可能將是人類的噩夢。 但我認(rèn)為,目前ChatGPT的研發(fā)還有很長的路要走,現(xiàn)在還遠(yuǎn)沒到需要考慮按下暫停鍵的時候。
為什么馬斯克等人主張要暫停開發(fā)AI系統(tǒng)?據(jù)報道,馬斯克雖然是OpenAI最早的投資者之一,但由于他與OpenAI首席執(zhí)行官奧特曼個人分歧,于2018年已停止對OpenAI的資助。與此同時,馬斯克的公司也在全力開發(fā)AI,他提出暫停6個月的倡議,許多人認(rèn)為,更多的可能是他希望通過這段時間,趕上OpenAI的研發(fā)步伐。
當(dāng)然,ChatGPT可能帶來的對社會、經(jīng)濟(jì)及產(chǎn)業(yè)方面的沖擊,在極大地提高生產(chǎn)力的同時,也會帶來一些負(fù)面影響。這些影響,包括數(shù)字資產(chǎn)的確定及維護(hù)、隱私的保護(hù)、抑制不良信息的傳播等,可以通過及時立法及政策制定解決。 但暫停6個月,對這些可能的負(fù)面影響,并帶來不了任何實質(zhì)性的意義。
AI應(yīng)用在中國經(jīng)濟(jì)領(lǐng)域的推行,會否將引發(fā)產(chǎn)業(yè)的陣痛?我認(rèn)為會的。從歷史來看,所有的科技發(fā)展,都會對傳統(tǒng)產(chǎn)業(yè)產(chǎn)生沖擊和陣痛。 蒸汽機(jī)、內(nèi)燃機(jī)的發(fā)明,對體力勞動群體產(chǎn)生的沖擊是有目共睹的。 近代信息科技的發(fā)展,進(jìn)一步大規(guī)模減少了體力勞動者的就業(yè)機(jī)會,但同時造就了更多的白領(lǐng)階層。因此,科技發(fā)展到目前為止,并沒有減少就業(yè)的機(jī)會,只是改變了就業(yè)方式及入職門檻。
對于ChatGPT的產(chǎn)生,許多產(chǎn)業(yè)的就業(yè)門檻也會被不斷提高。 這次的沖擊不單是對體力勞動者群體,對低端白領(lǐng)階層產(chǎn)生的影響也將是明顯的。這些產(chǎn)業(yè)涵蓋任何根據(jù)已有記載能總結(jié)獲得的產(chǎn)出,包括律師材料準(zhǔn)備工作、教師備課、醫(yī)生初步診斷、工程師低端編程及規(guī)范撰寫、科研人員論文背景段落的寫作工作,甚至部分知名度不夠的演員和主播等, 涵蓋的面還是較廣的。
但作為人類提高生產(chǎn)力的高效工具,ChatGPT預(yù)期將與其它重大信息科技的發(fā)展一樣,會進(jìn)一步推進(jìn)產(chǎn)業(yè)從勞動密集型、低端文案型,向高端智慧白領(lǐng)型產(chǎn)業(yè)轉(zhuǎn)型,對社會的影響預(yù)期是積極正面的。
對于我們每一個人來說,應(yīng)對方式不能是抵制,而是順應(yīng)其發(fā)展,盡快學(xué)會怎么利于ChatGPT這樣一個工具提高工作效率,成為能利用甚至駕馭這個工具的專家。ChatGPT的技術(shù)雖然復(fù)雜,但學(xué)會應(yīng)用還是較為簡單的。
對于中國來說,產(chǎn)業(yè)領(lǐng)域?qū)⒂卸嚅L時間為AI可能帶來的改變做準(zhǔn)備?我認(rèn)為,雖然ChatGPT已經(jīng)給出驚人的表現(xiàn),效果超出一般預(yù)期,但其可靠性及性價比到底能否被大規(guī)模接受,需要拭目以待。此外,其經(jīng)濟(jì)模式以及在各行各業(yè)的應(yīng)用、磨合,還來日方長,預(yù)期是一個漸進(jìn)的過程。此外,ChatGPT對行業(yè)的影響,究竟是減少人工,還是促使相同的人工數(shù)量但向更高質(zhì)量的產(chǎn)出發(fā)展,現(xiàn)在也還不確定。
舉個例子, 個人電腦的發(fā)展曾經(jīng)被預(yù)測將是造紙行業(yè)的墳?zāi)埂5珜嶋H發(fā)展證明,并非如此。 因此,ChatGPT對就業(yè)的影響是負(fù)面還是正面,還有待觀察。中國相關(guān)產(chǎn)業(yè)至少有5—10年的時間為AI可能帶來的沖擊做準(zhǔn)備。
全世界范圍看,美國在人工智能領(lǐng)域的研究“一騎絕塵”,后面很少有追趕者,中國想要趕超美國比較難。大模型需要的算力硬件要求較高,如果美國對中國實施禁運(yùn),會給中國帶來一些挑戰(zhàn)。但這還不是最重要的,中國研究AI最大的門檻在于,雖然ChatGPT的神經(jīng)網(wǎng)絡(luò)系統(tǒng)已經(jīng)比較完整,但圍繞這個神經(jīng)網(wǎng)絡(luò)的對齊、微調(diào)、強(qiáng)化學(xué)習(xí)及邏輯推理等算法,還在不斷摸索和改善之中。
這些算法是磨合AI在各行各業(yè)應(yīng)用的關(guān)鍵必經(jīng)之路。如果雇不到足夠強(qiáng)的專家,做得不夠極致,應(yīng)用的推廣會遇到較大瓶頸。由于目前ChatGPT已不再開源,中國能否在這些算法上跟上美國的步伐,面臨較大的挑戰(zhàn)。
人工智能必然是全球未來競爭的一個重要賽道,無論多難,中國都注重投入人工智能的研發(fā)。美國正通過對人工智能的研發(fā),掀起一場未來科技發(fā)展的革命。
據(jù)我了解, 中國一些企業(yè)已經(jīng)在布局AI,另一個較為重要的建議是,在訓(xùn)練AI相關(guān)產(chǎn)品時,不能只局限中文語料庫,語料庫的完整性將會嚴(yán)重影響人工智能的應(yīng)用范圍和潛力。 近代以來,西方產(chǎn)生了大量科技發(fā)明和創(chuàng)新,這些都是以英語記載和傳播。如果我們只用中文語料,將和世界的進(jìn)展產(chǎn)生巨大的鴻溝,也不利于中國人工智能應(yīng)用在全球范圍的推廣。