近日,經(jīng)濟(jì)學(xué)家、數(shù)據(jù)科學(xué)家塞思·斯蒂芬斯·達(dá)維多維茨所著的新書(shū)《不要相信你的直覺(jué)》正式出版。
作者在書(shū)中表示,過(guò)去10年間,學(xué)者們挖掘了史無(wú)前例的龐大數(shù)據(jù)。依靠這些數(shù)據(jù),人類過(guò)去在生活、商業(yè)、學(xué)術(shù)等各方面的諸多難題被一一解決。
在此基礎(chǔ)上,作者更是進(jìn)一步指出,相比于數(shù)據(jù)對(duì)人類社會(huì)的解釋和判斷,人類直覺(jué)已經(jīng)顯得不再那么“可靠”。數(shù)據(jù)和算法正在取代直覺(jué),成為人類賴以生存的重要工具。
(資料圖片僅供參考)
AI既能做“球探”也能當(dāng)“紅娘”
達(dá)維多維茨在其新書(shū)中表示,雖然我們總是自認(rèn)為知道如何使自己做出最優(yōu)選擇,但近年來(lái)的事實(shí)證明,數(shù)據(jù)在這件事上能夠做得更好,甚至糾正了我們過(guò)去一些錯(cuò)誤的直覺(jué)。
作者在書(shū)中引用了一部經(jīng)典體育電影《點(diǎn)球成金》中的故事。電影主人公在組建棒球隊(duì)的過(guò)程中通過(guò)建立數(shù)學(xué)模型,采用量化分析的方法,發(fā)現(xiàn)球員的上壘率指標(biāo)與比賽勝負(fù)之間存在某種關(guān)聯(lián),即上壘率越高,比賽獲勝的可能性越大。該指標(biāo)在過(guò)去一直不被專業(yè)球探所重視,但主人公選擇相信數(shù)據(jù)的判斷,于是他以此為根據(jù),尋找他認(rèn)為合適的球員。也正是因?yàn)檫@一指標(biāo)在過(guò)去不為專業(yè)球探所重視,所以該指標(biāo)表現(xiàn)優(yōu)秀的球員往往身價(jià)低廉,主人公也因此以遠(yuǎn)低于市場(chǎng)平均值的成本成功建隊(duì),并且?guī)ьI(lǐng)這支球隊(duì)一舉奪得冠軍。
這個(gè)由真實(shí)事件改編的故事揭示了數(shù)據(jù)在挖掘運(yùn)動(dòng)員潛在價(jià)值方面的巨大作用,數(shù)據(jù)已變成選材的重要工具。2021年,英格蘭超級(jí)聯(lián)賽球隊(duì)伯恩利為了更好地輔助球探篩選并挖掘有天賦的年輕球員,決定與AI人才識(shí)別平臺(tái)進(jìn)行合作——運(yùn)用AI技術(shù)在全球公開(kāi)招募14歲以上的潛力球員。球員們只需要把自己的足球訓(xùn)練視頻或者比賽視頻上傳到平臺(tái),平臺(tái)便會(huì)自動(dòng)分析球員特征,生成360度的球員展示圖,詳細(xì)列出球員在技術(shù)、認(rèn)知和心理能力等方面的數(shù)據(jù),供球探參考。通過(guò)這種方式,球隊(duì)能夠以極低的成本在全世界挖掘優(yōu)秀球員,并且更有可能發(fā)現(xiàn)那些被傳統(tǒng)挑選方法所埋沒(méi)的人才。
當(dāng)然遠(yuǎn)不止于體育,數(shù)據(jù)的作用早已滲透我們的日常生活。尤其是在那些過(guò)去曾被認(rèn)為不可能被準(zhǔn)確量化的領(lǐng)域。根據(jù)日本《讀賣(mài)新聞》報(bào)道,2021年初,為了應(yīng)對(duì)少子化趨勢(shì),提升結(jié)婚率。日本政府推進(jìn)一項(xiàng)AI婚介項(xiàng)目,應(yīng)用人工智能篩選婚配對(duì)象。參與者需要提供自身與婚戀有關(guān)的各項(xiàng)數(shù)據(jù),包括年齡、學(xué)歷和收入條件等。隨后人工智能系統(tǒng)會(huì)對(duì)數(shù)據(jù)進(jìn)行深入分析,然后在所有報(bào)名者中為人們篩選匹配出“可能對(duì)你抱有好感的人”。即使有時(shí)不符合雙方提出的條件,系統(tǒng)也會(huì)給出相應(yīng)推薦。
2019年該系統(tǒng)在日本埼玉縣試運(yùn)行時(shí),在所有通過(guò)政府婚介服務(wù)成功結(jié)婚的38對(duì)情侶中,有21對(duì)是通過(guò)AI推薦系統(tǒng)成功配對(duì)結(jié)婚的,超過(guò)了總數(shù)的一半??梢?jiàn)數(shù)據(jù)和算法有時(shí)或許比紅娘更懂人類姻緣。
數(shù)據(jù)、算法都給力決策才能更正確
如今,AI已經(jīng)開(kāi)始進(jìn)入我們的生活,科學(xué)家也會(huì)利用AI從事科研活動(dòng)。AI會(huì)利用大量的數(shù)據(jù),再通過(guò)一定的算法,驗(yàn)證過(guò)去學(xué)者們依靠觀察、訪談等傳統(tǒng)社會(huì)科學(xué)方法所得到的有關(guān)人類社會(huì)的認(rèn)識(shí)理論,但有時(shí)卻也會(huì)給出一些令人“大跌眼鏡”的觀點(diǎn),貌似違反了過(guò)去我們對(duì)于人類社會(huì)的認(rèn)知常識(shí)。
在北京師范大學(xué)新聞傳播學(xué)院、計(jì)算傳播學(xué)研究中心教授吳曄看來(lái),如果通過(guò)數(shù)據(jù)、算法得出的結(jié)果違反直覺(jué)或者常識(shí),這不僅是常見(jiàn)的,而且是應(yīng)該的。“直覺(jué)、常識(shí)本身就不一定是正確的,如果靠數(shù)據(jù)、算法得出的結(jié)論全都是符合直覺(jué)、常識(shí)的,那么這個(gè)數(shù)據(jù)、算法還有什么價(jià)值呢?大數(shù)據(jù)很大的一個(gè)優(yōu)點(diǎn)就是幫助我們尋找出一些靠人類直覺(jué)無(wú)法得到的結(jié)論?!?/p>
但隨著數(shù)據(jù)的種類、數(shù)量越來(lái)越多,人們不禁要問(wèn),是否所有數(shù)據(jù)都有價(jià)值?吳曄認(rèn)為,如果想要依靠數(shù)據(jù)和算法對(duì)人類社會(huì)進(jìn)行理解、解釋,乃至幫助人們進(jìn)行抉擇,數(shù)據(jù)就必須要具備一定條件。首先是數(shù)據(jù)規(guī)模要足夠大,即使無(wú)法做到全樣本數(shù)據(jù),也應(yīng)盡量實(shí)現(xiàn)數(shù)據(jù)來(lái)源的隨機(jī)性,選擇的數(shù)據(jù)要有代表性;其次則是數(shù)據(jù)質(zhì)量應(yīng)盡量可靠,數(shù)據(jù)的準(zhǔn)確性和完整性要有所保證;此外,如果有統(tǒng)一的數(shù)據(jù)接口標(biāo)準(zhǔn),算法的復(fù)雜性也能夠大大降低。
如果上述要求能夠得到滿足,那么當(dāng)我們利用AI進(jìn)行決策時(shí),將更有可能得到更加準(zhǔn)確的結(jié)果。但吳曄也強(qiáng)調(diào),人類社會(huì)高度復(fù)雜,并且時(shí)刻都在變化。相對(duì)固定的算法很難做到長(zhǎng)久有效。“以互聯(lián)網(wǎng)上運(yùn)行的推薦算法為例,可能幾小時(shí)就會(huì)迭代一次?!彼J(rèn)為,算法的不斷更新、修正,也是保證大數(shù)據(jù)應(yīng)用能夠取得可靠結(jié)果的重要因素。
還需認(rèn)清數(shù)據(jù)、算法的兩面性
信息獲取方式的變化毫無(wú)疑問(wèn)是近年來(lái)數(shù)據(jù)和算法給大眾帶來(lái)的最大改變之一。因此,也不斷有批評(píng)者對(duì)信息推薦算法導(dǎo)致“信息繭房”效應(yīng)加劇的問(wèn)題進(jìn)行批判。吳曄認(rèn)為,“信息繭房”的產(chǎn)生并不能全讓算法“背鍋”。有研究表明,“信息繭房”是算法和受眾認(rèn)知偏好共同作用下的結(jié)果,兩者缺一不可。
吳曄進(jìn)一步表示,算法歸根結(jié)底是受人控制的,算法的規(guī)則是人制定的。“人完全可以寫(xiě)出一個(gè)‘走向另外一個(gè)極端’的算法,讓大家的選擇多樣化,遠(yuǎn)離‘信息繭房’,但是這種算法不符合商業(yè)利益,所以沒(méi)有人去做?!彼f(shuō)。
所以,人與大數(shù)據(jù)、算法之間不存在固有矛盾?!按髷?shù)據(jù)的應(yīng)用是為了提高人類某些行為的效率,是為人類服務(wù)的,總體上是需要擁抱的。”吳曄說(shuō)。但他同時(shí)也提醒道,如果大數(shù)據(jù)被別有用心的人利用,當(dāng)然也會(huì)產(chǎn)生負(fù)面效果。“數(shù)據(jù)和算法就像菜刀,它既可以是工具,也可能會(huì)成為兇器。但我們不能因噎廢食,就因?yàn)樗赡軙?huì)成為兇器就再也不生產(chǎn)菜刀了。”
那么,我們應(yīng)如何合理、恰當(dāng)?shù)貞?yīng)用大數(shù)據(jù),使其更好地為人類服務(wù)?吳曄認(rèn)為,應(yīng)努力推動(dòng)數(shù)據(jù)共享,使數(shù)據(jù)成為儲(chǔ)存在個(gè)人設(shè)備里的私有財(cái)產(chǎn),而非互聯(lián)網(wǎng)平臺(tái)的財(cái)產(chǎn),并在有償?shù)那疤嵯聦?shí)現(xiàn)數(shù)據(jù)共享;此外,則是要避免數(shù)據(jù)被別有用心的人用于不利于社會(huì)發(fā)展的用途,比如大數(shù)據(jù)殺熟、大數(shù)據(jù)售假等,而這則需要有關(guān)部門(mén)提高監(jiān)管水平,營(yíng)造一個(gè)良好的互聯(lián)網(wǎng)環(huán)境。
相關(guān)鏈接
數(shù)據(jù)、算法正在悄悄改變你我
當(dāng)我們?cè)絹?lái)越多地依賴數(shù)據(jù)和算法為我們做出決定時(shí),我們也很有可能在不知不覺(jué)中被數(shù)據(jù)和算法改變。
同樣是在婚戀領(lǐng)域,英國(guó)牛津大學(xué)的研究者曾就大數(shù)據(jù)在線匹配婚戀網(wǎng)站進(jìn)行了跨度為10年的研究。他們發(fā)現(xiàn),隨著數(shù)據(jù)匹配婚戀方式的不斷流行,男性在線上婚戀行為中的主導(dǎo)作用也在不斷得到加強(qiáng)。
研究人員認(rèn)為,在大數(shù)據(jù)匹配模式下,男性選擇婚戀對(duì)象的成本被進(jìn)一步降低,因此更加傾向于主動(dòng)示愛(ài),而女性則變得更加傾向于被動(dòng)等待。但研究人員也指出,這種改變僅限于線上婚戀行為,對(duì)于是否能夠影響線下婚戀行為,仍需進(jìn)一步研究。
與此同時(shí),該研究團(tuán)隊(duì)也發(fā)現(xiàn),針對(duì)這一情況,已經(jīng)有部分應(yīng)用開(kāi)始反其道而行,即只允許女性主動(dòng)發(fā)起對(duì)話,并且限制對(duì)話時(shí)間,以此鼓勵(lì)女性掌握線上婚戀行為的主動(dòng)權(quán)。(實(shí)習(xí)記者 都 芃)