狂飆200天,中國(guó)門徒不寫詩(shī)只做事。
文|《中國(guó)企業(yè)家》記者 趙東山
編輯|李薇
大模型創(chuàng)業(yè)狂飆200多天后,中國(guó)探索者們的心態(tài),從理想亢奮來(lái)到現(xiàn)實(shí)落地。
在此之前,AI大模型的創(chuàng)業(yè)在其公司本身之外,還被賦予了民族情緒、時(shí)代風(fēng)口等更多的意義——面對(duì)通用大模型ChatGPT的橫空出世,中國(guó)創(chuàng)業(yè)者們壯志未酬很快達(dá)成共識(shí):如何打造一個(gè)中國(guó)版的OpenAI和ChatGPT。
毫無(wú)疑問(wèn),ChatGPT是今年的世界頂流。因?yàn)樗?#xff0c;OpenAI網(wǎng)站的流量在4月份就超過(guò)了18億,進(jìn)入了全球流量排名前20。然而,網(wǎng)絡(luò)分析公司Similarweb公布的數(shù)據(jù)顯示,在狂飆半年后,ChatGPT的訪問(wèn)量首次出現(xiàn)負(fù)增長(zhǎng),6月份的訪問(wèn)量環(huán)比下滑9.7%。
ChatGPT流量驟降引發(fā)全球科技界對(duì)AI產(chǎn)業(yè)泡沫化風(fēng)險(xiǎn)的擔(dān)憂和討論,《經(jīng)濟(jì)學(xué)人》雜志甚至做出“越大越好的AI之路快行不通了”的論斷。而成為“中國(guó)版ChatGPT”的想法,也在和中國(guó)創(chuàng)業(yè)圈漸行漸遠(yuǎn)。
金沙江創(chuàng)始合伙人朱嘯虎在朋友圈寫道:“不要迷信通用大模型,因?yàn)槊髂闓PT-3.5就成commodity(通用基礎(chǔ)設(shè)施),而三年后,GPT-4也會(huì)是。對(duì)于大部分創(chuàng)業(yè)者,場(chǎng)景優(yōu)先,數(shù)據(jù)為王!”
從業(yè)者們心態(tài)變化的同時(shí),大模型創(chuàng)業(yè)市場(chǎng)已經(jīng)開(kāi)始出現(xiàn)分野。
中國(guó)的大模型企業(yè)們已經(jīng)不再執(zhí)著于“成為中國(guó)的OpenAI”這種理想化目標(biāo),也不再癡迷于對(duì)參數(shù)模型和算力的追求,他們有了更務(wù)實(shí)的答案,也更注重其對(duì)實(shí)際產(chǎn)業(yè)場(chǎng)景中的問(wèn)題解決。
AI大模型的競(jìng)逐迎來(lái)了新的賽道節(jié)點(diǎn)
集體務(wù)實(shí)
今年年初,攜程創(chuàng)始人、董事局主席梁建章開(kāi)始接觸ChatGPT。近些年,他以人口學(xué)家的身份活躍在學(xué)界和企業(yè)界,不過(guò)他也曾是中國(guó)最早和最小的程序員,也差點(diǎn)成為人工智能方向的博士。
13歲時(shí)梁建章設(shè)計(jì)了一個(gè)寫格律詩(shī)的程序獲得全國(guó)大獎(jiǎng),15歲考入復(fù)旦大學(xué)少年班,畢業(yè)后赴美國(guó)留學(xué)并在21歲獲得喬治亞理工學(xué)院電腦系碩士學(xué)位。22歲那年正在攻讀博士的梁建章,突然意識(shí)到理論知識(shí)的局限性,選擇放棄讀博入職美國(guó)甲骨文。
ChatGPT的出現(xiàn),讓梁建章慶幸自己當(dāng)年沒(méi)有繼續(xù)念人工智能博士,因?yàn)椤八械倪@些自然語(yǔ)言處理的算法,都一下被它(ChatGPT)全部打敗了”。他回憶,剛開(kāi)始接觸ChatGPT的時(shí)候,“非常非常震驚”,第二個(gè)感覺(jué)是謙卑,“我們最后做出來(lái)最智能的算法,竟然是跟人腦的生物構(gòu)造那么的接近”。
梁建章開(kāi)始思考AI大模型與攜程業(yè)務(wù)的結(jié)合點(diǎn)。
在梁建章看來(lái),智能社會(huì)背景下,旅游業(yè)作為“難以自動(dòng)化的精神需求行業(yè)”,其需求會(huì)隨著整體社會(huì)富裕程度的提升而增多,在經(jīng)濟(jì)中的占比也會(huì)擴(kuò)大。他將目光鎖定在旅游行業(yè)的垂直大模型上。
過(guò)去半年,來(lái)自攜程各個(gè)業(yè)務(wù)的成員組成攜程大模型技術(shù)團(tuán)隊(duì)。在大模型研發(fā)初期,攜程根據(jù)大模型的戰(zhàn)略要求進(jìn)行了組織架構(gòu)調(diào)整,并形成了包括通用技術(shù)團(tuán)隊(duì)、內(nèi)容策略團(tuán)隊(duì)、榜單團(tuán)隊(duì)等不同部門,根據(jù)大模型產(chǎn)品的不斷升級(jí)迭代對(duì)技術(shù)團(tuán)隊(duì)進(jìn)行適配。
梁建章表示,攜程會(huì)不遺余力地為大模型投入,“長(zhǎng)遠(yuǎn)對(duì)我們的客戶或者是商戶有價(jià)值的,我們就應(yīng)該非常堅(jiān)定地投資下去。這個(gè)(大模型)非常新,技術(shù)團(tuán)隊(duì)不斷優(yōu)化他們的投資數(shù)額,但是我們不設(shè)限?!?/p>
攜程在7月中旬正式發(fā)布了旅游行業(yè)垂直大模型問(wèn)道。問(wèn)道篩選了200億非結(jié)構(gòu)性旅游數(shù)據(jù),結(jié)合攜程現(xiàn)有的結(jié)構(gòu)性實(shí)時(shí)數(shù)據(jù),以及攜程歷史訓(xùn)練的機(jī)器人和搜索算法,進(jìn)行了自研垂直模型的訓(xùn)練,“同時(shí),我們投入了巨大人力對(duì)旅行通用回復(fù)內(nèi)容進(jìn)行生成和校驗(yàn)?!绷航ㄕ聫?qiáng)調(diào)。
在問(wèn)道發(fā)布前,攜程已經(jīng)進(jìn)行內(nèi)測(cè),客服人員王蕓明顯感覺(jué)自己的工作發(fā)生了很大的變化。以前,她一天要接150多個(gè)電話,為客人解答售后訂單取消、行李丟失等問(wèn)題;如今,王蕓轉(zhuǎn)型成行前推薦客服,從幕后走進(jìn)直播間,為網(wǎng)友提供旅行前需要準(zhǔn)備的服務(wù)和建議。
在梁建章看來(lái),通用大模型的基礎(chǔ)上,解決旅游行業(yè)準(zhǔn)確率的問(wèn)題依然是關(guān)鍵:“旅游是個(gè)重消費(fèi)的行業(yè),即使規(guī)劃節(jié)省了半小時(shí),但推薦的酒店或者行程結(jié)果可能有5%的幾率是錯(cuò)的?!币虼?#xff0c;相較于ChatGPT那樣的通用大模型,梁建章更看重垂直大模型的機(jī)會(huì)。
雖然在參數(shù)上不及通用大模型,也沒(méi)有通用大模型對(duì)算力等條件的苛刻要求,但垂直大模型對(duì)數(shù)據(jù)和場(chǎng)景提出了更高的要求。
問(wèn)道大模型訓(xùn)練中最大的挑戰(zhàn)是真實(shí)場(chǎng)景下,用戶獲取旅游信息過(guò)程中,多輪交互數(shù)據(jù)的搜集和清洗,數(shù)據(jù)量和數(shù)據(jù)準(zhǔn)確性需要不斷修正,特別是旅游行業(yè)變化巨大,三年前的目的地信息到現(xiàn)在有可能已經(jīng)全部過(guò)時(shí),特別是疫情對(duì)全球旅游業(yè)的影響更是加劇了數(shù)據(jù)的時(shí)效性。
和攜程一樣,越來(lái)越多的公司把大模型的賽道放到了垂直領(lǐng)域。
京東交出的言犀大模型答卷,也將產(chǎn)業(yè)大模型作為重要特征。在京東集團(tuán)新CEO許冉看來(lái),過(guò)去的人工智能技術(shù)發(fā)展,曾經(jīng)數(shù)次臨近應(yīng)用爆發(fā)的邊緣,但最終往往曇花一現(xiàn),而技術(shù)沒(méi)有在產(chǎn)業(yè)端形成扎實(shí)的應(yīng)用是重要的原因之一。
在7月7日華為盤古大模型3.0的發(fā)布會(huì)上,華為云CEO張平安更是直言,“盤古大模型沒(méi)有時(shí)間作詩(shī)和聊天。參數(shù)再多、對(duì)話能力做得再好,但如果解決不了實(shí)際問(wèn)題,也沒(méi)有多大用處?!?/p>
騰訊至今還沒(méi)有公布通用大模型混元的進(jìn)展,但卻高調(diào)公布了行業(yè)大模型路線,一口氣拋出10大行業(yè)超過(guò)50個(gè)解決方案。騰訊副總裁、騰訊政企業(yè)務(wù)總裁李強(qiáng)同樣表示:“通用大模型不是模型應(yīng)用的唯一方向,面向垂直產(chǎn)業(yè)的模型會(huì)成為大模型價(jià)值的引爆點(diǎn)?!?/p>
心態(tài)轉(zhuǎn)變
大模型創(chuàng)業(yè)者心態(tài)轉(zhuǎn)變的一個(gè)顯性的節(jié)點(diǎn),是從王慧文被確診抑郁癥,其創(chuàng)辦的光年之外被美團(tuán)收購(gòu)開(kāi)始。大家突然意識(shí)到,即便是那個(gè)曾經(jīng)眾望所歸、被寄予厚望的明星公司,也可能因?yàn)楦鞣N意外的出現(xiàn)而不得不停止。
就在半年前,一夜之間其他風(fēng)口似乎都消散了,只有大模型是C位。中國(guó)科技圈的創(chuàng)業(yè)者與投資人,紛紛飛往硅谷向OpenAI學(xué)習(xí),張一鳴、馬化騰、王興,這些巨頭的一號(hào)位或者決策中心人物,一夜間回到剛創(chuàng)業(yè)時(shí)的亢奮、好奇狀態(tài),深夜閱讀論文、交流技術(shù)。
那時(shí)候,似乎每個(gè)中國(guó)大模型探索者思考問(wèn)題的角度都是帶著家國(guó)情懷的。面對(duì)ChatGPT的快速迭代,中國(guó)創(chuàng)業(yè)者們給自己設(shè)定的目標(biāo)都是如何在多少時(shí)間內(nèi)實(shí)現(xiàn)反超。
李彥宏稱,“百度文心一言在研發(fā)階段時(shí),百度技術(shù)團(tuán)隊(duì)曾與ChatGPT進(jìn)行對(duì)比測(cè)試,當(dāng)時(shí)差距是40分的水平,一個(gè)月能追得上”;王小川也表示,將在年底做出中國(guó)最好的大語(yǔ)言模型。
360創(chuàng)始人周鴻祎在此前接受《中國(guó)企業(yè)家》的采訪時(shí)說(shuō)道,大模型已不是商業(yè)競(jìng)爭(zhēng)的維度了,如果中文互聯(lián)網(wǎng)的封閉性和移動(dòng)互聯(lián)網(wǎng)導(dǎo)致的APP之間的數(shù)據(jù)孤島問(wèn)題未能解決,很可能導(dǎo)致人工智能引擎訓(xùn)練的局限性,進(jìn)而可能導(dǎo)致中美之間新一輪AI革命的代際差距。
關(guān)于為什么沒(méi)有在中國(guó)誕生OpenAI這樣的公司,中國(guó)的企業(yè)家們甚至在當(dāng)時(shí)開(kāi)始反思,過(guò)往國(guó)內(nèi)的人工智能探索過(guò)于實(shí)用主義了,一切以KPI為導(dǎo)向,以至于大家根本沒(méi)有那樣的投入決心和耐心,而因此錯(cuò)過(guò)了這樣的重要節(jié)點(diǎn)。
激情之下,在百度文心一言打響第一槍之后,超過(guò)80個(gè)AI大模型在半年內(nèi)涌現(xiàn),僅在上海舉辦的2023世界人工智能大會(huì)上就出現(xiàn)了30多個(gè)大模型,用“百模大戰(zhàn)”來(lái)形容當(dāng)下大模型的火熱一點(diǎn)也不夸張。
但我們真的需要這么多大模型嗎?我們到底需要什么樣的大模型?
事實(shí)上,李彥宏很早便提出,“創(chuàng)業(yè)公司重新做一個(gè)ChatGPT其實(shí)沒(méi)有多大意義。我覺(jué)得基于這種大語(yǔ)言模型開(kāi)發(fā)應(yīng)用機(jī)會(huì)很大,沒(méi)有必要再重新發(fā)明一遍輪子,有了輪子之后,做汽車、飛機(jī),價(jià)值可能比輪子大多了?!?/p>
京東集團(tuán)技術(shù)副總裁何曉冬同樣從一開(kāi)始意識(shí)到,“大模型要有價(jià)值的話,得落在產(chǎn)業(yè)上,而且最好是產(chǎn)業(yè)價(jià)值大的領(lǐng)域,這樣才能真正成為一個(gè)長(zhǎng)期可持續(xù)的事兒,否則就可能會(huì)成為曇花一現(xiàn)的東西?!?/p>
新的變量
就在國(guó)內(nèi)創(chuàng)業(yè)者們苦苦為AI大模型探索時(shí),扎克伯格的一記大招給這個(gè)本就瞬息萬(wàn)變的領(lǐng)域帶來(lái)了新的變量。
北京時(shí)間7月19日凌晨,Meta發(fā)布了開(kāi)源大模型Llama 2,再次引爆了AI圈:Llama 2不僅性能不輸GPT-3,而且免費(fèi)、開(kāi)源,還可商用。Llama 2是Meta今年3月初發(fā)布的Llama模型的后續(xù)版本。
隨后的微軟Inspire合作伙伴大會(huì)上,微軟CEO薩提亞·納德拉宣布了Meta與微軟合作的消息,這項(xiàng)合作讓Llama 2可以運(yùn)行在微軟的云服務(wù)Microsoft Azure上。與此同時(shí),亞馬遜AWS云也加入與Meta的合作中。
Llama 2對(duì)大模型創(chuàng)業(yè)者的意義在于,就像安卓系統(tǒng)之于APP開(kāi)發(fā)一樣,開(kāi)發(fā)者不用重復(fù)造輪子了,直接用最低的成本獲得大模型的基礎(chǔ)設(shè)施使用,從而可以更加聚焦自身的產(chǎn)業(yè)場(chǎng)景。
這在某種程度上也意味著,對(duì)于大多數(shù)創(chuàng)業(yè)者而言,選擇聚焦產(chǎn)業(yè)垂直應(yīng)用被證實(shí)確實(shí)是一條更具實(shí)用價(jià)值的道路。
不過(guò),不同于通用大模型,產(chǎn)業(yè)大模型對(duì)行業(yè)參與者也提出了不同的門檻和要求:一方面,產(chǎn)業(yè)大模型要求開(kāi)發(fā)者具備一定技術(shù)積累和實(shí)力;另一方面,產(chǎn)業(yè)大模型也要求操盤者具備豐富的產(chǎn)業(yè)應(yīng)用實(shí)踐場(chǎng)景。
梁建章告訴《中國(guó)企業(yè)家》:“通用大模型最重要的指標(biāo)可能是,多少的參數(shù)或者是用多少的GPU等等,但垂直大模型,大語(yǔ)言模型只是其中的一個(gè)組成部分,它還有和其他數(shù)據(jù)的結(jié)合,包括人工的校驗(yàn)等等,這些是更重要的。最終指向是不是可以把客戶的這些提問(wèn)、問(wèn)答來(lái)檢驗(yàn)效率提升了多少,準(zhǔn)確性、可靠性提升了多少?!?/p>
“旅游最大問(wèn)題就是可靠性,這確實(shí)比AI作詩(shī)、寫文章、寫小說(shuō)可能更復(fù)雜,也是一項(xiàng)長(zhǎng)期的工作,凡是可以把這個(gè)提升到80%、90%,95%,甚至99%的事情,都是值得有必要做的。”梁建章最后表示。
相關(guān)稿件