AI大模型會(huì)變傻嗎?
這事或正在發(fā)生!
頂級(jí)科學(xué)期刊《自然》發(fā)表的最新研究給似乎將變得無(wú)所不能的大模型判了“死緩”,將這種糟糕情況描述為“大模型崩潰”。
《自然》雜志最新一期封面,圖源:Nature
除了變傻,大模型還面臨發(fā)展路線分歧。一條傾向于把通用大模型做到盡可能完善,然后自上而下實(shí)現(xiàn)產(chǎn)業(yè)、商業(yè)場(chǎng)景全覆蓋;一條則是扎根產(chǎn)業(yè),從實(shí)際應(yīng)用中自下而上催生成熟的產(chǎn)業(yè)大模型,為通用大模型的完善積累“智慧”。
有意思的是,根據(jù)《全球數(shù)字經(jīng)濟(jì)白皮書(2024)》統(tǒng)計(jì),目前全球的基礎(chǔ)大模型有1328個(gè),美國(guó)最多,中國(guó)第二。而產(chǎn)業(yè)大模型,中國(guó)表現(xiàn)了極大的熱忱。更有意思的是,美國(guó)企業(yè)多傾向第一條路線,而中國(guó)開發(fā)者則越來(lái)越扎堆第二條路線。很難說(shuō)兩條路線誰(shuí)更具優(yōu)勢(shì)。不過(guò)對(duì)《自然》的最新警告,很可能不會(huì)出現(xiàn)在走第二條路線的中國(guó)開發(fā)者身上。
人們期待AI大模型引領(lǐng)人類開啟新紀(jì)元的愿望有多熱切,“大模型崩潰”帶來(lái)的打擊就有多強(qiáng)烈。
下一次大模型泡沫說(shuō)不定就是被它引爆的。這種事在互聯(lián)網(wǎng)與資本的蜜月期也屢見(jiàn)不鮮。
如果訓(xùn)練大模型時(shí),只用AI生成的內(nèi)容,會(huì)導(dǎo)致大模型出現(xiàn)不可逆的缺陷。一些在第一代數(shù)據(jù)中出現(xiàn)的低頻詞,在以后的迭代中出現(xiàn)的頻率會(huì)更低,而一些常見(jiàn)詞匯出現(xiàn)的頻率則逐漸增加。久而久之,模型逐漸無(wú)法正確模擬真實(shí)世界的復(fù)雜性。錯(cuò)誤被層層累積、逐漸放大,最終導(dǎo)致“模型崩潰”。
很像生物學(xué)中“近親繁殖”導(dǎo)致后代缺陷的過(guò)程。
如何規(guī)避“模型崩潰”陷阱,讓大模型更好的成長(zhǎng)呢?
接地氣是選擇之一。事實(shí)上,許多中國(guó)大模型開發(fā)者就是這么做的。
比如京東推出的言犀大模型,以及基于大模型產(chǎn)生的京醫(yī)千詢、京點(diǎn)點(diǎn)、小哥智能終端助手等一系列智能體應(yīng)用。
截至目前,京東大模型落地超過(guò)100個(gè)場(chǎng)景,支持了23萬(wàn)+商家,2萬(wàn)+京東采銷,1萬(wàn)+研發(fā)人員;不但涵蓋零售、供應(yīng)鏈等核心領(lǐng)域,還能兼顧辦公自動(dòng)化、法務(wù)、風(fēng)控、合同審核、數(shù)據(jù)分析的解決方案,并拓展到了健康領(lǐng)域。
京東大模型開發(fā)最大特色就是從實(shí)踐中來(lái)到實(shí)踐中去,大模型在京東基本實(shí)現(xiàn)了祛魅,即使是普通的業(yè)務(wù)人員都能自己定制、拿來(lái)就用。
能用、好用的大模型,緣于京東對(duì)供應(yīng)鏈的深耕。
回溯歷史,供應(yīng)鏈可謂歷次產(chǎn)業(yè)革命的集大成者。諸多巨型企業(yè)、經(jīng)濟(jì)學(xué)家、管理學(xué)家、還有產(chǎn)業(yè)研究者早早就把供應(yīng)鏈整體協(xié)同優(yōu)化,視為企業(yè)更上層樓的關(guān)鍵。
舉個(gè)簡(jiǎn)單的例子,一輛汽車的零部件通常超過(guò)3萬(wàn)件,核心工廠很難生產(chǎn)全部零部件,會(huì)把大部分零部件交給上下游企業(yè)生產(chǎn)。但汽車裝配對(duì)零部件供貨時(shí)間要求極高,協(xié)同不好就會(huì)影響交貨。
所以,最早的產(chǎn)業(yè)互聯(lián)網(wǎng)就是由美國(guó)汽車四巨頭聯(lián)手締造。
而京東產(chǎn)業(yè)大模型的橫空出世,似乎有一點(diǎn)歷史宿命的意味。
供應(yīng)鏈?zhǔn)钱a(chǎn)業(yè)中數(shù)據(jù)最集中、協(xié)同最復(fù)雜的場(chǎng)景,通過(guò)數(shù)據(jù)實(shí)現(xiàn)管理優(yōu)化即可提升供應(yīng)鏈效率,通過(guò)落地大模型能夠快速釋放供應(yīng)鏈效能,相比其它場(chǎng)景能最快發(fā)揮智能的優(yōu)勢(shì)。
京東有一個(gè)公式,大模型的價(jià)值=算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度的平方。第四個(gè)乘數(shù),正好呼應(yīng)了我們前文中提到的第二條路線的特質(zhì),能極大彌補(bǔ)AI生成數(shù)據(jù)的先天不足,從而為大模型的成長(zhǎng)提供了一個(gè)更平衡、更全面的路徑。
圖源:數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢(shì)白皮書(2023)
大模型誕生到現(xiàn)在,人們?cè)缫巡辉贊M足于其強(qiáng)大的自然語(yǔ)言(含圖形)理解、語(yǔ)言生成和語(yǔ)音識(shí)別等能力,在聊天、娛樂(lè)等通識(shí)屬性較強(qiáng)的場(chǎng)景上的表現(xiàn),更寄希望于實(shí)際用起來(lái)產(chǎn)業(yè)落地,商業(yè)落地。
正如中國(guó)工程院院士鄔賀銓所說(shuō)的:對(duì)話、寫詩(shī)、作畫絕不是大模型的全部。我們需要將大模型切實(shí)投入到城市發(fā)展、金融科技、生物醫(yī)藥、工業(yè)制造、科學(xué)研究等領(lǐng)域,也需要專業(yè)的企業(yè)和組織加速其在實(shí)體產(chǎn)業(yè)落地,為產(chǎn)業(yè)剛需帶來(lái)實(shí)實(shí)在在的價(jià)值,真正意義大規(guī)模服務(wù)社會(huì)。
京東就走在這條路上。京東集團(tuán)技術(shù)委員會(huì)主席、京東云事業(yè)部總裁曹鵬認(rèn)為“通用大模型靠算力堆出來(lái),企業(yè)大模型靠業(yè)務(wù)跑出來(lái)”, 并表示“京東供應(yīng)鏈?zhǔn)谴竽P蛻?yīng)用的超級(jí)孵化器?!?/p>
2024京東云峰會(huì)上,京東云展示了京東言犀大模型落地行業(yè)的領(lǐng)先技術(shù)與最新實(shí)踐,并重磅發(fā)布京東云企業(yè)大模型服務(wù)、言犀智能體平臺(tái)、智能編程助手JoyCoder、言犀數(shù)字人3.0等八大產(chǎn)品。
當(dāng)大模型遇上供應(yīng)鏈,產(chǎn)業(yè)互聯(lián)網(wǎng)的歷史一幕也許會(huì)在京東身上重現(xiàn)?
京東言犀大模型的成長(zhǎng),還能讓我們可以對(duì)世界工廠的全面刷新暢想一番。
中國(guó)擁有聯(lián)合國(guó)工業(yè)名錄門類劃分中的39個(gè)大類、191個(gè)中類、525個(gè)小類的全部門類。構(gòu)成這個(gè)龐大工業(yè)體系的是40萬(wàn)家企業(yè),其中超過(guò)90%的企業(yè)是中小微企業(yè)。
圖源:鈦媒體
都知道數(shù)智化是方向,但常規(guī)的研發(fā)者不會(huì)去鉆研不同產(chǎn)業(yè)的技術(shù)訣竅,以至于基礎(chǔ)大模型讓很多中小企業(yè)覺(jué)得高不可攀,彼此之間誰(shuí)仿佛都覺(jué)得對(duì)方離自己還遠(yuǎn)著呢。
京東云為產(chǎn)業(yè)締造了一個(gè)全新的關(guān)鍵容易上手的系統(tǒng),還是相對(duì)繁雜偏偏還離不開的供應(yīng)鏈方面。
從生產(chǎn)到流通,從原料供應(yīng)、倉(cāng)儲(chǔ),到運(yùn)輸、分銷,以及最終的消費(fèi)者,傳統(tǒng)供應(yīng)鏈的節(jié)點(diǎn)繁復(fù),交織成的網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,流通環(huán)節(jié)也總是層層障礙。
京東云本身就扎根于供應(yīng)鏈,加上之前的積淀,在零售、物流、倉(cāng)儲(chǔ)、金融、健康、工業(yè)等產(chǎn)業(yè)擁有深入實(shí)踐,還參與了城市、政務(wù)、金融、制造、工業(yè)、航空、交通、園區(qū)、能源等產(chǎn)業(yè)。
京東云很多年前就確定了數(shù)智供應(yīng)鏈的目標(biāo)。其核心理念是產(chǎn)業(yè)聯(lián)結(jié)、數(shù)智創(chuàng)新和生態(tài)融合,通過(guò)數(shù)智供應(yīng)鏈建設(shè),企業(yè)能夠從產(chǎn)業(yè)鏈全局優(yōu)化效率,以數(shù)智技術(shù)驅(qū)動(dòng)數(shù)實(shí)融合,同時(shí)聯(lián)結(jié)更多生態(tài)伙伴,實(shí)現(xiàn)更高效的數(shù)字化轉(zhuǎn)型。
大模型的落地,讓數(shù)智供應(yīng)鏈再次蛻變,線性鏈條連接“孤島”,交織成一個(gè)復(fù)雜網(wǎng)絡(luò),進(jìn)而實(shí)現(xiàn)有限的自主呼應(yīng),有點(diǎn)類似藤曼纏繞的雨林結(jié)構(gòu),如今這個(gè)系統(tǒng)又有了高級(jí)統(tǒng)御的智慧。
AI智能體(AI Agent)被視為過(guò)往技術(shù)發(fā)展的集大成者,在工業(yè)界已得到共識(shí),能夠廣泛適配各類應(yīng)用場(chǎng)景。AI智能體以大型語(yǔ)言模型(LLM)作為核心控制器構(gòu)建,可以構(gòu)建出強(qiáng)大的問(wèn)題解決器。
言犀智能體平臺(tái)
京東云言犀智能體平臺(tái)是新一代一站式 AI Agent 開發(fā)平臺(tái),目前已接入數(shù)十個(gè)大模型,它幾乎就是一個(gè)為使用而生的平臺(tái)。無(wú)論用戶是否有編程基礎(chǔ),從解決簡(jiǎn)單的問(wèn)答到處理復(fù)雜邏輯的業(yè)務(wù)問(wèn)題,都可以在平臺(tái)上低成本快速搭建基于 AI 模型的各類快捷應(yīng)用。
比如外貿(mào)供應(yīng)鏈的報(bào)關(guān)場(chǎng)景,會(huì)產(chǎn)生大量報(bào)關(guān)碼(HS code),需要人工尋找到每個(gè)code,還要手動(dòng)輸入商品描述。京東云言犀智能體平臺(tái)通過(guò)workflow反向RAG,描繪商品,找到對(duì)應(yīng)code。另外還有智能體低代碼開發(fā)的應(yīng)用構(gòu)件,輸入一段描述的自然語(yǔ)言,就可以基于Agent生成應(yīng)用。
還有外貿(mào)中的訂單履約場(chǎng)景,過(guò)去需要通過(guò)客服問(wèn)詢,京東云通過(guò)言犀智能體平臺(tái)調(diào)用API,就能查到訂單履約到哪了;通過(guò)Agent調(diào)用對(duì)應(yīng)的foundation,就能查到物流訂單到哪了。而且拆單狀態(tài)、履約情況、合同審核等場(chǎng)景在國(guó)際貿(mào)易時(shí)不能只用中文,還需要多種語(yǔ)言,基于AgentAIG就能輕松實(shí)現(xiàn)多語(yǔ)言問(wèn)答。
通用大模型要做到這一步,往往會(huì)出現(xiàn)開發(fā)冗余、貨不對(duì)板或者成本高企,而針對(duì)性強(qiáng)的產(chǎn)業(yè)大模型卻能夠同時(shí)對(duì)齊了成本、效率、體驗(yàn)三方面要求。
對(duì)業(yè)務(wù)場(chǎng)景的理解與觸達(dá),對(duì)產(chǎn)業(yè)數(shù)據(jù)的積淀與運(yùn)用,是京東言犀大模型保持精度的重要前提。實(shí)際上,言犀大模型數(shù)據(jù)就是由70%的通用數(shù)據(jù)與30%供應(yīng)鏈場(chǎng)景生長(zhǎng)的原生數(shù)據(jù)構(gòu)成。
你能想象京東的小哥都在自如實(shí)現(xiàn)與大模型的對(duì)接嗎?
多場(chǎng)景智能助手 特定角色提供專業(yè)服務(wù)
小哥的崗前培訓(xùn),比如具體到服務(wù)過(guò)程中如何處理異常?哪些違禁品不能郵寄?以及耗材等問(wèn)題……
過(guò)去他們需要記住大量專業(yè)知識(shí),過(guò)程長(zhǎng),還容易出錯(cuò),現(xiàn)在京東云基于言犀大模型為小哥量身訂制了終端智能助手,這位“助手”能牢記從攬收、派送、站內(nèi)、輔助、客戶服務(wù)等143項(xiàng)標(biāo)準(zhǔn)作業(yè)動(dòng)作,到貨物處理規(guī)程、安全操作標(biāo)準(zhǔn)、KA客戶等915個(gè)服務(wù)要求都能回答。
對(duì)于物流、派送地址等常規(guī)操作,小哥甚至只需要?jiǎng)觿?dòng)嘴,小哥助手就能優(yōu)化流程,給出優(yōu)化方案。
如今物流的小哥終端智能助手已服務(wù)近35萬(wàn)京東自有配送員。
京東集團(tuán)副總裁何曉冬將這比作培養(yǎng)一個(gè)人,“如果一個(gè)人高中畢業(yè)后直接出去打工,似乎也行,但專業(yè)性會(huì)差一點(diǎn)。要是能讀完四年本科再出去工作,就既有通識(shí)能力又有足夠的專業(yè)知識(shí),這是產(chǎn)業(yè)大模型應(yīng)該具備的能力”。
至此,京東供應(yīng)鏈與大模型,形成了一對(duì)奇特耦合且螺旋上升關(guān)系:一方面,大模型的出現(xiàn)為供應(yīng)鏈的深化、優(yōu)化、數(shù)智化提供了新的增長(zhǎng)點(diǎn);另一方面,京東供應(yīng)鏈的復(fù)雜場(chǎng)景產(chǎn)生的真實(shí)數(shù)據(jù)可以訓(xùn)練大模型,讓大模型在供應(yīng)鏈上先跑起來(lái);進(jìn)而,不斷成長(zhǎng)的大模型又將賦能供應(yīng)鏈,激發(fā)更大的改變。
這種結(jié)構(gòu)像極了DNA,不斷延伸延展,孕育無(wú)限可能。也在述說(shuō)著,更適合企業(yè)的大模型真的可以一邊跑一邊訓(xùn)出來(lái)。
DNA結(jié)構(gòu),圖源:University of Minnesota Libraries
種一棵樹最好的時(shí)間是十年前,其次是現(xiàn)在。
京東云對(duì)大模型深耕落地產(chǎn)業(yè)的理解,不是種樹,而是種森林。
這種“森林思維”很契合大模型的養(yǎng)成。
以往我們發(fā)展大模型,尤其是通用大模型,缺芯片導(dǎo)致算力不足,算法也有差距也就罷了,連原本應(yīng)該最豐富的數(shù)據(jù),也因?yàn)閿?shù)據(jù)標(biāo)準(zhǔn)化等諸多問(wèn)題,而變得無(wú)法用于大模型的訓(xùn)練。
甚為可惜。
不過(guò),京東云做產(chǎn)業(yè)大模型的歷程展示了一條因地制宜的發(fā)展國(guó)產(chǎn)大模型的新的路徑。
和生產(chǎn)場(chǎng)景無(wú)限接近,加上互聯(lián)網(wǎng)企業(yè)的基因,讓京東云在特定的領(lǐng)域積累了大量?jī)?yōu)質(zhì)的數(shù)據(jù),這些數(shù)據(jù)對(duì)于產(chǎn)業(yè)、垂類大模型是再優(yōu)質(zhì)不過(guò)的養(yǎng)料。
多年以前,面對(duì)復(fù)雜的消費(fèi)和零售價(jià)值鏈,劉強(qiáng)東將每個(gè)環(huán)節(jié)總結(jié)成“十節(jié)甘蔗”,隨后京東選擇滲透進(jìn)入更多的甘蔗節(jié)數(shù)——將業(yè)務(wù)延伸至倉(cāng)儲(chǔ)、配送、售后、營(yíng)銷之外的生產(chǎn)、研發(fā)等供應(yīng)鏈其他環(huán)節(jié)。
如今吃透每個(gè)環(huán)節(jié),讓京東的產(chǎn)業(yè)大模型在應(yīng)對(duì)具體的場(chǎng)景時(shí)就仿佛含著金鑰匙出生。
中國(guó)企業(yè)有望證實(shí)大模型第二條商業(yè)路徑的合理性。
如今,全球通用大模型競(jìng)爭(zhēng)白熱化,對(duì)高端GPU的追求,堆爆了英偉達(dá)的股價(jià),讓其一度超越蘋果、微軟,登頂全球最大市值企業(yè),也同時(shí)讓大多數(shù)渴望大模型引發(fā)傳統(tǒng)產(chǎn)業(yè)嬗變的企業(yè)開始望洋興嘆。
因?yàn)樗鼈兗炔缓糜?#xff0c;更加用不起。
國(guó)際通行的評(píng)判大模型的標(biāo)準(zhǔn)是算力、算法、數(shù)據(jù)。以京東云為代表的一部分中國(guó)企業(yè)則以自己與產(chǎn)業(yè)的高度融合,提出了大模型產(chǎn)業(yè)落地“新三要素”:場(chǎng)景、產(chǎn)品、算力。
復(fù)雜的交互智能場(chǎng)景及其產(chǎn)生的動(dòng)態(tài)數(shù)據(jù)、從單一算法競(jìng)爭(zhēng)到形成可以牽引成體系算法創(chuàng)新與突破的產(chǎn)品和能支撐這樣的場(chǎng)景與系統(tǒng)的新型算力。
基本理念是基座大模型靠堆卡訓(xùn)練,企業(yè)大模型靠人用出來(lái)。
本次2024京東云峰會(huì),京東云發(fā)布三大智能平臺(tái)、五大領(lǐng)先技術(shù)產(chǎn)品,從基礎(chǔ)設(shè)施到Agent應(yīng)用,構(gòu)建全場(chǎng)景的大模型服務(wù)能力,持續(xù)推動(dòng)大模型落地產(chǎn)業(yè):
· 京東云企業(yè)大模型服務(wù),支持一站式打造企業(yè)專屬大模型,將垂直領(lǐng)域知識(shí)注入到模型的同時(shí),不損失模型的通用能力,且更加經(jīng)濟(jì)適用;
· 言犀AI開發(fā)計(jì)算平臺(tái)2.0,內(nèi)置20余種開源模型和豐富的數(shù)據(jù)集,提供100余種算法和工具鏈,提供低門檻、高性價(jià)比的大模型開發(fā)服務(wù);
· 京東云大模型安全可信平臺(tái),涵蓋超過(guò)200種特有的紅藍(lán)對(duì)抗攻擊手法,覆蓋監(jiān)管合規(guī)要求的全部31類風(fēng)險(xiǎn)類型,風(fēng)險(xiǎn)分析準(zhǔn)確率高達(dá)95%以上;
· 京東云云艦AI算力云,支持多地域分布式算力的統(tǒng)一調(diào)度,提供高性價(jià)比的算力供給;
· 新一代分布式存儲(chǔ)云海3.0,支持千億級(jí)參數(shù)AI大模型,4K隨機(jī)寫IOPS達(dá)到1000萬(wàn)級(jí),平均延遲在100微秒級(jí),極致性能更好地支持大模型落地應(yīng)用。
真正適合企業(yè)的越來(lái)越多的大模型應(yīng)用,正在京東供應(yīng)鏈上生長(zhǎng)出來(lái)。在內(nèi)部業(yè)務(wù)中根據(jù)實(shí)際需求找到大模型落地的場(chǎng)景后,京東云已能對(duì)外輸出能力。
今年京東618期間,京東云言犀數(shù)字人在5000+品牌穩(wěn)定開播,在汽車、跨境美妝、珠寶首飾、3C數(shù)碼、家電家居、醫(yī)療健康等多品類播間帶動(dòng)閑時(shí)轉(zhuǎn)化率提升超30%,直播累計(jì)時(shí)長(zhǎng)超40萬(wàn)小時(shí),累計(jì)觀看人次超1億,互動(dòng)頻次500萬(wàn)+次。
京東云言犀數(shù)字人依托全新升級(jí)的3.0版本,以超100個(gè)性化角色、超50行業(yè)特定屬性場(chǎng)景,表現(xiàn)超過(guò)行業(yè)80%的主播。除電商直播場(chǎng)景外,言犀數(shù)字人還在文旅、金融、智能服務(wù)、政務(wù)咨詢等更廣泛的場(chǎng)景應(yīng)用落地,與億級(jí)用戶智能交互,帶來(lái)下一代交互體驗(yàn)。
健康大模型京醫(yī)千詢成為基于行業(yè)內(nèi)首個(gè)實(shí)物與服務(wù)相聯(lián)通、知識(shí)與數(shù)據(jù)相融合的醫(yī)療大模型。免費(fèi)智能醫(yī)生“康康”結(jié)合京東健康億級(jí)醫(yī)患會(huì)話和豐富的實(shí)物、服務(wù)、內(nèi)容等供應(yīng)鏈資源,提供專業(yè)咨詢服務(wù);專屬個(gè)人醫(yī)助支持病情收集、診斷推薦、治療方案推薦、病情解釋、智能病歷等功能,全流程輔助醫(yī)生提升問(wèn)診效率。如今京東健康皮膚醫(yī)院基于大模型的AI輔診準(zhǔn)確率超過(guò)95%。
“道生一,一生二,二生三,三生萬(wàn)物?!薄兜赖陆?jīng)》認(rèn)為天地萬(wàn)物的始基與母源在于“道”。在供應(yīng)鏈和大模型的“宇宙”中,京東云尋到了“道”。
2017年京東戰(zhàn)略會(huì)上,劉強(qiáng)東高喊“技術(shù)、技術(shù)、技術(shù)”的戰(zhàn)略。7年過(guò)去了,京東云在大模型產(chǎn)業(yè)應(yīng)用實(shí)踐中,成為這家企業(yè)戰(zhàn)略遠(yuǎn)見(jiàn)與定力的力證。
什么是新質(zhì)生產(chǎn)力?
什么是最優(yōu)的產(chǎn)業(yè)轉(zhuǎn)型升級(jí)路徑?
在新技術(shù)激蕩的時(shí)代,其實(shí)就是用新技術(shù)把你熟悉的一切從頭到腳重新做一遍。
當(dāng)大模型落地離我們?cè)絹?lái)越近,京東云再次選擇把大模型做實(shí),把供應(yīng)鏈做透。
其實(shí)腳踏實(shí)地,與仰望星空并不沖突。京東云能讓大模型與有史以來(lái)最龐大的世界工廠的融合得多一點(diǎn),更順滑一點(diǎn),那樣的情景都足以令人心潮澎湃。
相關(guān)稿件