提問“外感風(fēng)寒推薦哪些方劑”,系統(tǒng)在幾秒鐘內(nèi)就能列出麻黃湯、桂枝湯等方劑與具體成分;提問“身體濕氣重有哪些危害”,系統(tǒng)也能快速給出全面解答、提出飲食調(diào)理等治療方法……走進天津天開高教科創(chuàng)園5號樓,天大智圖(天津)科技有限公司的工作人員正忙碌地對“海河·岐伯”中醫(yī)藥大模型展開內(nèi)測。公司研發(fā)總監(jiān)徐大為說,在人工智能輔助下,大模型能為臨床醫(yī)生提供內(nèi)容更廣泛、更全面的輔助診療建議,進一步提高中醫(yī)診療效率。
提出問題,迅速獲得專業(yè)回答;輸入需求,在線進行服裝設(shè)計;提供圖紙,自動完成冰箱組裝……近期在天津舉辦的2024世界智能產(chǎn)業(yè)博覽會上,一批聚焦工業(yè)、制造業(yè)應(yīng)用的垂直領(lǐng)域大模型成為與會人士關(guān)注的焦點。
推動大模型更加深入賦能工業(yè)制造業(yè),是人工智能行業(yè)發(fā)展的重要方向。但由于供需不匹配、數(shù)據(jù)難獲得、算力水平低等問題,工業(yè)大模型當(dāng)前的發(fā)展速度和規(guī)模仍受制約。面對人工智能“百模大戰(zhàn)”風(fēng)起云涌的現(xiàn)實環(huán)境,工業(yè)大模型如何聚焦細分領(lǐng)域、加速創(chuàng)新破局?
工業(yè)大模型發(fā)展如火如荼
隨著新一代人工智能技術(shù)的發(fā)展,基于大模型的生成式人工智能以學(xué)習(xí)能力強、處理速度快、服務(wù)個性化等優(yōu)勢,成為智能科技領(lǐng)域的“寵兒”,尤為吸睛。
作為海爾卡奧斯工業(yè)互聯(lián)網(wǎng)平臺在人工智能領(lǐng)域的前沿科技成果,卡奧斯工業(yè)大模型COSMO-GPT亮相2024世界智能產(chǎn)業(yè)博覽會。在產(chǎn)品發(fā)布環(huán)節(jié),卡奧斯工業(yè)智能研究院執(zhí)行院長秦承剛分享了卡奧斯工業(yè)大模型在助力工業(yè)企業(yè)優(yōu)化工藝、流程、成本、效率等方面的功能。
“通過對開源大模型進行微調(diào)訓(xùn)練,卡奧斯工業(yè)大模型COSMO-GPT注入了562個工業(yè)數(shù)據(jù)集,擁有300多萬條高質(zhì)量工業(yè)數(shù)據(jù)、3900多個機理模型和200多個專家模型,推理準確率達到了96%以上,意圖識別準確率達到了85%以上?!鼻爻袆傉f。
羚羊工業(yè)大模型也吸引了許多觀眾駐足體驗,他們紛紛就“地效翼船的工作原理是什么”“生產(chǎn)制造焊條要依據(jù)哪些標準”等話題進行提問,大模型都能第一時間回復(fù)。在大模型的工業(yè)視覺質(zhì)檢助手中,上傳一張圖片,輸入“識別沒有戴安全帽的人”,系統(tǒng)很快就能準確進行判斷。
羚羊工業(yè)互聯(lián)網(wǎng)股份有限公司總裁徐甲甲說,羚羊工業(yè)大模型是以訊飛星火認知大模型的通用能力為核心技術(shù)底座,結(jié)合工業(yè)場景實際需求打造的大模型,具有工業(yè)文本生成、工業(yè)知識問答、工業(yè)理解計算、工業(yè)代碼生成、工業(yè)多模態(tài)等核心能力,可以從海量數(shù)據(jù)和大規(guī)模知識中持續(xù)進化,實現(xiàn)從提出、規(guī)劃到解決問題的全流程閉環(huán)。
“過去一年,大模型的長足進步使得信息分發(fā)獲取、內(nèi)容生產(chǎn)、全自然交互都顯現(xiàn)出極大不同,逐步改變著科研范式、產(chǎn)業(yè)形態(tài)與市場競爭格局?!笨拼笥嶏w股份有限公司董事長劉慶峰表示,隨著“底座”能力的提升,不少技術(shù)進展將能與大模型“通”“?!苯Y(jié)合,賦能行業(yè)發(fā)展。
不同于通用大語言模型,研發(fā)工業(yè)領(lǐng)域垂類大模型需要大量生產(chǎn)工藝、質(zhì)量檢測等核心數(shù)據(jù)。菲特(天津)檢測技術(shù)有限公司創(chuàng)始人曹彬回憶,最初,企業(yè)雖依靠長期實踐積累了大量工業(yè)數(shù)據(jù),但并沒想到這竟會成為公司發(fā)展的一筆寶貴財富。
“現(xiàn)在,這些數(shù)據(jù)成了我們技術(shù)創(chuàng)新的‘核心秘籍’?!辈鼙蛘f,依托數(shù)據(jù)優(yōu)勢與核心算法平臺,企業(yè)研發(fā)的工業(yè)垂類大模型就像生產(chǎn)線上的專家“智囊團”與實時“診療師”,針對生產(chǎn)瓶頸與設(shè)備故障迅速“對癥下藥”、答疑解難,并提出優(yōu)化生產(chǎn)調(diào)度和調(diào)整工藝參數(shù)的建議,推動產(chǎn)品提質(zhì)升級、幫助企業(yè)降本增效。去年,該公司實現(xiàn)營業(yè)收入2.33億元,收入連續(xù)三年快速增長。
工業(yè)和信息化部賽迪研究院發(fā)布的數(shù)據(jù)顯示,2023年,中國生成式人工智能的企業(yè)采用率已達15%,市場規(guī)模約為14.4萬億元。專家預(yù)測,2035年生成式人工智能有望為全球貢獻近90萬億元的經(jīng)濟價值,其中中國將突破30萬億元。
“未來,通過發(fā)揮數(shù)據(jù)要素的‘融合劑’和‘催化劑’作用,現(xiàn)有業(yè)態(tài)和數(shù)字業(yè)態(tài)將得以進一步跨界融合,衍生疊加出新環(huán)節(jié)、新鏈條、新活動形態(tài),推動產(chǎn)業(yè)升級?!碧旖蚶砉ご髮W(xué)計算機科學(xué)與工程學(xué)院教授王勁松說。
多重短板制約規(guī)模化應(yīng)用
業(yè)內(nèi)人士表示,以基礎(chǔ)大模型為技術(shù)底座、以工業(yè)應(yīng)用為切入點推動AI行業(yè)發(fā)展已成為業(yè)內(nèi)共識,但目前供需不匹配、數(shù)據(jù)難獲得、算力水平低等問題仍在制約大模型進一步發(fā)揮賦能效用。
——不夠“聰明”,部分產(chǎn)品僅能“打醬油”。多位受訪人士表示,大模型在制造業(yè)領(lǐng)域應(yīng)用潛力巨大,但目前不少大模型仍難以匹配適應(yīng)企業(yè)生產(chǎn)的實際需要。佛山市順德區(qū)捷通數(shù)碼科技有限公司總經(jīng)理廖偉權(quán)表示,企業(yè)的智能監(jiān)控終端產(chǎn)品需要進行視覺訓(xùn)練,若有大模型幫助,可大幅提高效率,但目前市面上可用的大模型產(chǎn)品有限。
部分政務(wù)大模型聲稱具有工業(yè)相關(guān)內(nèi)容,但其專業(yè)化水平相對較低。360集團創(chuàng)始人周鴻祎說,一些大模型在企業(yè)和政府內(nèi)部應(yīng)用時,使用者會發(fā)現(xiàn)其不僅缺乏行業(yè)深度,對業(yè)務(wù)也并不熟悉?!斑@些大模型一般是基于互聯(lián)網(wǎng)上的公開數(shù)據(jù)訓(xùn)練而成的,往往難以滿足實際需求。”
——“各自為戰(zhàn)”,數(shù)據(jù)要素流動難。大規(guī)模數(shù)據(jù)是大模型能力的基礎(chǔ)保障,但目前數(shù)據(jù)體系建設(shè)仍存在多項短板。國家智能網(wǎng)聯(lián)汽車創(chuàng)新中心首席科學(xué)家李克強表示,受限于工業(yè)場景碎片化、工業(yè)領(lǐng)域訓(xùn)練數(shù)據(jù)采集整理困難等問題,單一企業(yè)開發(fā)的大模型往往存在數(shù)據(jù)量不足、完備性不夠等問題,導(dǎo)致大模型與行業(yè)融合應(yīng)用難。王勁松認為,盡管我國擁有海量的數(shù)據(jù)資源,但是數(shù)據(jù)“孤島”和數(shù)據(jù)“煙囪”問題依然嚴峻,迫切需要找到突破口、打破數(shù)據(jù)壁壘。
同時,數(shù)據(jù)隱私與版權(quán)等問題也在一定程度上制約了數(shù)據(jù)的流動?!艾F(xiàn)在的知識已經(jīng)被大模型解構(gòu)甚至‘像素化’了,很難直觀地看出大模型產(chǎn)生的內(nèi)容參考引用了哪些知識、信息或藝術(shù)風(fēng)格?!鼻迦A大學(xué)新聞與傳播學(xué)院教授沈陽表示,隨著AI對人類的理解越來越全面深入,其對人類隱私的侵犯也會越來越直接和嚴峻,在數(shù)據(jù)交易過程中數(shù)據(jù)版權(quán)的保護也會更加困難,這使得數(shù)據(jù)確權(quán)問題成為一項挑戰(zhàn)。
——算力“卡殼”,公共云占比較低。大模型發(fā)展背后必須有龐大的算力基礎(chǔ)作為支撐。專家表示,公共云是破解我國“人工智能+”時代算力“供不上、用不起”的重要抓手,能以資源利用效率最大化的方式,讓更多的用戶享受普適普惠的算力服務(wù),但目前公共云發(fā)展仍存在不少短板。國家信息中心發(fā)布的《“人工智能+”時代公共云發(fā)展模式與路徑研究》顯示,2018年至2022年,我國在用數(shù)據(jù)中心機架總規(guī)模年均增速超過30%,但2022年上架率僅58%,低于全球平均水平。
國家信息中心信息化和產(chǎn)業(yè)發(fā)展部主任單志廣認為,目前我國算力利用率仍不高,公共云占比較低尤其制約了大模型規(guī)?;瘧?yīng)用。
加速破局尚需多方合力
專家認為,隨著人工智能技術(shù)和應(yīng)用領(lǐng)域持續(xù)拓展,政府、企業(yè)等各方仍需積極參與,推出更多滿足各行業(yè)需要的垂直大模型,推動產(chǎn)業(yè)轉(zhuǎn)型升級和高質(zhì)量發(fā)展。
首先,加快推進數(shù)據(jù)要素市場建設(shè)。2023年底,國家數(shù)據(jù)局等17部門聯(lián)合印發(fā)《“數(shù)據(jù)要素×”三年行動計劃(2024—2026年)》,旨在推動建設(shè)人工智能高質(zhì)量數(shù)據(jù)集,并鼓勵社會公益機構(gòu)、大模型企業(yè)、新型數(shù)商積極參與,為大模型加速發(fā)展奠定了制度基礎(chǔ)。王勁松認為,應(yīng)加快構(gòu)建重要領(lǐng)域數(shù)據(jù)資源基礎(chǔ)庫,加速完善面向現(xiàn)代化產(chǎn)業(yè)體系建設(shè)的數(shù)據(jù)開發(fā)開放和流通使用制度體系和服務(wù)生態(tài)。在保證安全的前提下,加速建設(shè)數(shù)據(jù)要素市場,加強數(shù)據(jù)供給激勵,給予數(shù)據(jù)采集、加工、流通、應(yīng)用等不同環(huán)節(jié)相關(guān)主體一定的試錯空間,鼓勵面向數(shù)據(jù)要素價值實現(xiàn)的科技創(chuàng)新和產(chǎn)業(yè)創(chuàng)新,著力推動數(shù)據(jù)高質(zhì)量供給與數(shù)據(jù)創(chuàng)新性應(yīng)用的雙向賦能和快速迭代,為發(fā)展新質(zhì)生產(chǎn)力拓展要素配置空間。
其次,依托開發(fā)者團隊為產(chǎn)業(yè)賦能。劉慶峰認為,打造一支覆蓋各行業(yè)的開發(fā)者團隊,是實現(xiàn)大模型為產(chǎn)業(yè)賦能的重要保障。據(jù)介紹,2023年5月6日“訊飛星火”正式發(fā)布以來,已新增超過273萬開發(fā)者,其中大模型直接相關(guān)的開發(fā)者數(shù)量超過52萬,企業(yè)級用戶超過32萬。秦承剛也表示,打造人工智能開放創(chuàng)新平臺至關(guān)重要,只有通過一系列應(yīng)用場景的大規(guī)模實踐,根據(jù)用戶需求反復(fù)驗證和優(yōu)化,才能形成符合工業(yè)轉(zhuǎn)型和高質(zhì)量發(fā)展需要的智能體,從而進一步復(fù)制推廣。
再次,專注單一領(lǐng)域,把大模型做小。“最近聯(lián)想、蘋果、微軟、三星都在把模型做小,要讓模型上電腦、上手機、上汽車。塊頭越做越小,能力越變越強?!敝茗櫟t說,目前,不宜再追求一個大模型解決所有的問題,而需強調(diào)術(shù)業(yè)有專攻,讓一個大模型解決一個專業(yè)問題,再由多個專業(yè)大模型組合起來一起為政府和企業(yè)工作?!爸灰悸忿D(zhuǎn)變了,過去限制大模型走進政府和企業(yè)的很多問題都會迎刃而解?!?/p>
聯(lián)想集團董事長兼CEO楊元慶也認為,將小參數(shù)的大模型部署在政府和企業(yè)內(nèi)部,可以保證數(shù)據(jù)安全。他表示,公共智能與私域智能共存、互補構(gòu)成的“混合式人工智能”,將成為大勢所趨。最佳路徑是打造人工智能個人終端設(shè)備,擁有強大的本地異構(gòu)算力,還能夠建立個人知識庫,連接開放的人工智能應(yīng)用生態(tài),從而帶來新的巨大增長機遇。
相關(guān)稿件