5月10日消息,近期中國移動研究院發(fā)布《我國人工智能大模型發(fā)展動態(tài)》報告,對國內涉足人工智能大模型訓練的多家企業(yè)及科研院所進行評估。中國移動研究院認為,從大模型業(yè)界評估看,國內大模型與GPT-4有差距,但科技大廠具備追趕實力,百度、阿里巴巴、騰訊、華為等在大模型研發(fā)投入、技術能力和人才團隊等綜合實力較強;在商用推進方面,依托現(xiàn)有業(yè)務領域形成大模型應用規(guī)模效應。
報告指出,國內大模型研發(fā)應用領域熱潮持續(xù)高漲。據(jù)不完全統(tǒng)計,目前國內至少有19家企業(yè)及科研院所涉足人工智能大模型訓練,主要分為大型科技公司、科研院校和初創(chuàng)科技團隊三類。
從大模型的布局體系來看,百度、阿里、華為等大型科技公司從算力層、平臺層、模型層、應用層進行了全面布局,科研院及初創(chuàng)科技公司主要以研發(fā)大模型算法及細分領域應用為主。以百度為例,百度“昆侖芯+飛槳平臺+文心大模型+行業(yè)應用”在芯片層、框架層、模型層和應用層布局最完整。四層架構之間能形成層到層的反饋、端到端的優(yōu)化,尤其是框架層的飛槳和模型層的文心大模型。最新數(shù)據(jù)顯示,飛槳與文心一言協(xié)同專項優(yōu)化在一個月內迭代4次,推理性能提升10倍,其中分布式推理引擎推理性能提升了123%。阿里的“含光800芯片+M6-OFA底座+通義大模型+行業(yè)應用”、華為的“昇騰芯片+MindSpore框架+盤古大模型+行業(yè)應用”也是多層布局。
報告認為,從大模型參數(shù)量看,大型科技公司的參數(shù)量遠大于科研院所,但基本都處于千億及以上規(guī)模,而科研院校大模型的參數(shù)量在千億級及以下。公開資料顯示,2019年,百度發(fā)布文心大模型ERNIE,目前已迭代至千億級參數(shù)的ERNIE3.0Zeus。2023年3月起,百度相繼發(fā)布了知識增強大語言模型產(chǎn)品“文心一言”和一站式企業(yè)級大模型生產(chǎn)平臺“文心千帆大模型平臺”。
報告數(shù)據(jù)顯示,從綜合實力和商用推進方面,百度文心大模型和文心一言均領先,處于第一梯隊頭部。在商用推進方面,百度文心大模型拓展內外部應用,目前面向公眾和企業(yè)用戶同時進行開放測試。文心大模型在金融、能源、制造、城市、傳媒、互聯(lián)網(wǎng)等行業(yè)應用案例落地廣泛。截至目前,已經(jīng)有15萬企業(yè)申請加入文心一言內測,覆蓋政務、金融、媒體、電商零售等行業(yè)。
另據(jù),國際權威咨詢機構IDC在今年2月發(fā)布的《2022中國大模型發(fā)展白皮書》中,提出了行業(yè)首個大模型評估框架,根據(jù)評估結果,百度文心大模型在市場格局中同樣處于第一梯隊領先位置,產(chǎn)品能力、生態(tài)能力、應用能力均受到廣泛認可。
相關稿件