“大模型是中型公司的機(jī)會(huì),它既有比小公司更多的資源,又有All in的決心?!?br />
文|《中國(guó)企業(yè)家》記者 趙東山
2023年春節(jié)后,APUS創(chuàng)始人、CEO李濤在公司提出一項(xiàng)明確的要求——全員必須All in人工智能。該要求嚴(yán)格到,連行政人員也必須考慮人工智能如何改進(jìn)自己的工作。李濤甚至提出要將員工使用人工智能的程度與漲薪掛鉤。
過(guò)去的近10年中,APUS以手機(jī)系統(tǒng)和軟件出海見長(zhǎng)。面對(duì)老板這樣的要求,一部分員工自然是懵的,他們完全不理解李濤到底要干什么,就像李濤第一次見到OpenAI創(chuàng)始人Sam Altman時(shí),他本人也完全沒想到會(huì)有一個(gè)如此宏大的畫卷擺在面前一樣。
2019年,沈南鵬率領(lǐng)三思院的一眾創(chuàng)業(yè)者學(xué)員前往硅谷游學(xué),這一行中,李濤、王小川、王興、張一鳴等新銳企業(yè)家都在列,游學(xué)的重要行程就是拜訪很多硅谷的大佬,如雅虎創(chuàng)始人楊致遠(yuǎn)、Zoom創(chuàng)始人袁征等,其中的一站,他們見到了Sam Altman。
Sam Altman當(dāng)時(shí)給大家演示的案例,是人工智能在游戲場(chǎng)景中的應(yīng)用?!爱?dāng)時(shí)大家聽了都覺得很酷,但是沒有想到它的應(yīng)用場(chǎng)景有這么大?!崩顫颉吨袊?guó)企業(yè)家》回憶。
時(shí)間來(lái)到2022年11月,ChatGPT的問(wèn)世讓李濤有種“后脖頸發(fā)涼”的感覺,“驚鴻一瞥”是他當(dāng)時(shí)的感覺。
李濤驚訝地發(fā)現(xiàn),ChatGPT顛覆了以往信息交互的方式,仿佛在跟一個(gè)真人在交流,可以連續(xù)追問(wèn),它用對(duì)話機(jī)器人的方式不停給你答案,它甚至知道你在想什么。而且,ChatGPT門檻極低,很多人都可以用。這些都給了李濤極強(qiáng)的沖擊力。
從那一刻起,李濤深刻地意識(shí)到一場(chǎng)新的技術(shù)變革已經(jīng)到來(lái),一場(chǎng)新的狂歡即將開始,而作為最早意識(shí)到這一趨勢(shì)的群體之一,李濤也開始了自己的大模型探索和準(zhǔn)備。2023年4月18日,APUS發(fā)布自研的千億參數(shù)規(guī)模多模態(tài)人工智能大模型“AiLMe”,并在近日開放公測(cè)。
曙光出現(xiàn)
在亢奮地投身大模型之前,李濤身陷一種巨大的痛苦中。用他自己的話說(shuō),“找不到出路?!?/p>
過(guò)去幾年,在疫情和全球局勢(shì)變化等客觀環(huán)境之外,李濤明顯感覺到互聯(lián)網(wǎng)時(shí)代尾聲的到來(lái),他眼睜睜地看著身邊的人去炒比特幣,去做加密貨幣,隨后又加入Web3、元宇宙,轉(zhuǎn)行一波接一波,在李濤看來(lái),“本質(zhì)是大家都找不到出路”。
其實(shí),就在幾年前,APUS才剛完成一次轉(zhuǎn)型。
從2014年成立到2019年左右,APUS一直是一家主做手機(jī)系統(tǒng)和工具類應(yīng)用軟件開發(fā)的企業(yè),其主要市場(chǎng)在東南亞等新興地區(qū)和國(guó)家。2019年后,李濤越來(lái)越強(qiáng)烈地意識(shí)到,全球化就是這一代中國(guó)企業(yè)的宿命。除了東南亞等市場(chǎng),還有很多發(fā)達(dá)國(guó)家市場(chǎng)有待挖掘,如美國(guó)、歐洲、日本、韓國(guó)等等。
然而,面對(duì)發(fā)達(dá)國(guó)家市場(chǎng),勢(shì)必?zé)o法再用原來(lái)的工具和系統(tǒng),否則在這些市場(chǎng)無(wú)法得到競(jìng)爭(zhēng)優(yōu)勢(shì)。為此,過(guò)去幾年,APUS的組織能力建設(shè)和團(tuán)隊(duì)基因發(fā)生了變化,除了原來(lái)工具類的產(chǎn)品,李濤率領(lǐng)團(tuán)隊(duì)在內(nèi)容類、交易性、社交類產(chǎn)品方向上做了大規(guī)模的嘗試,并涌現(xiàn)出PickU和CutCut等小爆款。
不過(guò),那些小的成就根本無(wú)法掩蓋李濤對(duì)移動(dòng)互聯(lián)網(wǎng)紅利殆盡的感傷。ChatGPT的出現(xiàn),才讓李濤感覺看到一道曙光。
在做內(nèi)容類產(chǎn)品的過(guò)程中,李濤接觸到大量的用戶需求,僅以旗下產(chǎn)品CutCut所在圖像領(lǐng)域?yàn)槔?#xff0c;用戶就會(huì)產(chǎn)生自動(dòng)化修圖、變老、變年輕、性別轉(zhuǎn)化等需求,而為了滿足用戶的這些需求,就必須引入新的人工智能技術(shù)。借此契機(jī),APUS完成了人工智能能力第一步的積累。
等到體驗(yàn)過(guò)ChatGPT之后,其所展示出的易用性和親民性,讓李濤再次意識(shí)到人工智能技術(shù)能力在這中間起到的判斷和銜接作用。
2022年12月,李濤在公司內(nèi)部召集了一個(gè)大模型團(tuán)隊(duì),并快速立項(xiàng),將重心全部轉(zhuǎn)移到人工智能和大模型上。李濤還下了三個(gè)結(jié)論:第一,通用人工智能時(shí)代即將到來(lái),而人工智能時(shí)代的操作系統(tǒng)就是大模型;第二,APUS一定要有大模型;第三,必須得是自己做。
今年3月,APUS專門分拆成立人工智能研究院,由研究院首席專家張旭負(fù)責(zé)。張旭本科、碩士、博士均畢業(yè)于清華大學(xué),也是此次大模型的主力之一。
張旭告訴《中國(guó)企業(yè)家》,AiLMe采用目前業(yè)內(nèi)主流的Transformer架構(gòu),同時(shí)設(shè)計(jì)了一套“插件式”架構(gòu),可以自主學(xué)習(xí)和使用“工具”,這些“工具”以插件的方式接入到AiLMe平臺(tái)中。而在文本、圖像、視頻、音頻的生成部分,AiLMe則沿用了目前業(yè)內(nèi)主流的擴(kuò)散模型(Diffusion Model),并繼承了開源社區(qū)的生態(tài)。
急速轉(zhuǎn)身
2023年4月18日,APUS發(fā)布AiLMe時(shí),多少有點(diǎn)讓人驚訝,因?yàn)檫@是繼百度之后,第二個(gè)中國(guó)公司推出的大模型。
李濤告訴《中國(guó)企業(yè)家》:“背后無(wú)非兩個(gè)因素,一個(gè)是意識(shí)和決心的問(wèn)題,另一個(gè)是資源和能力的問(wèn)題。APUS并不是因?yàn)榭?#xff0c;而是因?yàn)樵??!本拖癜俣仍?019年就推出文心大模型,李濤在2022年12月就集公司之力打造大模型。
李濤關(guān)于大模型的意識(shí)和決心,除了2019年見過(guò)Sam Altman種下的種子外,還因?yàn)樵谶^(guò)去20多年的從業(yè)經(jīng)歷。
在創(chuàng)辦APUS之前,李濤曾在大唐電信做過(guò)微波通信,之后與周鴻祎一起創(chuàng)業(yè)做三七二一,后被中國(guó)雅虎收購(gòu);隨后他加入奇虎360擔(dān)任高管,并成功推出手機(jī)安全衛(wèi)士、手機(jī)助手等爆款產(chǎn)品。
李濤清楚地知道,一個(gè)新的技術(shù)時(shí)代對(duì)于操作系統(tǒng)來(lái)說(shuō)意味著巨大的紅利。他親歷了以windows+IE為操作系統(tǒng)的PC互聯(lián)網(wǎng)時(shí)代,以及蘋果+安卓為操作系統(tǒng)的移動(dòng)互聯(lián)網(wǎng)時(shí)代,他不忍心自己再錯(cuò)過(guò)即將到來(lái)的以大模型為操作系統(tǒng)的通用人工智能時(shí)代。
何況,在移動(dòng)互聯(lián)網(wǎng)出海時(shí)期,李濤已經(jīng)用速度證明過(guò)一次自己的判斷。APUS創(chuàng)辦于2014年,李濤是最早將出海帶到中國(guó)創(chuàng)投圈的創(chuàng)業(yè)者之一。那時(shí),基于Launcher桌面系統(tǒng)、清理安全、加速等工具類產(chǎn)品,APUS實(shí)現(xiàn)了“上線1個(gè)月超千萬(wàn),6個(gè)月破億”的增長(zhǎng)成績(jī)。
談到資源和能力,APUS雖然不如大廠的資金雄厚,但李濤認(rèn)為,“人工智能大模型是中型公司的機(jī)會(huì),因?yàn)樗扔斜刃」靖嗟馁Y源,又有All in的決心?!?/p>
李濤透露,目前APUS年收入在超過(guò)10億元人民幣的規(guī)模,公司賬面上也趴著10多億元現(xiàn)金。此外,目前APUS在全球用戶量已超24億,覆蓋200多個(gè)國(guó)家和地區(qū)。
此外,APUS動(dòng)作夠快的另一重因素是,采用了開放的研發(fā)模型。在APUS人工智能研究院之外,APUS還跟中科院、清華大學(xué)、南洋理工大學(xué)、香港理工大學(xué)等高校實(shí)驗(yàn)室形成開源的項(xiàng)目組,讓大模型的搭建快速落地。
高質(zhì)量的數(shù)據(jù)比算力更重要
李濤將影響大模型質(zhì)量的要素分為4類:算法、算力、數(shù)據(jù)和場(chǎng)景。在他看來(lái),如果將決定大模型效果的因素按照重要性來(lái)排序,應(yīng)該為:訓(xùn)練數(shù)據(jù)質(zhì)量>訓(xùn)練數(shù)據(jù)規(guī)模>參數(shù)規(guī)模。
在技術(shù)路線上,APUS采用大參數(shù)和大數(shù)據(jù)來(lái)訓(xùn)練中等規(guī)模模型。
“AiLMe是1000億參數(shù)的模型,但背后的數(shù)據(jù)其實(shí)是2.2萬(wàn)億的token,他們?cè)瓉?lái)都是追求所謂大參數(shù),APUS在訓(xùn)練上略有不同,我們的場(chǎng)景依賴度會(huì)更高?!崩顫嬖V《中國(guó)企業(yè)家》。
為解決算力問(wèn)題,APUS在鄭州和新加坡分別建設(shè)了兩大智算中心,在自建GPU服務(wù)器算力外,APUS還跟騰訊、阿里、亞馬遜等服務(wù)商進(jìn)行租用和采購(gòu),與第三方的算力協(xié)同作用。
在數(shù)據(jù)方面,APUS大模型的數(shù)據(jù)來(lái)源有4個(gè):第一,公開的行業(yè)數(shù)據(jù);第二,互聯(lián)網(wǎng)的公開數(shù)據(jù);第三,專門用于訓(xùn)練人工智能的數(shù)據(jù)集;第四,真實(shí)的用戶需求數(shù)據(jù),即每天有上百萬(wàn)人在使用產(chǎn)品時(shí)產(chǎn)生數(shù)據(jù)和互動(dòng),該部分在模型訓(xùn)練里的權(quán)重也非常高。
在李濤看來(lái),ChatGPT的震撼一半歸功于OpenAI團(tuán)隊(duì),另外一半得歸功于全球的用戶,因?yàn)槭侨虻挠脩舸蜷_了ChatGPT的想象空間,開啟了思維模式。
相比大家對(duì)算力的焦慮,李濤更看重高質(zhì)量的數(shù)據(jù)。
“這通常是真實(shí)用戶的真實(shí)需求和問(wèn)題,我們都脫敏過(guò),不會(huì)涉及數(shù)據(jù)隱私安全,更關(guān)注用戶的問(wèn)題和需求,至于你是誰(shuí)并不重要?!崩顫忉?#xff0c;比如,APUS旗下“智能問(wèn)答大師”產(chǎn)品每天產(chǎn)生幾十萬(wàn)的用戶問(wèn)題,這些都可以用來(lái)訓(xùn)練數(shù)據(jù)和模型。
針對(duì)具體應(yīng)用場(chǎng)景,APUS從AiLMe大模型內(nèi)蒸餾出文本、圖像、視頻、音頻四個(gè)垂直領(lǐng)域精煉模型,并基于此開發(fā)出直接面向用戶的智能問(wèn)答大師、簡(jiǎn)筆成畫、墨染、Star Night、KJV Bible Now、PicPik等AI產(chǎn)品。
在李濤看來(lái),應(yīng)用場(chǎng)景最大的好處是兩個(gè),第一,提供高品質(zhì)的數(shù)據(jù);第二,提供實(shí)時(shí)的數(shù)據(jù)。
在商業(yè)模式上,李濤采用短期to C、中長(zhǎng)期to B的模式。他認(rèn)為,to C很容易形成閉環(huán),用戶自發(fā)付費(fèi),更靈活也更有彈性。但中長(zhǎng)期一定是to B,因?yàn)橐患夜舅芨采w的場(chǎng)景一定是局限的,需要更多的行業(yè)伙伴共同建構(gòu)。未來(lái)它將無(wú)處不在,所有的服務(wù)都要用到它,整個(gè)市場(chǎng)將是10萬(wàn)億美元以上的規(guī)模。
與此同時(shí),李濤還預(yù)言,未來(lái)很多行業(yè)服務(wù)都要通過(guò)在大模型基礎(chǔ)上蒸餾出精煉模型來(lái)支撐,而不是用大模型全局支撐,因?yàn)檫@樣成本太高了,一個(gè)大模型會(huì)蒸餾出若干個(gè)經(jīng)驗(yàn)?zāi)P?#xff0c;用來(lái)支撐不同的服務(wù)。
從春節(jié)到現(xiàn)在,APUS內(nèi)部員工從部分人不解、一些人不信,到慢慢地大家都去嘗試,一切都在悄悄發(fā)生變化。如今,APUS幾乎所有的員工已經(jīng)有了采用AI工具的意識(shí),李濤也提出了“如果員工借助AI提效30%漲薪10%,提效50%漲薪20%,提效50%以上漲薪30%”的允諾。
在此背景下,APUS內(nèi)部正在分成三批人:一批人專注做大模型;一批人專注把大模型用到C端產(chǎn)品上;另一批人就是職能部門的員工,可以采用任何AI產(chǎn)品。內(nèi)部員工的產(chǎn)品選擇,也正形成一種隱形壓力,比如李濤可能會(huì)問(wèn):“你看同事都不用你的產(chǎn)品,你是不是得努力?”
過(guò)去的20多年,李濤親歷了360的起伏,也見證了字節(jié)跳動(dòng)、美團(tuán)等新巨頭的崛起,他直覺判斷通用AI大模型會(huì)成為未來(lái)20年的主流,“這是一場(chǎng)全新的技術(shù)革命,既然我都看到了,就必須要跑在別人前面。”
過(guò)往的經(jīng)驗(yàn)告訴李濤,任何技術(shù)變革前期都是巨大紅利期,也是對(duì)社會(huì)創(chuàng)造價(jià)值最多的時(shí)間窗口?!皩?duì)于做企業(yè)的人來(lái)說(shuō),永遠(yuǎn)要捕捉這個(gè)時(shí)代的潮流?!崩顫硎?。
相關(guān)稿件