◎作者|李心瑩
◎來源|已獲授權(quán)
在大模型掀起國內(nèi)科技熱潮后,所有人都想知道產(chǎn)業(yè)的下一步將如何發(fā)展。對此,恐怕沒人比百度李彥宏更有資格做出判斷。
百度是在3月發(fā)布的文心一言,成為全球科技大廠中第一個大模型牌桌的玩家。更重要的是,百度也是國內(nèi)科技大廠中第一個投入、以及堅(jiān)持最久的AI玩家。
從李彥宏2013年宣布成立深度學(xué)習(xí)實(shí)驗(yàn)室至今,百度投入AI的時間已經(jīng)超過10年,既見證了AI技術(shù)的發(fā)展迭代,也見證了這項(xiàng)技術(shù)從實(shí)驗(yàn)室一步步走向現(xiàn)實(shí)生活的過程。
如今,大模型時代已來,未來最大的產(chǎn)業(yè)機(jī)會在哪?AI原生應(yīng)用究竟長什么樣?基礎(chǔ)模型與Killer Apps如何共融共生?垂類模型與基礎(chǔ)模型是互為競爭關(guān)系嗎?
當(dāng)然,這些問題都能在文心一言上找到答案。但我更想知道李彥宏怎么看——作為一位堅(jiān)信AI的技術(shù)人、一位帶領(lǐng)公司All in AI的企業(yè)家、一位用幾十萬字宣揚(yáng)AI的布道師。
百度官方消息稱,李彥宏將會在10月17日的百度世界大會上帶來長達(dá)一小時的主題演講,“手把手教你做AI原生應(yīng)用”。
現(xiàn)在,距離這次演講還有兩周時間,我梳理了李彥宏今年以來關(guān)于大模型和生成式AI的全部講話內(nèi)容,從上萬字的演講實(shí)錄中選摘出33條干貨,算是先做做功課。通過他的思考,我希望能進(jìn)一步揭示AI原生應(yīng)用的本質(zhì),為正在大模型創(chuàng)業(yè)、創(chuàng)新路上的同行人提供一份啟示。
以下為實(shí)錄摘編,enjoy:
大模型如何重新定義人工智能
1、人工智能的發(fā)展正在從辨別式走向生成式。什么叫辨別式?搜索引擎就是典型的辨別式。什么叫生成式?用AI進(jìn)行文學(xué)創(chuàng)作,寫報告、繪制海報等等,這些都是生成式。
2、過去的人工智能是,我們想讓機(jī)器學(xué)會什么技能,就教它什么技能。教過的可能會,沒教過的就不會。大模型出現(xiàn)“智能涌現(xiàn)”后,以前沒教過的技能,它也會了。這就是為什么有人講,我們現(xiàn)在朝著通用人工智能(AGI)方向發(fā)展。
3、大模型如何重新定義人工智能?主要體現(xiàn)在人機(jī)交互方式的變化。過去幾十年,人機(jī)交互方式共經(jīng)歷了三次變革,從命令行到圖形用戶界面(GUI),再到人工智能時代,我們可以用自然語言跟電腦進(jìn)行交互。也就是說,未來的應(yīng)用是通過自然語言提示詞來調(diào)動AI原生應(yīng)用實(shí)現(xiàn)的。
4、人工智能時代的到來,讓IT技術(shù)棧從三層變成了四層:底層仍然是芯片層,但主要的芯片已經(jīng)不是CPU ,而是以GPU為代表的新一代適合并行大規(guī)模浮點(diǎn)運(yùn)算的芯片;上面我們叫做框架層,就是深度學(xué)習(xí)的框架,像百度的PaddlePaddle飛槳、Meta的PyTorch、谷歌的TensorFlow都是在這一層;再上面一層是模型層,Chat GPT、文心一言等都屬于模型層;最上面是應(yīng)用層,以后AI時代的原生應(yīng)用,都會基于大模型來進(jìn)行開發(fā)。
5、模型本身并不直接產(chǎn)生價值,基于基礎(chǔ)大模型開發(fā)出來的AI原生應(yīng)用才是模型存在的意義。
6、我們不在乎榜單,就是要一步一個腳印往前走,打造好基礎(chǔ)模型能力,支持好在這個基礎(chǔ)模型之上開發(fā)出來的AI原生應(yīng)用。在模型之上開發(fā)出來的應(yīng)用越厲害、用的人越多、生產(chǎn)效率和工作效率提升的越多,這才是基礎(chǔ)大模型真正強(qiáng)大的表現(xiàn)。
7、垂類模型不是基礎(chǔ)模型的競爭對手,反而應(yīng)該建立在強(qiáng)大的基礎(chǔ)模型之上。沒有足夠強(qiáng)大的基礎(chǔ)模型做支撐,垂類模型就很難持續(xù)提升和發(fā)展。然而,只有少數(shù)公司會在基礎(chǔ)模型上達(dá)到較高水平。
8、開源模型在發(fā)展過程不一定都會變得更好,如果反饋回路不理想,是不利于基礎(chǔ)模型改善升級的。走彎路的成本變高,就難以建立持久的商業(yè)模式。
卷大模型沒意義,卷應(yīng)用機(jī)會更大
9、生成式大模型的問世,會帶來哪些創(chuàng)業(yè)和投資機(jī)會?我覺得至少有三方面機(jī)會:首先是新型云計(jì)算,第二類是行業(yè)模型的精調(diào),第三類是應(yīng)用開發(fā)。
10、大模型是Game Changer,它會徹底改變云計(jì)算的游戲規(guī)則。未來云計(jì)算公司的主要商業(yè)模式會變成MaaS,就是模型即服務(wù)(Model as a Service)。以后的應(yīng)用會建立在大模型上,而不是建立在云計(jì)算的這些算力或者存儲上。
11、過去,云計(jì)算主要賣算力,看速度、看存儲;今天,客戶購買云服務(wù),要看框架好不好、模型好不好,而不僅僅是看算力怎么樣。
12、大模型時代,最大的機(jī)會既不在基礎(chǔ)服務(wù),也不在行業(yè)服務(wù),恰恰是在應(yīng)用。就好像在移動互聯(lián)網(wǎng)時代,最大的商業(yè)機(jī)會不是iOS或者安卓這樣的操作系統(tǒng),而是微信、抖音、淘寶這些應(yīng)用一樣。
13、美國有幾十個基礎(chǔ)大模型,跟中國量級一樣,但在基礎(chǔ)大模型之上,美國已經(jīng)有上千個“AI原生應(yīng)用”,但中國市場是沒有的,這是最大的區(qū)別。
14、只有在大模型的基礎(chǔ)之上產(chǎn)生了足夠多的AI原生應(yīng)用,才是一個健康的生態(tài)環(huán)境,這代表了大的技術(shù)發(fā)展趨勢。
15、對創(chuàng)業(yè)者來說,卷大模型沒意義,卷應(yīng)用機(jī)會更大。
16、大模型時代來了,每一個產(chǎn)品都值得重做一遍。但誰真正重新做了一遍呢?百度要做第一個把全部產(chǎn)品重做一遍的公司,不是整合,不是接入,是重做和重構(gòu)。
AI原生應(yīng)用的交互不能超過兩級菜單
17、AI原生應(yīng)用,不是簡單地重復(fù)PC時代軟件或移動時代的APP,而得是“AI”原生,沒有AI就不存在的應(yīng)用。
18、什么是AI原生應(yīng)用?我認(rèn)為至少滿足三個條件:第一,能用自然語言交互,這是最根本的變化;第二,能充分利用理解、生成、推理、記憶等,這些過去不具備的技術(shù)能力;第三,每個應(yīng)用的交互都不超過兩級菜單。
19、每個AI原生應(yīng)用的交互都不能超過兩級菜單。如果超過兩級菜單,大家就記不住這個功能到底在哪。好多工程師辛苦開發(fā)出來的功能隱藏在第三級甚至第四級菜單里,沒有人用。PPT、Excel都是這樣,可能80%的功能,絕大多數(shù)人從來沒用過,就是因?yàn)槭褂瞄T檻太高了,不知道在哪。
20、你只要思路活躍、表達(dá)清晰,機(jī)器就能給你干活兒,這就是AI原生的應(yīng)用。
21、明顯的AI原生應(yīng)用,并不表明就是最好的AI原生應(yīng)用。我認(rèn)為直到今天,最好的AI原生應(yīng)用還沒有出現(xiàn),就是類似于抖音、微信、Uber這種移動互聯(lián)網(wǎng)時代的Mobile Native的APP。沒有手機(jī)的時候大家是不能想象它們的存在的,但它們確實(shí)產(chǎn)生了很大的社會影響力。
22、我們四萬百度人,沒有一個是AI時代的原住民。雖然大多數(shù)人都經(jīng)歷了PC時代、移動時代,但某種意義上思維方式仍然被固化了。未來,我們要有意識地培養(yǎng)AI原生應(yīng)用的思維方式和理念,用新的理念去重構(gòu)現(xiàn)在的每一個產(chǎn)品和業(yè)務(wù)。
23、生成式AI的來臨,讓我們發(fā)現(xiàn)很多時候只需要敲一兩個關(guān)鍵詞、點(diǎn)擊下鼠標(biāo)就能解決問題,不再像過去要用一大段話來描述需求才能獲得想要的內(nèi)容。這也讓我們意識到,有多少工程師辛辛苦苦開發(fā)出來的功能被藏在一層層菜單下永遠(yuǎn)無人問津,有多少苦思冥想的靈感都無法獲得反饋,但現(xiàn)在,它們可能會通過一些簡單的提示詞被激發(fā)出來,所以我們應(yīng)該有勇氣去改變自己的思維方式。
24、改變思維方式是痛苦的,會經(jīng)歷各種挫折和煎熬,這需要我們用毅力去克服慣性,用發(fā)現(xiàn)和探索的眼光來看待這個新的世界。
25、我要求公司所有產(chǎn)品重構(gòu)、重做,就是放棄過去對于桌面、PC這種瀏覽器的依賴,對于移動APP的依賴。要重新想象一下,有了理解、生成、邏輯、推理、記憶能力之后,能夠做成什么應(yīng)用。
自然語言人機(jī)交互會帶來“提示詞革命”
26、所謂“AI Native”,最明顯的特征就是“提示詞工程(Prompt Engineering)”。過去沒有這個行當(dāng),我們也不覺得跟計(jì)算機(jī)交互需要那么多講究。但在未來,通過寫好提示詞來激發(fā)大模型的潛力,是非常有意思的行當(dāng),我也認(rèn)為這是新工作機(jī)會最容易出現(xiàn)的地方。
27、我做過一個大膽預(yù)測,10年后,全世界有50%的工作會和“提示詞工程”有關(guān)。這就好像教育方式一樣,提出問題往往比解決問題更重要。未來我們會需要越來越多的提示詞工程師。
28、今天百度有上萬個工程師,會C++、Python,但到了AI原生應(yīng)用全面落地的時候,可能會要求大家都來寫Prompt,而且要看寫了之后run出來的結(jié)果如何。
29、人類要學(xué)習(xí)跟機(jī)器打交道的能力,提示詞說成什么樣,機(jī)器就會匹配什么樣的結(jié)果,這些結(jié)果就是生產(chǎn)力。
30、大模型本身的能力放在那,用得好不好完全靠提示詞決定。提示詞寫得好,智能涌現(xiàn)可能就多一些,反饋結(jié)果就更有價值一些;提示詞不好,出來的東西就是一本正經(jīng)胡說八道,或者是錯誤結(jié)論。
31、提示詞的書寫是有技術(shù)含量的,是需要學(xué)習(xí)的。怎么把提示詞寫好,這既是技術(shù)也是藝術(shù),甚至藝術(shù)的成分還更多些。
32、未來的應(yīng)用是通過自然語言提示詞來調(diào)動原生AI應(yīng)用實(shí)現(xiàn)的。這意味著,未來薪酬水平將取決于提示詞寫得好不好。
33、不同的大模型,比如文心大模型和Chat GPT,它們的提示詞也存在明顯差異。畢竟這些模型是通過獨(dú)立底層訓(xùn)練得出來的。如果把它們比喻成一個人的話,它們的“脾氣秉性”肯定是不同的,在與它們交互的過程中,我們也需要不斷摸索,逐漸了解如何寫提示詞才能達(dá)到更好的效果。
想了解大模型、生成式AI的更多精彩內(nèi)容嗎?即刻報名參加10月17日在北京首鋼園召開的「百度世界2023」,目前大會已經(jīng)開放公眾參會報名,在大會官方網(wǎng)站提交申請,就有機(jī)會親臨現(xiàn)場,體驗(yàn)這場前沿科技盛會。
相關(guān)稿件