抽搐一进一出gif120秒试看,中国大陆一级国产av片,国产日韩网站,婷婷六月丁,欧美悠悠久久黄片,色综合天天综合网国产成人网,91破解版在线|亚洲

<progress id="tvflu"><menuitem id="tvflu"></menuitem></progress>

<samp id="tvflu"><listing id="tvflu"><dl id="tvflu"></dl></listing></samp>

位置：中國企業(yè)網(wǎng) > 企業(yè)新聞 > 非公動(dòng)態(tài) > 正文

小米大模型：不搞軍備競賽: 2023-11-09 14:50 來源：《中國企業(yè)家》雜志次閱讀; 分享：

小米大模型：不搞軍備競賽

輕量級的模型亦有其存在的市場空間。

　　文｜《中國企業(yè)家》記者趙東山

　　2022年11月底，基于GPT-3.5的ChatGPT剛出來的時(shí)候，小米集團(tuán)AI實(shí)驗(yàn)室主任、自然語言處理（NLP）首席科學(xué)家王斌給ChatGPT拋出一個(gè)問題：證明一下勾股定理。

　　最終，ChatGPT給出了一個(gè)基于數(shù)學(xué)歸納法的證明過程。王斌發(fā)現(xiàn)，雖然這個(gè)證明過程是錯(cuò)誤的，但是整個(gè)證明的邏輯看上去似乎非常合理。后來才意識到這是大模型的“幻覺”現(xiàn)象，但從某個(gè)角度上看ChatGPT的這個(gè)證明思路非常新奇。

　　不斷使用后，ChatGPT的強(qiáng)大能力和奇思妙想超乎王斌的想象。身為一名AI從業(yè)者，他感到一個(gè)新的智能時(shí)代即將來臨，而自己無法再置身事外。2023年4月，由王斌牽頭負(fù)責(zé)，小米技術(shù)委員會AI實(shí)驗(yàn)室大模型團(tuán)隊(duì)負(fù)責(zé)人欒劍帶隊(duì)，在小米內(nèi)部正式成立了一支自研大模型團(tuán)隊(duì)。而在這之前的數(shù)月，小米就開始做自研的相關(guān)準(zhǔn)備工作。

　　小米集團(tuán)創(chuàng)始人、董事長兼CEO雷軍親自推動(dòng)了自研大模型團(tuán)隊(duì)的建立，并全程高度參與了小米大模型的自研，他會親自查看團(tuán)隊(duì)的周報(bào)、月報(bào)甚至日報(bào)，關(guān)注大模型進(jìn)展。至于投入，雷軍也表示：“全力支持，投入不設(shè)上限?！?/p>

　　經(jīng)過半年多時(shí)間的努力，小米目前已訓(xùn)練出13億和60億參數(shù)規(guī)模的語言大模型，并在集團(tuán)內(nèi)開源賦能各業(yè)務(wù)。它們在小米澎湃OS系統(tǒng)和人工智能助手小愛同學(xué)的部分場景已經(jīng)得到應(yīng)用，更大參數(shù)規(guī)模的大模型也在緊鑼密鼓地開發(fā)中。

　　不同于百度的文心一言、科大訊飛星火等通用大模型，小米自研大模型更強(qiáng)調(diào)跟產(chǎn)品的結(jié)合和場景的驅(qū)動(dòng)。

　　“我們不會純從技術(shù)角度考慮，也不會以比賽為目標(biāo)。我們不搞軍備競賽，我們做大模型的出發(fā)點(diǎn)并不是成為中國的OpenAI。我們一開始就考慮大模型跟公司的場景怎么結(jié)合。”王斌告訴《中國企業(yè)家》。

　　小米內(nèi)部認(rèn)為，輕量級模型亦有其存在的市場空間，且在某些特定任務(wù)上相比千億大模型亦能具備一定的優(yōu)勢。這是端側(cè)大模型的特殊要求，也是一家智能設(shè)備廠商入局大模型的必經(jīng)之路。

　　與市面上大多數(shù)自研大模型的公司一樣，小米同樣選擇了從小參數(shù)到大參數(shù)的漸進(jìn)式開發(fā)過程。通過小參數(shù)模型摸清底層的邏輯，蹚好路上要經(jīng)歷的坑，再加大投入追求更大參數(shù)模型的訓(xùn)練。

　　小米為什么要自研大模型？小米如何自研大模型的？又如何將大模型放到智能手機(jī)等設(shè)備里？小米用大模型來做什么？大模型對小米全球6億多MIUI月活用戶來說意味著什么？跟未來的人車家全生態(tài)又有哪些關(guān)聯(lián)？近日，王斌接受了《中國企業(yè)家》的專訪，對此進(jìn)行了一一解答。

　　以下為小米集團(tuán)AI實(shí)驗(yàn)室主任、自然語言處理（NLP）首席科學(xué)家王斌自述（在不改變原意下做了刪減）：

　　態(tài)度：不搞軍備競賽

　　基于GPT-3.5的ChatGPT是2022年11月30日發(fā)布的，其實(shí)第二天小米內(nèi)部就有好多人注冊了賬號在用，我們當(dāng)時(shí)就覺得這肯定是一個(gè)跨時(shí)代的事件，做過多年AI的我們都深刻感受到，ChatGPT的很多結(jié)果超出了我們的預(yù)期。

　　在用的過程中我們也不斷總結(jié)。后來我們覺得這不只是做AI的人關(guān)注的事情，可能對所有的行業(yè)、部門都會產(chǎn)生影響。大模型一定是未來的趨勢，它會極大地改變我們的產(chǎn)品和業(yè)務(wù)。

　　當(dāng)時(shí)我們就做了一些內(nèi)部布道的工作，向全公司發(fā)起推廣，在總經(jīng)理例會上以及各種場合去宣傳，呼吁大家都要用大模型，甚至在公司內(nèi)部也建立了大模型的機(jī)器人，把ChatGPT接過來，我們在公司內(nèi)部還整理了很多文檔，指導(dǎo)大家怎么使用。

　　我們內(nèi)部還成立了一個(gè)討論組，共享一些使用經(jīng)驗(yàn)，猜一猜這個(gè)技術(shù)可能在哪個(gè)地方帶來顛覆。但當(dāng)時(shí)還僅限于一個(gè)技術(shù)層面的探討，剛開始還沒有決定要做。等到春節(jié)左右，有人覺得至少要?jiǎng)邮秩プ隽?#xff0c;這個(gè)風(fēng)暴來了，我們做技術(shù)的肯定不能置身事外，如果不入局就會在競爭當(dāng)中處于不利的位置，于是我們也開始做一些準(zhǔn)備工作。

　　等當(dāng)面跟雷總（雷軍）匯報(bào)時(shí)，他馬上拍板說，“你們趕緊做。”所以，我們大模型團(tuán)隊(duì)成立正式官宣是4月份，但實(shí)際上早就已經(jīng)開始籌備了，隨后我們就全力擁抱深入其中去做相關(guān)的研發(fā)。

　　當(dāng)真正決定自研的時(shí)候，我們是從這幾個(gè)方面考慮的。

　　第一，小米是一個(gè)應(yīng)用場景非常多的公司，在這些場景里怎么通過大模型，提高產(chǎn)品體驗(yàn)，提高公司內(nèi)部的運(yùn)營效率，完善從感知到認(rèn)知再到?jīng)Q策的智能體驗(yàn)，是我們考慮的事情。小米跟做通用大模型的公司定位不太一樣，他們是做完給別人用，但我們更多要考慮小米的場景。從小愛同學(xué)到未來的汽車再到操作系統(tǒng)和機(jī)器人，都是能和大模型結(jié)合的重要場景。

　　第二，正是因?yàn)樾∶子袌鼍暗尿?qū)動(dòng)，所以我們在做大模型的時(shí)候不會純技術(shù)考量，也不是要去比賽，或做個(gè)中國的OpenAI，我們不搞軍備競賽，這不是我們做大模型的出發(fā)點(diǎn)，我們一開始就得考慮大模型跟公司的場景怎么結(jié)合。

　　第三，小米是一家技術(shù)立業(yè)的公司，公司的技術(shù)研發(fā)投入很大，有很多自己的技術(shù)創(chuàng)新，同時(shí)也對業(yè)界出現(xiàn)的新技術(shù)保持高度敏感。對于有希望的新技術(shù)，你至少要跟上，再想辦法和場景高度融合，做出自己的優(yōu)勢和特色。

　　雷總對大模型業(yè)務(wù)參與非常多，我們團(tuán)隊(duì)有幾個(gè)專門討論大模型的群聊，雷總就在群里。有信息及時(shí)在群里共享，有問題直接在群里解釋匯報(bào)。我們的周報(bào)、月報(bào)甚至日報(bào)他也會直接看。他對技術(shù)的敏感度非常高，也非?？春么竽Ｐ?#xff0c;所以他時(shí)刻都在關(guān)注我們的進(jìn)展，這也使我們有些壓力。但關(guān)于投入，雷總大力支持，不設(shè)上限。

　　落地：從小到大逐步迭代

　　確定好自己的定位，我們的路線比較清楚：一邊研發(fā)探索，一邊結(jié)合小米的場景。我們確信，不是要用一個(gè)大模型覆蓋所有業(yè)務(wù)場景，所以跟業(yè)內(nèi)很多公司一樣，我們采取了從小到大漸進(jìn)式開發(fā)的過程。

　　我們的第一個(gè)模型是13億的小規(guī)模模型。一開始選擇參數(shù)規(guī)模比較小的模型，是因?yàn)橄氡苊獯蟮姆稿e(cuò)，因?yàn)樵酱竽Ｐ偷挠?xùn)練，其成本也越高。我們選擇先用小規(guī)模模型做一些蹚坑的工作，把其中經(jīng)歷的一些問題都解決了，再做大參數(shù)規(guī)模的模型。其實(shí)訓(xùn)練更大的模型通常都會遇到一些新的問題，但是至少一些老的問題能夠先解決，這是一個(gè)比較務(wù)實(shí)的做法。

　　自研大模型首要的挑戰(zhàn)，就是如何快速找到對的人，又組合成緊密的團(tuán)隊(duì)，大家分工明確地共同為一個(gè)目標(biāo)努力。

　　小米對人工智能的投入比較早，在2016年AlphaGo出來之后，雷總就開始大力投入AI，最開始是視覺團(tuán)隊(duì)，后來逐漸拓展到AI的各個(gè)領(lǐng)域。整個(gè)公司我們有3000多人在做AI相關(guān)的研發(fā)工作，我們團(tuán)隊(duì)也有非常豐富的AI工程化經(jīng)驗(yàn)。

　　我們AI實(shí)驗(yàn)室之前有一個(gè)人機(jī)對話團(tuán)隊(duì)，做過28億的對話模型，雖然它是只用于對話的專用模型，但內(nèi)部測試的效果非常不錯(cuò)。另外，我們還有非常專業(yè)的數(shù)據(jù)處理團(tuán)隊(duì)和AI訓(xùn)練優(yōu)化團(tuán)隊(duì)。我們就直接把這些有基礎(chǔ)的人，抽調(diào)過來直接組成了一支新的團(tuán)隊(duì)，直接上手就開始做自研大模型了。

　　小米AI實(shí)驗(yàn)室在視覺、聲學(xué)語音、NLP、知識圖譜、機(jī)器學(xué)習(xí)等方向，都有技術(shù)積累，從算法預(yù)研到工程落地具備很強(qiáng)的閉環(huán)能力。比如，手機(jī)、汽車、音箱、可穿戴等很多智能硬件上的很多AI算法，我們從頭到尾都做過，所以這支抽調(diào)而成的團(tuán)隊(duì)同時(shí)具備算法、數(shù)據(jù)、工程、產(chǎn)品、測試等大模型建設(shè)需要的能力，冷啟動(dòng)時(shí)間非常短，很快就能進(jìn)入快車道。

　　具體地，我們在組建隊(duì)伍的時(shí)候，NLP團(tuán)隊(duì)是最直接相關(guān)的，原來的對話大模型也出自該團(tuán)隊(duì)。我們還把知識圖譜構(gòu)建的團(tuán)隊(duì)抽調(diào)一部分過來完成大模型的數(shù)據(jù)工作，他們對數(shù)據(jù)的敏感性，對數(shù)據(jù)的理解，對數(shù)據(jù)的工具和算法的掌握，都非常強(qiáng)；大模型的工程組，我們是從機(jī)器學(xué)習(xí)的架構(gòu)團(tuán)隊(duì)調(diào)過來的，此前他們專門做系統(tǒng)優(yōu)化的工作，比如怎么有效調(diào)用GPU，怎么去做分布式機(jī)器學(xué)習(xí)訓(xùn)練，經(jīng)驗(yàn)都非常豐富。

　　13億的模型訓(xùn)練完了之后，我們會跟開源開放的模型做一些對比，雖然跟千億的模型相比還是有各方面的差距，但是經(jīng)過微調(diào)后在某些任務(wù)上還是有一些優(yōu)勢的。我也多次表達(dá)過13億的模型有它自己的生存的空間，我們更關(guān)注和場景的適配。目前這個(gè)模型已經(jīng)在小愛同學(xué)中上線了。實(shí)際的數(shù)據(jù)表明，在特定場景下，13億的模型不僅效率上優(yōu)于更大的模型，效果上也毫不遜色。

　　截至目前，小米已經(jīng)有13億、60億兩個(gè)參數(shù)規(guī)模的大模型在集團(tuán)內(nèi)開源。這幾個(gè)模型隨著輸入數(shù)據(jù)的不斷更新，也都在不斷迭代。我們還有更大的模型正在緊鑼密鼓地開發(fā)中，希望能給用戶帶來更好的體驗(yàn)。

　　挑戰(zhàn)：如何把大模型放到設(shè)備里？

　　小米的設(shè)備非常多，我們希望把很多功能能做到汽車、手機(jī)、智能音箱或其他設(shè)備上?？偠灾?#xff0c;我們一直以來都有強(qiáng)烈的端側(cè)需求，大模型來了也不例外。當(dāng)然，把大模型做到端側(cè)挑戰(zhàn)還是非常大的。

　　第一，這里似乎有個(gè)悖論。模型太大了端側(cè)根本就放不進(jìn)去跑不起來，但是模型太小了可能效果又不行。這就很考驗(yàn)團(tuán)隊(duì)對模型的理解，包括怎么對大模型做量化、蒸餾、壓縮，還要保證模型的效果，還要滿足硬件的各種約束，甚至包括硬件產(chǎn)品的理解，都要求有很強(qiáng)的認(rèn)知能力。

　　第二，對于硬件端包括芯片端，也提出新的要求和挑戰(zhàn)。一方面，現(xiàn)有的硬件框架下可能對大模型的支持并不完善。另一方面，需求的驅(qū)動(dòng)要求我們在現(xiàn)有條件下就要將大模型在端側(cè)跑通。這里面的挑戰(zhàn)非常大，需要一個(gè)綜合的解決方案。

　　端側(cè)大模型確實(shí)有不少好處。一個(gè)最顯而易見的好處是可以充分保護(hù)用戶的隱私，用戶和大模型的交互數(shù)據(jù)不會上傳。再比如說，一種最極端的情況就是在沒有網(wǎng)絡(luò)的情況下，端側(cè)大模型帶來的用戶體驗(yàn)差異會非常明顯，云上的大模型沒網(wǎng)是無法工作的，但端側(cè)就可以。與此同時(shí)，一部分應(yīng)用如果通過云側(cè)要傳輸?shù)臄?shù)據(jù)量比較大，在實(shí)時(shí)性上可能就不如在端側(cè)強(qiáng)，端側(cè)響應(yīng)可能會更及時(shí)。此外，如果云側(cè)的需求量特別大之后，要維持成本肯定需要用戶付費(fèi)，這也是很常見的商業(yè)模式。但是如果集成到端上，用戶的成本可能就沒有那么高，用戶也就更愿意用。

　　雖然大模型端側(cè)落地的挑戰(zhàn)很大，但是好在我們在端側(cè)落地方面有長時(shí)間的積累。比如我們視覺團(tuán)隊(duì)做過很多手機(jī)拍照的算法，都是要求在端側(cè)實(shí)現(xiàn)的。手機(jī)拍照現(xiàn)在分辨率越來越高，要對圖像進(jìn)行處理，處理效率要高，用戶感覺不到卡頓，而且還不能發(fā)熱，這些都是一系列的嚴(yán)格條件，我們有長期的技術(shù)落地經(jīng)驗(yàn)。

　　此外，在語音和語言處理上，小米也有一些端側(cè)的經(jīng)驗(yàn)，比如原來在比較小的設(shè)備上實(shí)現(xiàn)了全離線的機(jī)器翻譯，參數(shù)也達(dá)到億級了，后來離線的機(jī)器翻譯模型也被放到小米旗艦機(jī)上。

　　目前，小米和芯片公司也在合作，共同推動(dòng)端側(cè)大模型的落地。

　　未來：多模態(tài)

　　經(jīng)歷過語言大模型的開發(fā)，我們其實(shí)已經(jīng)把底層的坑都蹚過了，我們有能力去做更大參數(shù)的模型，但具體要不要做千億或者萬億的大模型，更多還是從投入產(chǎn)出比的角度去考慮，也看跟場景的結(jié)合還有沒有需求，如果我們已經(jīng)把很多場景處理得非常好，我們就不需要投更大的成本去做，我們不以軍備競賽為目標(biāo)，這個(gè)不是我們的目標(biāo)。

　　人車家全生態(tài)是小米全新升級的未來戰(zhàn)略，未來的智能生活中包含很多的場景，大模型可能越來越會成為一個(gè)基礎(chǔ)設(shè)施的東西，來支撐上面的智能服務(wù)。大模型對上下文的理解，對情景的理解都更深了，不管它在手機(jī)上還是其他設(shè)備上，都能夠隨時(shí)隨地了解你所在的場景，給用戶提供下一步的可能性。

　　小米的優(yōu)勢是多設(shè)備場景的綜合感知，因此小米大模型輸入的不只是文字，而是它感知到的環(huán)境和場景。我相信未來的多模態(tài)大模型肯定不只是視覺的，聲音的，還會有其他模態(tài)，這也正好符合小米人車家萬物互聯(lián)的場景，我們輸入了更多的信息，也會幫用戶更好地理解這個(gè)環(huán)境，做后面的事情，比如對機(jī)器人的控制，對車的控制，甚至是分布式聯(lián)動(dòng)，去滿足用戶的想象。

　　大模型也成為一個(gè)數(shù)據(jù)接收中心，它接收的信息遠(yuǎn)比現(xiàn)有的學(xué)術(shù)界的研究還要多，當(dāng)然這個(gè)信息融合還有難度，但是小米可以在各種設(shè)備去輸出，它們之間都是相通的。小米澎湃OS已經(jīng)把互聯(lián)互通做好了，我們能夠借用多種設(shè)備的聯(lián)動(dòng)，協(xié)同感知，協(xié)同決策，做一些更有意思的事情，幫用戶生活體驗(yàn)更好，更方便。

　　大模型火了，安全隱私問題也成為大家關(guān)注的話題。小米剛成立不久，就成立了安全隱私委員會，因?yàn)樾∶资且粋€(gè)手機(jī)設(shè)備廠商，對安全隱私非常關(guān)注，小米所有的項(xiàng)目都要經(jīng)過隱私委員會的審批才能夠立項(xiàng)，在訓(xùn)練和應(yīng)用大模型的過程中，我們會嚴(yán)格按照安全隱私保護(hù)的相關(guān)法律法規(guī)來進(jìn)行處理。

　　關(guān)于未來，小米內(nèi)部相信大模型肯定會不斷向前發(fā)展，在多模態(tài)模型還沒有出來之前，我們就立項(xiàng)了多模態(tài)大模型，在今年年初還通過北京市自然科學(xué)基金-小米創(chuàng)新聯(lián)合基金設(shè)立了《面向圖文理解和生成的多模態(tài)大模型構(gòu)建與評價(jià)》的課題，我們相信這一定是未來重要的發(fā)展方向。

　　當(dāng)然，基于大模型，目前還沒有出現(xiàn)殺手級的應(yīng)用，這需要一個(gè)嘗試、探索的過程，接下來一定會出現(xiàn)一系列的應(yīng)用讓大模型落地。此外，端云結(jié)合的框架也一定是未來的趨勢。小米愿意置身其中，并積極探索。

點(diǎn)贊()

上一條：凡泰極客亮相香港金融科技周，投身大灣區(qū)數(shù)字化建設(shè)2023-11-09

下一條：天影視通集團(tuán)子公司東莞天影開業(yè)，打造全國工廠戰(zhàn)略布局新篇章！2023-11-09

相關(guān)稿件: 大模型，冷靜！ 2023-07-25; 大廠競逐AI大模型虛火過旺還是星辰大海？ 2023-04-14; 國內(nèi)企業(yè)競速“垂直大模型”新賽道 2023-07-27; 京東集團(tuán)CEO許冉：大模型在京東內(nèi)部已經(jīng)取得明確的實(shí)踐效果 2023-07-13; AI大模型助力金融高質(zhì)量發(fā)展！馬上消費(fèi)“天鏡大模型”問世 2023-08-30

國務(wù)院國有資產(chǎn)管理委員會中國企業(yè)聯(lián)合會中國企業(yè)報(bào) 中國社會經(jīng)濟(jì)網(wǎng) 中國國際電子商務(wù)網(wǎng) 新浪財(cái)經(jīng) 鳳凰財(cái)經(jīng) 中國報(bào)告基地企業(yè)社會責(zé)任中國網(wǎng) 杭州網(wǎng) 中國產(chǎn)經(jīng)新聞網(wǎng) 環(huán)球企業(yè)家華北新聞網(wǎng) 和諧中國網(wǎng) 天機(jī)網(wǎng) 中貿(mào)網(wǎng) 湖南經(jīng)濟(jì)新聞網(wǎng) 翼牛網(wǎng) 東莞二手房中國經(jīng)濟(jì)網(wǎng) 中國企業(yè)網(wǎng)黃金展位頻道硅谷網(wǎng) 東方經(jīng)濟(jì)網(wǎng) 華訊財(cái)經(jīng) 網(wǎng)站目錄全景網(wǎng) 中南網(wǎng) 美通社大佳網(wǎng) 火爆網(wǎng) 跨考研招網(wǎng) 當(dāng)代金融家雜志借貸撮合網(wǎng) 大公財(cái)經(jīng) 誠搜網(wǎng) 中國鋼鐵現(xiàn)貨網(wǎng) 證券之星融易在線 2014世界杯中華魂網(wǎng) 納稅人俱樂部慧業(yè)網(wǎng) 商界網(wǎng) 品牌家中國國資報(bào)道金融界中國農(nóng)業(yè)新聞網(wǎng) 中國招商聯(lián)盟和訊股票經(jīng)濟(jì)網(wǎng) 中國數(shù)據(jù)分析行業(yè)網(wǎng) 中國報(bào)道網(wǎng) 九州新聞網(wǎng) 投資界北京科技創(chuàng)新企業(yè)誠信聯(lián)盟網(wǎng) 中國白銀網(wǎng) 炣燃科技中企媒資網(wǎng) 中國石油化工集團(tuán) 中國保利集團(tuán)公司東風(fēng)汽車公司中國化工集團(tuán)公司中國電信集團(tuán)公司華為技術(shù)有限公司廈門銀鷺食品有限公司中國恒天集團(tuán)有限公司濱州東方地毯集團(tuán)有限公司大唐電信科技股份有限公司中國誠通控股集團(tuán)有限公司喜來健醫(yī)療器械有限公司中國能源建設(shè)股份有限公司內(nèi)蒙古伊利實(shí)業(yè)集團(tuán)股份有限公司中國移動(dòng)通信集團(tuán)公司中國化工集團(tuán)公司貴州茅臺酒股份有限公司

<rp id="peumz"><wbr id="peumz"><object id="peumz"></object></wbr></rp>