出品 | 搜狐科技
作者 | 梁昌均
編輯 | 楊錦
過(guò)去一段時(shí)間,業(yè)界對(duì)DeepSeek的討論,不再局限于其技術(shù)創(chuàng)新帶來(lái)的對(duì)大模型發(fā)展范式的改變。更重要的是,它還以一己之力,帶動(dòng)了中國(guó)AI生態(tài)圈的廣泛參與。
從底層算力、云平臺(tái)等基礎(chǔ)設(shè)施,到中間層的infra廠商,再到下游應(yīng)用,包括互聯(lián)網(wǎng)、汽車、智能硬件/智能家居、金融、教育、醫(yī)藥、傳媒等領(lǐng)域企業(yè),從巨頭到創(chuàng)業(yè)公司,DeepSeek朋友圈持續(xù)擴(kuò)大。
據(jù)不完全統(tǒng)計(jì),目前與DeepSeek合作的企業(yè)已有百余家。2月17日,DeepSeek創(chuàng)始人梁文鋒還出席了民營(yíng)企業(yè)座談會(huì),這是他近期第二次現(xiàn)身國(guó)家高規(guī)格會(huì)議。
DeepSeek的熱潮能否持續(xù)?它的技術(shù)創(chuàng)新對(duì)AI技術(shù)發(fā)展會(huì)帶來(lái)什么影響?國(guó)產(chǎn)算力會(huì)加快誕生中國(guó)版英偉達(dá)嗎?
近日,在搜狐科技《AI十二談》沙龍中,燧原科技首席生態(tài)官李星宇、并行科技AI云事業(yè)部總經(jīng)理趙鴻冰、昊問(wèn)大模型CEO穆澤林、中科加禾CTO陳龍、鼎興量子主管合伙人陳大志、清昴智能市場(chǎng)合伙人何逸豪,圍繞這些問(wèn)題進(jìn)行了深入探討。
試解DeepSeek突圍密碼
談及DeepSeek的爆火,嘉賓們對(duì)它的推理能力、理解能力、深度思考能力、輸出詳盡程度和流暢程度,以及推理過(guò)程的透明度、多輪對(duì)話能力等方面的表現(xiàn)印象深刻。
這背后則是DeepSeek在訓(xùn)練、架構(gòu)、算法等多個(gè)層面上的技術(shù)創(chuàng)新,并借此形成低成本、高性能的高性價(jià)比優(yōu)勢(shì)。
李星宇強(qiáng)調(diào),DeepSeek的創(chuàng)新體現(xiàn)在工程化方面,它并沒(méi)有在底層架構(gòu)上發(fā)生變化,包括OpenAI在內(nèi),都是工程創(chuàng)新的典范。
展開(kāi)全文
他認(rèn)為,漸進(jìn)式的工程化創(chuàng)新,符合技術(shù)周期的發(fā)展節(jié)奏,通過(guò)接力的方式,能夠持續(xù)不斷地把新技術(shù)推進(jìn)到商業(yè)化的進(jìn)程里去。
穆澤林也提到,DeepSeek所做的工程化創(chuàng)新,能夠解決應(yīng)用最后100米的問(wèn)題。“這能讓整個(gè)中國(guó)的AI產(chǎn)業(yè)擁有更持久的生命力,讓AI更快走到應(yīng)用,產(chǎn)生持續(xù)的商業(yè)模式。”
在陳龍看來(lái),DeepSeek能夠把訓(xùn)練成本大幅壓縮,經(jīng)過(guò)了前期版本的深厚積累和迭代優(yōu)化。他同樣強(qiáng)調(diào),工程化創(chuàng)新在計(jì)算機(jī)領(lǐng)域也非常重要,大量的工程實(shí)踐會(huì)催生技術(shù)的進(jìn)步。
趙鴻冰表示,DeepSeek可能達(dá)到了顛覆性——它不僅實(shí)現(xiàn)了AI能力等級(jí)的提升,同時(shí)加速了AI的普及,達(dá)到1億用戶用了最短的時(shí)間。
不過(guò),何逸豪認(rèn)為,在技術(shù)和工程方面,DeepSeek確實(shí)有創(chuàng)新,但可能還達(dá)不到其所認(rèn)為的顛覆性。“創(chuàng)新通常包括破壞式創(chuàng)新和延續(xù)性創(chuàng)新,DeepSeek更多是延續(xù)性創(chuàng)新?!?/p>
無(wú)論如何,DeepSeek的成功,一定程度代表中國(guó)AI有實(shí)現(xiàn)反超甚至引領(lǐng)的機(jī)會(huì)。
在趙鴻冰看來(lái),DeepSeek的出圈離不開(kāi)三個(gè)因素:高人才密度,有理想,不差錢(qián)。陳大志則認(rèn)為,DeepSeek有兩個(gè)特點(diǎn)可能是成功的重要因素,一是資金的屬性是自有資金,具有更高的靈活性和自由度;二是其不拘一格的用人理念。
“這使得DeepSeek的可復(fù)制性不強(qiáng)。”陳大志認(rèn)為,如果按DeepSeek的模式再去找同樣的企業(yè),不一定能找得到第二家,即便找到,也不一定能達(dá)得到DeepSeek這樣的高度。
在李星宇看來(lái),DeepSeek現(xiàn)象級(jí)的成功,給中國(guó)創(chuàng)業(yè)者帶來(lái)非常有意義的啟發(fā)。一是要使命愿景驅(qū)動(dòng);二是要扎扎實(shí)實(shí),堅(jiān)持長(zhǎng)期主義;三是反共識(shí)的思考;四是開(kāi)放共贏的心態(tài)。
開(kāi)源,還是閉源?DeepSeek肯定還有后招
DeepSeek的成功,還離不開(kāi)它的開(kāi)源策略。除了數(shù)據(jù),它將模型代碼、參數(shù)權(quán)重、算法架構(gòu)等重要指標(biāo)都對(duì)外公布,并采用了相對(duì)寬松的商業(yè)化開(kāi)源協(xié)議。
這也使得多家公司紛紛反思或調(diào)整起自己的策略,比如山姆·奧特曼認(rèn)為OpenAI可能站在了歷史錯(cuò)誤的一邊,百度則迅速宣布文心一言免費(fèi),并計(jì)劃開(kāi)源下一代模型。
陳大志從市場(chǎng)的角度談到,未來(lái)開(kāi)源更有優(yōu)勢(shì)?!白龃竽P偷哪康淖罱K是啥?是拿到用戶,因此開(kāi)源具有不可比擬的優(yōu)勢(shì)?!笔紫纫尶蛻羰褂闷饋?lái),才能讓更多的人參與進(jìn)來(lái)共同完善生態(tài)。
陳龍則判斷,開(kāi)源和閉源將是共存的局面。但從整個(gè)社會(huì)效益或大眾受益程度上講,開(kāi)源共享程度更高,間接降低重復(fù)開(kāi)發(fā)的整體社會(huì)成本。
“不管是開(kāi)源還是閉源,核心問(wèn)題還是怎么能夠形成一個(gè)良好的商業(yè)閉環(huán),包括如何間接去推動(dòng)算力等整個(gè)產(chǎn)業(yè)鏈良性運(yùn)轉(zhuǎn)起來(lái)?!标慅堈f(shuō)。
從IT發(fā)展歷史看,開(kāi)源和閉源共存是主流。李星宇認(rèn)為,技術(shù)開(kāi)源的意義在于擊敗競(jìng)爭(zhēng)對(duì)手,而商業(yè)上閉源的意義在于形成完整的商業(yè)模式,可以同時(shí)存在,比如安卓開(kāi)源、GMS閉源,就采取了這樣的策略。
他判斷,未來(lái)開(kāi)源是一種基礎(chǔ)性的保證,在開(kāi)源基礎(chǔ)上,會(huì)有大量增值的商業(yè)模式構(gòu)建出來(lái),從而能夠有雙贏的效果。
趙鴻冰則表示,開(kāi)源閉源各有優(yōu)劣,OpenAI是否會(huì)再次開(kāi)源,仍有非常大的不確定性。
何逸豪對(duì)開(kāi)源的理解是——技術(shù)上的秀肌肉,不怕別人抄?!癉eepSeek敢開(kāi)源,說(shuō)明肯定有后招,我覺(jué)得沒(méi)有誰(shuí)會(huì)一上來(lái)把自己的全部武器都掏出來(lái)?!?/p>
他認(rèn)為,開(kāi)源能夠更好地去促進(jìn)整個(gè)市場(chǎng)和技術(shù)的發(fā)展,也會(huì)刺激閉源,刺激技術(shù)的提升,這是良性的市場(chǎng)競(jìng)爭(zhēng)。
巨頭囤算力沒(méi)有意義了?相反!
DeepSeek的低成本,還引發(fā)了對(duì)大模型發(fā)展法則——Scaling Law的質(zhì)疑。通過(guò)堆算力的方式,對(duì)大模型技術(shù)發(fā)展來(lái)說(shuō)是否還具備可持續(xù)性?
在李星宇看來(lái),DeepSeek對(duì)Scaling Law不是顛覆的關(guān)系,而是相輔相成的關(guān)系。
“Scaling Law有點(diǎn)像武俠里面的氣宗,而DeepSeek有點(diǎn)像劍宗。哪個(gè)更重要?實(shí)際上都重要,俠之大者是劍氣合一,才能問(wèn)鼎華山之巔。從這個(gè)意義上來(lái)講,DeepSeek給大模型技術(shù)發(fā)展開(kāi)辟了第二戰(zhàn)場(chǎng)。”
他認(rèn)為,DeepSeek的出現(xiàn)直接改變的是算力結(jié)構(gòu),并判斷2025年推理算力會(huì)反超訓(xùn)練算力。這并不意味著訓(xùn)練算力會(huì)萎縮。雖然堆算力帶來(lái)的邊際效應(yīng)在遞減,但隨著解鎖更多應(yīng)用以后,還會(huì)把訓(xùn)練需求再次拉起來(lái)。
“只不過(guò),推理算力的增長(zhǎng)可能是十倍級(jí)別,更夸張?!崩钚怯钫J(rèn)為,“算力的高速增長(zhǎng)還會(huì)帶來(lái)單價(jià)的下降,能夠解鎖更多的應(yīng)用,從而進(jìn)入良性循環(huán),所以我們真的是迎來(lái)了算力和模型應(yīng)用的黃金時(shí)代?!?/p>
陳龍同樣認(rèn)為,算力需求會(huì)從訓(xùn)練側(cè)往推理側(cè)轉(zhuǎn)移,而且推理側(cè)的算力需求,可能比訓(xùn)練側(cè)將是數(shù)量級(jí)以上的提升。這會(huì)促進(jìn)對(duì)算力多樣性的要求,并催生應(yīng)用、算力運(yùn)營(yíng)、算力優(yōu)化、算力集成等相關(guān)產(chǎn)業(yè)發(fā)展,推動(dòng)行業(yè)分工越來(lái)越細(xì)。
對(duì)于訓(xùn)練側(cè)算力不會(huì)萎縮的原因,陳龍解釋到,大模型的能力還沒(méi)有達(dá)到人們預(yù)想的天花板?!拔艺J(rèn)為,企業(yè)能拿到越多的算力越好,算力需求可能還會(huì)持續(xù)?!?/p>
此外,李星宇強(qiáng)調(diào),這并不意味著巨頭囤算力這事兒沒(méi)有意義,反而DeepSeek進(jìn)一步刺激了巨頭通過(guò)算力優(yōu)勢(shì),去重新奪回領(lǐng)導(dǎo)權(quán)的沖動(dòng)。
這或許可以很好解釋,為什么科技巨頭,包括微軟、谷歌、亞馬遜、Meta的CEO都對(duì)DeepSeek表示震驚,也都紛紛表示,將在今年加大對(duì)AI、數(shù)據(jù)中心等基礎(chǔ)設(shè)施的資本投入。李彥宏也放話稱,不會(huì)停止對(duì)AI的投資。
某種程度上,DeepSeek的成功刺激了巨頭們通過(guò)加強(qiáng)投入來(lái)保持領(lǐng)先的決心。但它對(duì)很多創(chuàng)業(yè)公司而言,則提供了一個(gè)值得借鑒的發(fā)展樣本。
李星宇就提到,DeepSeek使得算法平權(quán)以后,更多的小型玩家可以在市場(chǎng)上立足。陳龍則呼吁,“我們不能人為給自己加枷鎖,覺(jué)得自己受限,就不往更大更強(qiáng)的方向去發(fā)展。”
中國(guó)版英偉達(dá)或?qū)⒓涌煺Q生
隨著DeepSeek的爆火,國(guó)內(nèi)十多家國(guó)產(chǎn)芯片廠商,紛紛去做適配。燧原科技在春節(jié)假期后第二天就上線了DeepSeek全量模型的適配,并聯(lián)合并行科技、中科加禾等合作伙伴,持續(xù)推進(jìn)DeepSeek模型的系統(tǒng)級(jí)優(yōu)化。
被寄予厚望的國(guó)產(chǎn)算力站到聚光燈下,華為、燧原科技等國(guó)產(chǎn)芯片廠商能否借此加快突破,成為業(yè)內(nèi)關(guān)注焦點(diǎn)。
談及為何要去做適配DeepSeek,李星宇解釋道,這是國(guó)產(chǎn)算力在技術(shù)層面第一次有了一個(gè)可以不用跟隨英偉達(dá)的理由,而是可以跟隨DeepSeek深度進(jìn)行軟硬協(xié)同的設(shè)計(jì)。這使得國(guó)產(chǎn)算力有信心能夠走出一條獨(dú)立發(fā)展的技術(shù)道路,而不是完全cosplay英偉達(dá)。
“國(guó)產(chǎn)算力最大的挑戰(zhàn)是商業(yè)化落地很困難,并不是技術(shù)?!崩钚怯钫J(rèn)為,國(guó)產(chǎn)算力跟英偉達(dá)算力的差距,并不在于性能,而是國(guó)產(chǎn)算力沒(méi)有建立一個(gè)很好的算法生態(tài)。這在過(guò)去兩年時(shí)間里面,成為整個(gè)國(guó)產(chǎn)GPU行業(yè)最大的難題。
“DeepSeek的出現(xiàn)極大帶動(dòng)了國(guó)產(chǎn)算力的商業(yè)化進(jìn)程,且下游應(yīng)用也已經(jīng)呈現(xiàn)井噴式的發(fā)展,可以說(shuō)國(guó)產(chǎn)算力真正的春天來(lái)了?!崩钚怯钫f(shuō)。
“這是國(guó)產(chǎn)算力第一次被廣泛接受,它解鎖了國(guó)產(chǎn)算力導(dǎo)入到創(chuàng)新領(lǐng)域的大門(mén)?!崩钚怯钫J(rèn)為,未來(lái)會(huì)看到越來(lái)越多的創(chuàng)新公司,采用國(guó)產(chǎn)算力去做后訓(xùn)練,去做思維鏈,去做各種垂類模型應(yīng)用,這對(duì)國(guó)產(chǎn)算力和國(guó)產(chǎn)模型玩家來(lái)講都是雙贏的事情。
他進(jìn)一步表示,現(xiàn)在模型已經(jīng)透明化,國(guó)產(chǎn)算力未來(lái)優(yōu)化之路會(huì)比原來(lái)要平坦很多。從這個(gè)意義上,它一定會(huì)縮短跟國(guó)外算力上的差距。
對(duì)是否會(huì)有中國(guó)版英偉達(dá)的出現(xiàn),陳龍的看法是,國(guó)內(nèi)有足夠多的數(shù)據(jù),也有足夠大的市場(chǎng),要借鑒英偉達(dá)崛起的啟示,首先把算力做上來(lái),然后盡量開(kāi)放。
“廣大的數(shù)據(jù)、用戶、應(yīng)用市場(chǎng)一起驅(qū)動(dòng),可以極大激發(fā)行業(yè)圍繞國(guó)產(chǎn)算力去做優(yōu)化的熱情,從而把整個(gè)生態(tài)豐富完善起來(lái)?!?/p>
穆澤林對(duì)此表示,在訓(xùn)練方面還是會(huì)傾向英偉達(dá),但中國(guó)百分百可以出現(xiàn)一個(gè)端側(cè)英偉達(dá)?!巴评硇酒瑖?guó)內(nèi)外差別已經(jīng)不是很大,而且中國(guó)的生態(tài),對(duì)國(guó)內(nèi)做推理芯片的企業(yè)有很大機(jī)會(huì)。”
李星宇顯得更加樂(lè)觀?!爸灰诙松铣蔀橥跽咭院螅匀粫?huì)往通用領(lǐng)域挺進(jìn),最終成為通用王者?!边@也正是英偉達(dá)所走的路。
評(píng)論