DeepSeek壓力下奧特曼承認(rèn):OpenAI閉源策略站在了歷史的錯(cuò)誤一邊

2025年02月01日 22:32   21世紀(jì)經(jīng)濟(jì)報(bào)道 21財(cái)經(jīng)APP   孔海麗
DeepSeek帶來(lái)了應(yīng)用的繁榮,算力需求不減反增。

21世紀(jì)經(jīng)濟(jì)報(bào)道記者孔海麗 北京報(bào)道

OpenAI最新推理模型o3-mini緊急上線。

這是OpenAI目前成本效益最高的推理模型。與以往不同的是,OpenAI向所有用戶開放了o3-mini在ChatGPT和API中的使用權(quán)限。

很難否認(rèn)OpenAI此舉沒(méi)有受到DeepSeek的壓力。

無(wú)論是編程能力還是知識(shí)水平,o3-mini都全面超越了前代推理模型。比如,在2024年美國(guó)數(shù)學(xué)邀請(qǐng)賽(AIME 2024)的測(cè)試中,在低努力下,o3-mini準(zhǔn)確率(60%)與o1-mini差不多,但速率更快;而在中等努力水平下,o3-mini準(zhǔn)確率能夠提升到79.6%,與o1模型相當(dāng);在最高努力水平時(shí),o3-mini的準(zhǔn)確率則能進(jìn)一步提升至87.3%。

它不僅公開了推理過(guò)程(思考過(guò)程),還大幅下降了價(jià)格。o3-mini輸入每百萬(wàn)tokens定價(jià)1.10美元(使用緩存輸入,費(fèi)用減半),輸出每百萬(wàn)tokens定價(jià)4.40美元。這比o1-mini低63%,比完整版o1低93%。

OpenAI可謂下了血本,不得不加入DeepSeek發(fā)動(dòng)的價(jià)格戰(zhàn),但即便如此,與DeepSeek R1相比,價(jià)格還是太高了。后者的定價(jià)是:輸入每百萬(wàn)tokens/0.14美元,輸出每百萬(wàn)tokens/0.55美元。

也難怪DeepSeek繼續(xù)占據(jù)各大應(yīng)用商店下載榜頭名位置。最近,連一些國(guó)際頂尖大學(xué)的研究員都首選DeepSeek了。

當(dāng)天o3-mini發(fā)布會(huì)后,OpenAI首席執(zhí)行官薩姆·奧特曼(Sam Altman)攜眾高管,在社交平臺(tái)Reddit回答了網(wǎng)友們的提問(wèn)。

奧特曼在回答是否會(huì)公開一些大模型權(quán)重的問(wèn)題時(shí)說(shuō),“我個(gè)人認(rèn)為在(開閉源)這個(gè)問(wèn)題上我們站在了歷史的錯(cuò)誤一方,需要找出一個(gè)不同的開源策略。不過(guò)不是所有OpenAI的人都同意這個(gè)觀點(diǎn),而且目前這也不是我們最高優(yōu)先級(jí)?!?/p>

OpenAI剛創(chuàng)立時(shí),如其公司名稱所示,它的研究應(yīng)該是開放的。但隨著商業(yè)化進(jìn)程逐漸深入,這家公司卻選擇了閉源。這也是馬斯克與奧特曼分道揚(yáng)鑣并一直詬病OpenAI的重要原因。

 “正確的解讀是:‘開源模型正在超越專有模型’?!盡eta首席AI科學(xué)家楊立昆(Yann LeCun)最近表示,“他們(DeepSeek)提出了新想法,并在其他人的工作基礎(chǔ)上進(jìn)行了構(gòu)建。由于他們的工作是公開且開源的,因此每個(gè)人都可以從中受益,這就是開放研究和開源的力量?!?/p>

2024年,關(guān)于大模型是開源好還是閉源好,國(guó)內(nèi)外科技界曾經(jīng)有過(guò)激烈的爭(zhēng)論。如今,開源的DeepSeek,引領(lǐng)了全球AI的重要研究方向,幾乎宣告終結(jié)了這個(gè)話題。

而在創(chuàng)新、安全與商業(yè)化之間謹(jǐn)慎行走的OpenAI,也不得不重新考慮它的閉源策略。

在回答網(wǎng)民有關(guān)DeepSeek對(duì)OpenAI未來(lái)模型發(fā)展計(jì)劃有何影響時(shí),奧特曼坦陳,DeepSeek R1是“非常好的模型”。雖然OpenAI未來(lái)仍將開發(fā)出更好的模型,但其領(lǐng)先優(yōu)勢(shì)將比往年有所減少。

接著,奧特曼透露了幾項(xiàng)產(chǎn)品的進(jìn)展:完整版o3最快將于幾周內(nèi)發(fā)布,最晚則是幾個(gè)月內(nèi)發(fā)布。語(yǔ)音模式更新即將到來(lái),但大家關(guān)注的大模型GPT-5目前還沒(méi)有時(shí)間表。首席產(chǎn)品官Kevin Weil稱,將推出基于4o的圖像生成器。工程副總裁Srinivas Narayanan稱,公司推理模型未來(lái)將能夠使用包括檢索在內(nèi)的不同工具。

OpenAI大幅降低新模型價(jià)格,反思閉源策略并可能選擇部分開源,這些都是DeepSeek壓力之下的動(dòng)作。而DeepSeek在人工智能領(lǐng)域引發(fā)的振動(dòng)效應(yīng)還在擴(kuò)散。

微軟、英偉達(dá)、亞馬遜等巨頭此前已宣布上線搭載了DeepSeek-R1的軟件服務(wù)。2月1日晚間,華為云宣布,與硅基流動(dòng)聯(lián)合首發(fā)并上線基于華為云昇騰云服務(wù)的DeepSeek R1/V3推理服務(wù)。

但振奮之余,有業(yè)內(nèi)專家告訴本報(bào)記者,要澄清一個(gè)誤讀,就是認(rèn)為DeepSeek繞開了英偉達(dá)的CUDA,從而降低了對(duì)后者芯片的依賴。他表示,DeepSeek通過(guò)架構(gòu)革新、工程優(yōu)化和訓(xùn)練創(chuàng)新,低成本高質(zhì)量地實(shí)現(xiàn)了模型性能的高效躍升,但它的框架本質(zhì)上還是基于英偉達(dá)的CUDA?!癉eepSeek現(xiàn)象”引領(lǐng)了大模型訓(xùn)練和推理的一種技術(shù)方向,大幅降低了C端應(yīng)用成本,促進(jìn)了AI Ag-e-nt應(yīng)用的爆發(fā),某種程度上還重構(gòu)了全球AI敘事,但生態(tài)的繁榮不是減少而是增加了算力需求。資本市場(chǎng)的情緒波動(dòng)是暫時(shí)的,可見的將來(lái)算力方面仍無(wú)法擺脫對(duì)GPU芯片的依賴。所以,英偉達(dá)的聲明才會(huì)說(shuō),DeepSeek所取得的進(jìn)展,顯示出其芯片在中國(guó)市場(chǎng)的實(shí)用價(jià)值,且未來(lái)為滿足DeepSeek的服務(wù)需求,將需要更多英偉達(dá)芯片。

任何具有重大革新意義的新事物的出現(xiàn),不可能沒(méi)有爭(zhēng)議。但正如知名播客主持人萊克斯·弗里德曼(Lex Fridman)所說(shuō),盡管更好的模型還會(huì)繼續(xù)出現(xiàn),但“DeepSeek 時(shí)刻”是真實(shí)存在的,“我認(rèn)為 5年后它仍將作為科技史上的關(guān)鍵事件被人們銘記?!?/p>

關(guān)注我們