其實在見識過如今GPT-4的“實力”之后,小江已然不敢想象未來的GPT-5能達到怎樣的高度。再聯想下科幻作品中橋段,腦補的畫面不可謂之不“美麗”。但,根據最近消息OpenAI的GPT-5開發工作似乎遭遇了“卡殼”。
據《華爾街日報》12月20日報道,OpenAI耗資巨大的“獵戶座”(Orion)項目,也就是傳聞的中GPT-5似乎正面臨不小的麻煩。這款代號神秘的GPT-5模型原計劃在2024年中旬登場,但截至目前,歷經18個月的錘煉,它并沒有取得預期的成果。
源自其他媒體報道,OpenAI為了讓“獵戶座”更加聰明,已經進行了兩輪超大規模訓練,每次訓練都需要數月時間和大量數據支持。然而,有關人士透露,每次訓練都會冒出新問題,而且模型的表現總是差強人意。用一位前高管的話來說,“GPT-4表現像優秀高中生,但GPT-5的目標是部分任務能達到博士水平”。但這“博士”門檻顯然高得離譜。
更棘手的是,訓練GPT-5的成本堪稱“天文數字”。據估算,僅6個月的算力成本就高達5億美元,而GPT-4的訓練成本“才”剛過1億美元。
AI模型的“參數”(parameters)是衡量其能力的重要指標,就像大腦神經元數量。理論上,參數越多,模型越強大,但訓練成本也就越高。從GPT-1的1.17億參數到GPT-4的1.76萬億,OpenAI一路飆升了10倍。然而,參數的增加也意味著問題更復雜,開發難度更大。
早在2023年,OpenAI就啟動了一個名為“厄拉克斯”(Arrakis)的測試項目,試圖為“獵戶座”奠定技術基礎,但效率低得令人發指,項目很快被叫停。這不僅讓OpenAI蒙受損失,也讓主要投資者微軟的部分高管大為光火。
更重要的是,當今互聯網上的公開數據已不能滿足GP-T迭代的胃口。為了破局,OpenAI甚至已經開始雇傭專家(軟件工程師和數學家等)來生成供“GPT-5”訓練的新數據,但就模型的“吞吐量”和學習速度來說,這方法幾乎和杯水車薪無疑,進展依舊緩慢。
另一方面,OpenAI的“窩里斗”同樣讓項目雪上加霜。過去一年里,超過20位高管和研究人員離職,許多是業內頂尖科學家。與此同時,競爭對手卻在快速推進。Anthropic的模型被認為在性能上超越了GPT-4,谷歌推出的NotebookLM也備受好評。
在“獵戶座”掉隊的日子里,OpenAI試圖另辟蹊徑,推出了GPT-4的精簡版,還開辟了新方向,比如可以生成AI視頻的“Sora”項目,以及通過推理提升模型智能的“o1”推理模型。
所謂推理模型,旨在讓AI像人類一樣分析問題,而不是簡單地“背書”。比如,OpenAI開發的“o1”可以針對問題生成多個答案,然后選出最佳選項。理論上,這種方法可以大幅提升性能,但批評者認為,它不過是“高級模仿”,并不能真正解決新問題。蘋果公司甚至指出,這類模型在遇到無關細節時會“崩潰”。
面對質疑,OpenAI CEO山姆·奧特曼并未放棄。他在最近的演講中表示,公司正開發新的推理模型,但何時推出GPT-5仍是未知數。
OpenAI的“獵戶座”項目如今像極了一場豪賭,押注的是技術、時間和巨額資金。隨著競爭加劇,業內紛紛猜測,曾經“一騎絕塵”的OpenAI是否會被后浪拍在沙灘上。GPT-5究竟能否如愿登場,還需時間給出答案。
本文編輯:@ 江城子
?本文著作權歸電手所有,未經電手許可,不得轉載使用。