Home 科學技術 GPT-5的適度收益表明AI進度正在放慢

GPT-5的適度收益表明AI進度正在放慢

38
0

GPT-5是Openai的大語言模式的最新版本

Cheng Gin/Getty Images

AI的最新步驟並不是前向臨時的臨時造成的高度。 Openai發布了他最新的AI模型, GPT-5GPT -4發行兩年後,其勝利與全球主導地位聊天。儘管有類似跳躍的承諾,但GPT-5在其他領先的AI模型上顯示出較少的改進,這表明該行業需要一種新的方法來構建更智能的AI系統。

Openai自己的廣告顯示出冰雹,編程,數學,寫作,健康信息和視覺意識的明顯改善,這是公司以前模型的“智能上的重大飛躍”。它還承諾甚至不太頻繁的幻覺,這表明AI錯誤信息是正確的。 “以復雜,經濟上有價值的知識的內部基準”,在內部基準中,OpenAy GPT -5”在大約一半的情況下與40多個職業相當,包括法律,後勤,銷售和工程。”

但是,GPT -5在公共基準測試中的性能並不比其他AI公司(例如Claude或Google gemini of Anthropic of Anthropic of Anthropic of Anthropic of Anthropection”的著名模型不優於。這在GPT-4中有所改善,但是許多基準的差異比從GPT-3到GPT-4的跳躍小。也有很多chatgpt客戶 不令人印象深刻GPT-5的例子未能回答在社交媒體上引起廣泛關注的一般問題。

他說:“大多數人希望會取得進步,而這不是進步。” Mirella Lapata 在英國愛丁堡大學。 “這是升級的,似乎是一種成長。”

GPT-5性能的最全面的動作來自OpenAY,因為該模型只能完全訪問該模型。有關內部基準的一些細節是公開的 安娜·羅傑斯(Anna Rogers) 在丹麥哥本哈根大學。 “因此,這不是作為科學訴訟的認真討論的問題。”

在模型開始之前的新聞發布會上,Altman說:“ GPT -5似乎正在與博士學位專家的任何方面的專家交談。”但是,羅傑斯說,基準不支持它,以及博士通常如何與智能相關聯。羅傑斯說:“大多數聰明的人沒有博士學位,擁有這樣的學位並不能保證更高的情報。”

GPT-5的適度改進可能是AI開發人員普遍困難的跡象。直到最近,希望通過更多的培訓數據和計算機功率,如此大的語言模型(LLM)將更加有效。看來,最新模型的結果不再存在,並且公司未能找到更好的AI系統設計。拉帕塔說:“現在每個人現在都有相同的食譜,我們知道食譜是什麼。”拉帕塔說,指示使用大量數據的培訓模型的過程,然後通過培訓後的過程進行調整。

但是,我們不知道如何設計諸如GPT -5之類的模型,因此很難說LLM很難說與停滯有多近 Nicos Alatras 在英國謝菲爾德大學。 “大型語言模型可能是為了使試圖直接嘗試觸摸牆的過早。我們無法真正在沒有任何有關技術細節的信息的情況下進行這些論點。”

Openai正在研究其他方法以使其產品更有效,例如GPT-5的新路由系統。與以前的CHATGPT案例不同,人們可以選擇使用任何AI模型,GPT-5現在掃描請求並將其引導到使用適當量的計算量的特定模型。

拉帕塔說,該政策可以更廣泛地採用。他說:“推理模型使用了很多(計算),這需要時間和金錢。” “如果您可以用一個小型模型回答,我們將在將來大多看到它。”但是,某些Chatgpt客戶激怒了這一行動,靈感告訴Altman 公司正在尋找 在改進路由過程中。

在特殊的OpenAy模型中,AI的未來有更多的積極跡象,該模型上個月在高級數學和編碼比賽中贏得了金牌得分,該競賽無法在一年前做到最高的AI模型。模型如何工作的詳細信息又很少了, 有Openi員工 它的成功表明該系統具有更常見的邏輯功能。

這些競賽用於測試他們在訓練中未曾看到的數據的模型,但它們仍然是智能測試的狹窄測試。拉帕塔(Lapata)說,在某個區域中提高模型的性能也可能使其他區域惡化,因此很難跟踪。

GPT-5是一個顯著改善的領域 它的價格現在,它比其他型號便宜得多 – 例如 費用增加10倍 在編寫過程中處理相同數量的請求。從長遠來看,如果他們不涵蓋在OpenAI收入中建立和實施新數據中心的巨額費用,這可能會導致自己的問題。拉帕塔說:“價格很生氣。這很便宜。我不知道他們如何忍受。”

頂級AI模型之間的競爭非常激烈,尤其是預測,第一個模型市場份額要領先於他人,尤其是其他人。拉帕塔說:“所有這些大公司都試圖成為贏家,這非常困難。” “你是三個月的贏家。”

事物:

來源連結