Home 综合新闻 Kurt Knutson 回顧 OpenAI GPT-5.2 模型

Kurt Knutson 回顧 OpenAI GPT-5.2 模型

23
0

新的您現在可以收聽福克斯新聞的文章!

ChatGPT 背後的公司 OpenAI 在 2025 年的發展速度異常快。據該公司稱,它於 8 月推出了 GPT-5,隨後於 11 月推出了 GPT-5.1。現在,僅僅幾週後,GPT-5.2 就發布了,人們普遍認為它是迄今為止最智能、功能最強大的 ChatGPT。

乍一看,其快速推出似乎令人驚訝。但其背後是有背景的。據報導,OpenAI 首席執行官 Sam Altman 稱其為公司內部的“紅色代碼”,敦促團隊更快地改進 ChatGPT。這一推動是隨著競爭的加劇而出現的。谷歌最近發布了 Gemini 3,據說在多項 AI 基準測試中表現優於 ChatGPT,並提供了更強的圖像生成能力。與此同時,Claude Anthropy 繼續快速前進。

在此背景下,GPT-5.2看起來不像是例行升級,而更像是戰略應對。那麼 GPT-5.2 中到底發生了什麼變化,為什麼 OpenAI 說它很重要呢?

註冊我的免費 Cyber​​​​Guy 報告
獲取最佳技術提示、重大安全警報以及直接發送到您收件箱的獨家優惠。另外,當您加入我的網站時,您將可以立即免費訪問我的《終極詐騙生存指南》 CYBERGUY.COM 通訊。

亞馬遜正在為 Ring 添加備受爭議的人工智能面部識別功能

2025 年 7 月 22 日,在華盛頓特區舉行的美聯儲大銀行會議資本框架綜合審查期間,OpenAI 首席執行官 Sam Altman 正在午休。 (路透社/肯·塞德諾)

GPT-5.2到底是什麼

GPT-5.2是OpenAI領先的5系列大語言模型中的最新版本。與它的前身一樣,它包含兩個默認變量。 GPT-5.2 Instant 專為日常對話和網絡搜索而設計。 GPT-5.2 推理適用於更複雜的任務,例如長鏈推理和多步驟問題解決。這兩種形式現在是所有 ChatGPT 用戶(包括免費用戶)的默認形式。它完全取代了GPT-5.1 Instant和Thinking。如果您現在使用 ChatGPT,那麼無論您是否意識到,您都已經在使用 GPT-5.2。

OpenAI 表示 GPT-5 給 ChatGPT 帶來了什麼

與此同時,OpenAI 繼續將 GPT-5 定位為“為每個人提供專家情報。 ” 該公司表示,GPT-5 在數學、科學、金融、法律和其他復雜科目上表現更出色。從 OpenAI 的角度來看,ChatGPT 現在更像是一個按需專家團隊,而不是一個基本的聊天機器人。為了支持這一說法,OpenAI 舉了一些實際例子。這包括更好的編程幫助、更具表現力的打字支持、更清晰的健康相關解釋以及更高的安全性和準確性。該公司展示了一些用例,例如創建應用程序代碼、撰寫演講、解釋藥物以及糾正用戶提交的圖像中的錯誤。理論上,GPT-5.2也是基於同樣的基礎。然而,儘管 OpenAI 強調更深入的思考和更可靠的答案,但這些收益對於許多普通用戶來說仍然是隱藏的。

GPT-5.2添加了哪些新功能?

這是簡短的答案。沒有人。 GPT-5.2 沒有引入主要的新工具、界面或功能。相反,OpenAI 描述了一系列幕後改進,這些改進將使 ChatGPT 更快、更智能、更強大。根據 OpenAI 的說法,GPT-5.2 最適合:

  • 建築演示
  • 完成複雜的項目
  • 創建電子表格
  • 了解長上下文窗口
  • 圖像解讀
  • 更有效地使用工具
ChatGPT 應用程序

Kurt Knutson 回顧了 ChatGPT-5.2 中的新功能。 (庫爾特·“Cyber​​​​Guy”·克努森)

OpenAI 還發布了新的基準測試,顯示 GPT-5.2 的性能略勝於 GPT-5.1 和競爭模型。然而,圖表上的大數字並不總是能為真實用戶帶來明顯的改進。

專家表示,美軍的新型 GENAI 工具是未來戰爭的“關鍵的第一步”

為什麼測試聊天機器人的改進很困難?

評估聊天機器人升級比看起來更困難。即使提示保持不變,響應也可能有很大差異。模型可能在一項任務上表現出色,但稍後很難執行幾乎相同的任務。此外,OpenAI 的 5 系列模型已經達到或接近該領域的頂尖水平。當性能開始如此高時,就很難檢測到有意義的增益。考慮到這一點,我們測試了 GPT-5.2,在大多數測試中它的行為幾乎與 GPT-5.1 相同。

為什麼標準不能說明全部情況?

OpenAI 基準測試顯示 GPT-5.2 略有提升。這對於大規模工作的研究人員和開發人員來說非常重要。然而,即使是高級用戶也可能會發現很難看到實際的好處。其他公司提供了更明顯的升級。谷歌的 Gemini Nano Banana Pro 模型在人工智能圖像創建和編輯方面顯示出明顯的進步。這些改進對於任何人來說都很容易測試和驗證。相比之下,GPT-5.2 的變化似乎很抽象。它們大多出現在紙上,而不是日常使用。

這對你來說意味著什麼?

如果您為 ChatGPT 付費,那麼使用 GPT-5.2 會有一個輕微的缺點。它取代了型號系列中的 GPT-5.1,並且通常在日常使用中至少表現良好。免費用戶也沒有太多選擇,因為對錶單的訪問是自動處理的。對於大多數人來說,這種體驗感覺熟悉且穩定。

對於程序員和在商業中使用它的人來說,情況發生了一些變化。早期定價細節表明,GPT-5.2 每百萬代幣的成本可能比 GPT-5.1 高出約 40%,具體取決於使用級別和訪問方法。這使得在大規模提交之前進行測試變得非常重要。

意大利使用智能手機的女性

Kurt Knutson 寫道,ChatGPT-5.2 運行良好,但可能感覺不太令人興奮。 (Michael Nguyen/Norphoto 來自 Getty Images)

簡而言之,GPT-5.2 工作得很好。你可能根本不會感到興奮。

凱文·奧利裡 (Kevin O’Leary) 警告中國不要在人工智能競賽中“退縮”,因為前方存在監管障礙

參加我的測驗:您的在線安全有多安全?

您認為您的設備和數據真正受到保護嗎?做一下這個快速測驗,看看您的數字習慣處於什麼位置。從密碼到 Wi-Fi 設置,您將獲得有關您做得正確和需要改進的個性化分析。在這裡進行我的測試: Cyber​​​​guy.com

庫爾特的主要收穫

GPT-5.2 感覺像是一個在壓力下而不是靈感下發布的模型。它表現良好,保持可靠,並以可衡量的方式向前發展。然而,它並沒有提供許多人期望的新版本號那樣的明顯進展。 OpenAI 仍然是人工智能領域的領導者,但競爭正在迅速逼近。隨著競爭對手做出更明顯的改進,小的更新可能不足以脫穎而出。目前,GPT-5.2 看起來不太像黑客攻擊,而更像是 OpenAI 堅守陣地。

單擊此處下載福克斯新聞應用程序

人工智能公司是否應該放慢發布速度,直到改進變得更有意義?請寫信告知我們 Cyber​​​​guy.com。

註冊我的免費 Cyber​​​​Guy 報告
獲取最佳技術提示、重大安全警報以及直接發送到您收件箱的獨家優惠。另外,當您加入我的網站時,您將可以立即免費訪問我的《終極詐騙生存指南》 CYBERGUY.COM 通訊。

版權所有 2025 Cyber​​​​Guy.com。版權所有。

來源連結

LEAVE A REPLY

Please enter your comment!
Please enter your name here