Home 综合新闻 Kurt Knutson 回顧 OpenAI GPT-5.2 模型

综合新闻

Kurt Knutson 回顧 OpenAI GPT-5.2 模型

26 12 月 2025

ChatGPT 真的能幫助育兒嗎？

Jenny Failla 和 Madison Alworth 加入了“福克斯新聞周六晚間”小組，分享了他們對 OpenAI 首席執行官 Sam Altman 承認他依靠 ChatGPT 來幫助育兒的看法。

新的您現在可以收聽福克斯新聞的文章！

ChatGPT 背後的公司 OpenAI 在 2025 年的發展速度異常快。據該公司稱，它於 8 月推出了 GPT-5，隨後於 11 月推出了 GPT-5.1。現在，僅僅幾週後，GPT-5.2 就發布了，人們普遍認為它是迄今為止最智能、功能最強大的 ChatGPT。

乍一看，其快速推出似乎令人驚訝。但其背後是有背景的。據報導，OpenAI 首席執行官 Sam Altman 稱其為公司內部的“紅色代碼”，敦促團隊更快地改進 ChatGPT。這一推動是隨著競爭的加劇而出現的。谷歌最近發布了 Gemini 3，據說在多項 AI 基準測試中表現優於 ChatGPT，並提供了更強的圖像生成能力。與此同時，Claude Anthropy 繼續快速前進。

在此背景下，GPT-5.2看起來不像是例行升級，而更像是戰略應對。那麼 GPT-5.2 中到底發生了什麼變化，為什麼 OpenAI 說它很重要呢？

註冊我的免費 CyberGuy 報告
獲取最佳技術提示、重大安全警報以及直接發送到您收件箱的獨家優惠。另外，當您加入我的網站時，您將可以立即免費訪問我的《終極詐騙生存指南》 CYBERGUY.COM 通訊。

亞馬遜正在為 Ring 添加備受爭議的人工智能面部識別功能

2025 年 7 月 22 日，在華盛頓特區舉行的美聯儲大銀行會議資本框架綜合審查期間，OpenAI 首席執行官 Sam Altman 正在午休。（路透社/肯·塞德諾）

GPT-5.2到底是什麼

GPT-5.2是OpenAI領先的5系列大語言模型中的最新版本。與它的前身一樣，它包含兩個默認變量。 GPT-5.2 Instant 專為日常對話和網絡搜索而設計。 GPT-5.2 推理適用於更複雜的任務，例如長鏈推理和多步驟問題解決。這兩種形式現在是所有 ChatGPT 用戶（包括免費用戶）的默認形式。它完全取代了GPT-5.1 Instant和Thinking。如果您現在使用 ChatGPT，那麼無論您是否意識到，您都已經在使用 GPT-5.2。

OpenAI 表示 GPT-5 給 ChatGPT 帶來了什麼

與此同時，OpenAI 繼續將 GPT-5 定位為“為每個人提供專家情報。 ” 該公司表示，GPT-5 在數學、科學、金融、法律和其他復雜科目上表現更出色。從 OpenAI 的角度來看，ChatGPT 現在更像是一個按需專家團隊，而不是一個基本的聊天機器人。為了支持這一說法，OpenAI 舉了一些實際例子。這包括更好的編程幫助、更具表現力的打字支持、更清晰的健康相關解釋以及更高的安全性和準確性。該公司展示了一些用例，例如創建應用程序代碼、撰寫演講、解釋藥物以及糾正用戶提交的圖像中的錯誤。理論上，GPT-5.2也是基於同樣的基礎。然而，儘管 OpenAI 強調更深入的思考和更可靠的答案，但這些收益對於許多普通用戶來說仍然是隱藏的。

GPT-5.2添加了哪些新功能？

這是簡短的答案。沒有人。 GPT-5.2 沒有引入主要的新工具、界面或功能。相反，OpenAI 描述了一系列幕後改進，這些改進將使 ChatGPT 更快、更智能、更強大。根據 OpenAI 的說法，GPT-5.2 最適合：

建築演示
完成複雜的項目
創建電子表格
了解長上下文窗口
圖像解讀
更有效地使用工具

Kurt Knutson 回顧了 ChatGPT-5.2 中的新功能。（庫爾特·“CyberGuy”·克努森）

OpenAI 還發布了新的基準測試，顯示 GPT-5.2 的性能略勝於 GPT-5.1 和競爭模型。然而，圖表上的大數字並不總是能為真實用戶帶來明顯的改進。

專家表示，美軍的新型 GENAI 工具是未來戰爭的“關鍵的第一步”

為什麼測試聊天機器人的改進很困難？

評估聊天機器人升級比看起來更困難。即使提示保持不變，響應也可能有很大差異。模型可能在一項任務上表現出色，但稍後很難執行幾乎相同的任務。此外，OpenAI 的 5 系列模型已經達到或接近該領域的頂尖水平。當性能開始如此高時，就很難檢測到有意義的增益。考慮到這一點，我們測試了 GPT-5.2，在大多數測試中它的行為幾乎與 GPT-5.1 相同。

為什麼標準不能說明全部情況？

OpenAI 基準測試顯示 GPT-5.2 略有提升。這對於大規模工作的研究人員和開發人員來說非常重要。然而，即使是高級用戶也可能會發現很難看到實際的好處。其他公司提供了更明顯的升級。谷歌的 Gemini Nano Banana Pro 模型在人工智能圖像創建和編輯方面顯示出明顯的進步。這些改進對於任何人來說都很容易測試和驗證。相比之下，GPT-5.2 的變化似乎很抽象。它們大多出現在紙上，而不是日常使用。

這對你來說意味著什麼？

如果您為 ChatGPT 付費，那麼使用 GPT-5.2 會有一個輕微的缺點。它取代了型號系列中的 GPT-5.1，並且通常在日常使用中至少表現良好。免費用戶也沒有太多選擇，因為對錶單的訪問是自動處理的。對於大多數人來說，這種體驗感覺熟悉且穩定。

對於程序員和在商業中使用它的人來說，情況發生了一些變化。早期定價細節表明，GPT-5.2 每百萬代幣的成本可能比 GPT-5.1 高出約 40%，具體取決於使用級別和訪問方法。這使得在大規模提交之前進行測試變得非常重要。

Kurt Knutson 寫道，ChatGPT-5.2 運行良好，但可能感覺不太令人興奮。（Michael Nguyen/Norphoto 來自 Getty Images）

簡而言之，GPT-5.2 工作得很好。你可能根本不會感到興奮。

凱文·奧利裡 (Kevin O’Leary) 警告中國不要在人工智能競賽中“退縮”，因為前方存在監管障礙

參加我的測驗：您的在線安全有多安全？

您認為您的設備和數據真正受到保護嗎？做一下這個快速測驗，看看您的數字習慣處於什麼位置。從密碼到 Wi-Fi 設置，您將獲得有關您做得正確和需要改進的個性化分析。在這裡進行我的測試： Cyberguy.com。

庫爾特的主要收穫

GPT-5.2 感覺像是一個在壓力下而不是靈感下發布的模型。它表現良好，保持可靠，並以可衡量的方式向前發展。然而，它並沒有提供許多人期望的新版本號那樣的明顯進展。 OpenAI 仍然是人工智能領域的領導者，但競爭正在迅速逼近。隨著競爭對手做出更明顯的改進，小的更新可能不足以脫穎而出。目前，GPT-5.2 看起來不太像黑客攻擊，而更像是 OpenAI 堅守陣地。

單擊此處下載福克斯新聞應用程序

人工智能公司是否應該放慢發布速度，直到改進變得更有意義？請寫信告知我們 Cyberguy.com。

Curt “CyberGuy” Knutson 是一位屢獲殊榮的科技記者，他對技術、設備和小玩意充滿熱愛，通過為福克斯新聞和福克斯商業晨間節目“FOX & Friends”做出貢獻，讓生活變得更加美好。您有技術問題嗎？獲取 Kurt 的免費 CyberGuy 時事通訊，並分享您的聲音、故事想法或評論 CyberGuy.com。

來源連結

Kurt Knutson 回顧 OpenAI GPT-5.2 模型

ChatGPT 真的能幫助育兒嗎？

GPT-5.2到底是什麼

OpenAI 表示 GPT-5 給 ChatGPT 帶來了什麼

GPT-5.2添加了哪些新功能？

為什麼測試聊天機器人的改進很困難？

為什麼標準不能說明全部情況？

這對你來說意味著什麼？

庫爾特的主要收穫

LEAVE A REPLY Cancel reply

最近的文章

噴氣機隊裁掉 T 梅森泰勒、D 威爾麥克唐納和另外 2 人 vs 愛國者隊

丹尼斯·奧斯汀 (Denise Austin) 表示 Ozempic 使用者需要“肌肉調理”才能維持效果

河床向桑蒂諾·安迪諾提供的百萬富翁金額令人震驚河床 El Intransigente

新的超導體打破了物理學家認為已定的定律。

無家可歸的前尼克頻道明星泰勒·蔡斯在觀看令人震驚的視頻後進入康復中心：報告

莎拉·德魯 (Sarah Drew) 被“槲寄生之謎”所感動

由於銷售額下降，陷入困境的塔吉特感受到了投資者湯姆斯資本的壓力

所有類別