像 ChatGPT 這樣的創意人工智能係統能否產生真正創新的想法?由蒙特利爾大學心理學系的 Karim Jerbi 教授領導的一項新研究,以及著名人工智能研究員 Yoshua Bengio 的參與,以前所未有的規模回答了這個問題。這項研究是迄今為止人類創造力與大規模語言模型創造力之間最大規模的直接比較。
該研究發表於 科學報告 (Nature Portfolio)指出了一個重大轉變:生成式人工智能係統現在已經達到了在某些創造力指標上超越普通人類的水平。與此同時,即使是最強大的人工智能模型,最有創造力的人仍然表現出明顯和一致的優勢。
人工智能已經達到了普通人的創造力水平。
研究人員評估了幾種領先的大規模語言模型,包括 ChatGPT、Claude、Gemini 等,並將它們的性能與超過 100,000 名人類參與者的結果進行了比較。結果表明一個明顯的轉折點。包括 GPT-4 在內的一些人工智能係統在旨在衡量不同語言創造力的任務上超過了人類平均得分。
“我們的研究表明,一些使用大規模語言模型的人工智能係統可以在明確定義的任務中超越人類的平均創造力,”Karim Jerbi 教授解釋道。 “這個結果可能令人驚訝。儘管令人擔憂,但我們的研究還強調了一個同樣重要的觀察結果:即使是最好的人工智能係統也遠遠低於最有創造力的人類所達到的水平。”
該研究的共同第一作者、博士後研究員 Antoine Bellemare-Pépin(蒙特利爾大學)和博士生 François Lespinasse(康考迪亞大學)的進一步分析揭示了驚人的模式,儘管某些人工智能模型的表現優於其他模型。但最終的創造力仍然是人類的。
事實上,當研究人員檢查最具創造力的一半參與者時,他們的平均得分高於每個測試的人工智能模型的得分。在最具創造力的前 10% 的人中,這一差距甚至更大。
Mila 副教授 Karim Jerbi 表示:“我們開發了一個嚴格的框架,使我們能夠使用相同的工具比較人類和人工智能的創造力。它基於與多倫多大學 Jay Olson 合作的超過 100,000 名參與者的數據。”
科學家如何衡量人類和人工智能的創造力
研究小組使用了多種方法。公平地評估人類和機器的創造力就這麼多了。主要工具是發散聯想任務(DAT),這是一種廣泛使用的心理測試,用於衡量發散創造力。或者從單一提示中產生多樣化和原創想法的能力。
DAT 由該研究的合著者傑伊·奧爾森 (Jay Olson) 創建。它要求參與者(無論是人類還是人工智能)列出 10 個盡可能在語義上不相關的單詞。創造性反應的例子包括“銀河、叉子、自由、藻類、口琴、量子、懷舊、天鵝絨、颶風、光合作用”。
這項任務的表現與其他創造力測試的結果密切相關。寫作中使用概念化和創造性解決問題雖然這項工作主要是基於語言的,但不僅僅是詞彙。通過將涉及多個領域的創造力的更廣泛的認知過程聯繫起來,DAT 還具有實際優勢。這是因為它只需兩到四分鐘即可完成,並且公眾可以在線訪問。
從單詞列表到純粹的創意寫作。
研究人員隨後檢查了人工智能在簡單的單詞關聯任務中的成功程度。這是否可以擴展到更複雜、更現實的創意活動?為了測試這一點,他們比較了人工智能係統和人類參與者的創意寫作挑戰,例如創作俳句詩。 (三行短詩的形式)寫電影情節的概要。和短篇小說創作
結果遵循了熟悉的模式。儘管有時人工智能係統的表現優於人類,但最熟練的人類創造者仍在繼續交付更強大、更具原創性的作品。
AI創造力能否轉化?
這一發現提出了另一個重要問題。人工智能的創造力是固定的還是可以塑造的?研究表明,人工智能的創造力可以通過改變技術設置來調整。特別是模型的溫度。該參數控制生成的響應的可預測性或冒險性。
當溫度設置較低時,AI會產生更安全、更常見的輸出。在較高溫度下,反應會更加複雜。更不可預測,並且有更多的探索。這使得系統能夠超越熟悉的概念。
研究人員還發現,創造力受到提示的書寫方式的強烈影響,例如,鼓勵模型使用詞源來思考單詞起源和單詞結構的提示。這會帶來更多意想不到的聯繫和更高的創造力得分。這些結果凸顯了人工智能的創造力在很大程度上依賴於人類的指導。創造互動和刺激是創作過程的核心。
人工智能會取代它的人類創造者嗎?
該研究對人工智能可能取代創意專家的擔憂提供了平衡的視角,儘管人工智能係統在某些任務中可以匹配或超過普通人的創造力。但它仍然有明顯的局限性,並且依賴於人類的指導。
“雖然人工智能現在在一些測試中可以達到人類水平的創造力,但我們需要超越誤導性的競爭意識,”Karim Jerbi 教授說。 “生成式人工智能已經成為服務人類創造力的極其強大的工具。它不會取代創造者。相反,它將深刻改變他們想像、探索和創造的方式。對於那些選擇使用它的人來說。”
相反,它標誌著創造性職業的結束。這些發現預示著人工智能將充當創意助手的未來。通過擴展想法和開闢新的探索途徑,人工智能可能有助於擴展人類的想像力,而不是取代它。
“通過直接面對人類和機器的能力,像我們這樣的研究促使我們重新思考創造力的含義,”卡里姆傑爾比教授總結道。
教育性的
文章《人類的差異創造力和大規模語言模型》發表於 科學報告 2026 年 1 月 21 日,這項研究匯集了來自蒙特利爾大學、康科迪亞大學、多倫多大學密西沙加分校、Mila(魁北克人工智能研究所)和 Google DeepMind 的科學家。
Karim Jerbi 教授領導了這項研究,Antoine Bellemare-Pépin(蒙特利爾大學)和 François Lespinasse(康科迪亞大學)擔任共同第一作者。研究團隊還包括 Mila 和 LoiZéro 的創始人、深度學習先驅 Yoshua Bengio。它是 ChatGPT 等現代人工智能係統背後的技術。







