研究表明：AI聊天機器人在創造性思維任務上超越大部分人類

趙熙熙/中國科學報

2023-09-15 07:59

當前AI對話機器人的創意能力已與人類相當。但作者也指出，他們只評價了涉及創造性評估的單項任務的表現。

《科學報告》9月14日發表的一項研究指出，大型語言模型（LLM）人工智能（AI）對話機器人在創造性思維任務上能夠超越大部分人類。該任務要求受試者想出日常用品的替代用途，這是發散性思維的一個例子。不過，得分最高的人類受試者依然能超過對話機器人的最佳答案。

發散性思維通常是指與創造性相關的一類思維過程，需要為特定任務想出各種不同創意或對策。發散性思維一般通過替代用途任務（AUT）進行評估，受試者被要求在短時間內想出某個日常用品的其他用途，越多越好。受試者的回答從4個類別進行打分：流利度、靈活性、原創性和精細度。

在這項研究中，ChatGPT3、ChatGPT4和Copy.Ai完成了4個物品，即繩子、盒子、鉛筆、蠟燭的AUT，芬蘭圖爾庫大學的Mika Koivisto和挪威卑爾根大學的Simone Grassini隨后將其與人類的答案進行了比較。

研究人員根據語義距離即回答與物品原始用途的相關度，和創造性回答的原創性打分。他們用一個計算方法在0~2的范圍里量化語義距離，同時讓不知道作答者身份的人類打分者在1~5的范圍里客觀評價創造性。

平均而言，對話機器人的回答在語義距離（0.95相對于0.91）和創造性（2.91相對于2.47）的得分上顯著高于人類的回答。人類回答在這兩項的得分差距更大——最低分遠低于AI的回答，但最高分普遍比AI高。最佳人類回答在8個評分項中的7項都超過了所有對話機器人的最佳回答。

這項研究結果表明，當前AI對話機器人的創意能力已與人類相當。但作者也指出，他們只評價了涉及創造性評估的單項任務的表現。作者認為，今后的研究或探索如何將AI融入創造性過程來提升人類表現。

相關論文信息：

https://doi.org/10.1038/s41598-023-40858-3

責任編輯：吳躍偉

圖片編輯：沈軻

澎湃新聞報料：021-962866

澎湃新聞，未經授權不得轉載

澎湃矩陣

新聞報料

互聯網新聞信息服務許可證：31120170006

增值電信業務經營許可證：滬B2-2017116

? 2014-2025 上海東方報業有限公司

反饋

长兴郴障科技有限公司