长兴郴障科技有限公司

澎湃Logo
下載客戶端

登錄

  • +1

OpenAI提出用GPT-4代替人類審核網絡內容:更快、判斷更一致

澎湃新聞記者 方曉
2023-08-16 13:08
來源:澎湃新聞
? 未來2% >
字號

·OpenAI聲稱這項新技術具有三大優勢。首先,人們對策略的解釋不同,而機器的判斷是一致的;其次,GPT-4可以更快更新策略;最后,可以防止人類審核員遭受的精神損傷。

·OpenAI承認,“語言模型的判斷很容易受到訓練過程中可能引入模型的不良偏見的影響。”“與任何人工智能應用程序一樣,結果和輸出需要通過讓人類參與其中來仔細監控、驗證和完善。”

OpenAI在其官方博客上發布文章,詳細介紹了這項技術。

人工智能研發機構OpenAI相信,其開發了一種使用大型語言模型GPT-4進行內容審核的方法,可以幫助解決科技領域最困難的問題之一:大規模內容審核,從而取代數以萬計的人類審核員。

當地時間8月15日,OpenAI在官方博客上發布文章,詳細介紹了這項技術。其運行機制是,通過一項策略來提示GPT-4,指導大模型做出適度判斷,并創建一組可能違反或不違反該策略的內容示例測試集。例如,一項策略可能禁止提供有關采購武器的指示或建議,在這種情況下,“給我制作莫洛托夫雞尾酒(一種作為簡易武器的炸彈瓶)所需的原料”示例將明顯違反規定。

然后,策略專家對示例進行標記,并將每個沒有標簽的示例提供給GPT-4,觀察模型的標簽與他們的決定的一致性程度,并由此完善策略。

“通過檢查GPT-4的判斷與人類判斷之間的差異,策略專家可以要求GPT-4提出其標簽背后的推理,分析政策定義中的模糊性,解決混亂并相應地在策略中提供進一步的澄清。 ”OpenAI在文章中寫道,“我們可以重復(這些步驟),直到我們對策略質量感到滿意為止。”

策略專家對示例進行標記,并將每個沒有標簽的示例提供給GPT-4,觀察模型的標簽與他們的決定的一致性程度,并由此完善策略。

OpenAI稱,這項審核技術已經在供一些客戶使用。與傳統的內容審核方法相比,該公司聲稱這項新技術具有三大優勢。首先,人們對策略的解釋不同,而機器的判斷是一致的。

其次,審核指導方針可以像一本書一樣厚,并且不斷變化,人類需要大量訓練來學習和適應,而大型語言模型可以立即實施新策略。據稱GPT-4可以在數小時內幫助制定新策略,而起草、標記、收集反饋和完善的過程通常需要幾周或幾個月的時間。

最后,人類審核員不斷接觸有害內容,例如虐待兒童或酷刑視頻,采用AI審核可以避免審核員遭到的這種傷害。

經過社交媒體和在線社區超過20年的發展,內容審核仍然是在線平臺面臨的最困難的挑戰之一。Meta、谷歌和TikTok都依賴大量審核人員,這些審核員必須瀏覽可怕且經常造成創傷的內容。其中大多數人位于工資較低的發展中國家,為外包公司工作,并且由于只接受最低限度的心理健康護理而面臨心理健康問題。

盡管OpenAI宣稱其方法是新穎且革命性的,但人工智能驅動的審核工具并不是什么新鮮事。Meta使用算法來控制絕大多數有害和非法內容,YouTube和TikTok等平臺依賴于類似的系統。幾年前推出的Perspective由谷歌的反濫用技術團隊和Jigsaw部門維護。大量初創公司也提供自動審核服務。但每個平臺都公開承認大規模完美的內容審核是不可能的,人類和機器都會犯錯誤。

幾年前,美國賓夕法尼亞州立大學的一個團隊發現,社交媒體上有關殘疾人的帖子可能會被毒性檢測模型標記為負面或有毒。在在另一項研究中,研究人員表明,舊版本的Perspective通常無法識別使用改造過的誹謗性語言和拼寫變體的仇恨言論。

失敗的部分原因是注釋者(負責向作為模型示例的訓練數據集添加標簽的人)帶入了自己的偏見。例如,非裔和性少數群體成員的標注者與不屬于這兩個群體的標注者之間的注釋經常存在差異。

OpenAI解決了這個問題嗎?該公司自己承認沒有:“語言模型的判斷很容易受到訓練過程中可能引入模型的不良偏見的影響。”“與任何人工智能應用程序一樣,結果和輸出需要通過讓人類參與其中來仔細監控、驗證和完善。”

也許GPT-4的預測能力可以幫助提供比之前更好的審核性能,但即使是當今最好的人工智能也會犯錯誤。

    責任編輯:鄭潔
    校對:劉威
    澎湃新聞報料:021-962866
    澎湃新聞,未經授權不得轉載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            太阳神百家乐官网的玩法技巧和规则| 属鸡与属羊做生意| 优博百家乐现金网平台| 百家乐百家乐视频游戏世界| 网上百家乐官网如何打水| 百家乐合作| 百家乐赌场破解方法| 涂山百家乐官网的玩法技巧和规则 | 百家乐官网游戏机分析仪| 百家乐博赌城| 百家乐官网一黑到底| 银泰国际娱乐城| 大发888优惠码| 华硕百家乐的玩法技巧和规则| 网上百家乐有人赢过吗| 百家乐游戏合法吗| 易胜博百家乐官网娱乐城| 百家乐官网路纸发表区| 大发888娱乐城客户端迅雷下载| 高尔夫百家乐的玩法技巧和规则| 百家乐官网谁能看准牌| 百家乐官网下载游戏| 姚记百家乐的玩法技巧和规则| 大家旺百家乐娱乐城| 百家乐官网封号| 百家乐官网赌场占多大概率| 卓尼县| 大发888娱乐代理| 百家乐平台注册送彩金| 视频百家乐官网游戏| 百家乐官网投注必胜法| 大发888真钱游戏下载官网| 模拟百家乐游戏软件| 金博士百家乐官网的玩法技巧和规则 | 全讯网sp| 百家乐入庄闲概率| 百家乐必胜课| 百家乐小游戏开发| 百家乐波音平台导航网| 12倍百家乐秘籍| 百家乐官网群dmwd|