长兴郴障科技有限公司

澎湃Logo
下載客戶端

登錄

  • +1

日本正在打造自己的日語版“ChatGPT”

辛雨/中國科學報
2023-09-15 07:43
未來2% >
字號

日本超級計算機Fugaku已經開始消化日語文本,以開發日本版的ChatGPT。圖片來源:Kyodo News via Getty

日本正在打造自己的聊天機器人ChatGPT。據《自然》消息,日本政府聯合NEC、富士通、軟銀等大型科技公司投入數億美元,開發日語的大型語言模型(LLM)。

專門研究自然語言處理的日本東北大學研究員Keisuke Sakaguchi認為,目前的大型語言模型智能系統在英語方面表現出色,但在日語方面往往表現不佳。

ChatGPT之前的模型GPT-3訓練的絕大多數文本都是英語。由于日語的句子結構與英語完全不同,因此,ChatGPT必須將日語翻譯成英語才能找到答案,然后再將答案譯回日語。

書面日語由兩組48個基本字符和2136個常用漢字組成。由于日語的復雜性,ChatGPT有時會生成大多數人從未見過的極其罕見的字符,以及奇怪的未知單詞。

一個有用的LLM需要準確反映日本文化習俗。為了衡量LLM對日本文化的熟悉程度,研究人員推出了Rakuda—— 一個衡量LLM回答有關日本主題的開放式問題能力的排名。結果發現,日本最好的LLM在Rakuda上排名第四,GPT-4排名第一。

研究日語模型的東京大學物理學家Passaglia表示,LLM遠遠落后于GPT-4,但將來未必不能達到或超過GPT-4的水平。“這不是技術上無法克服的問題,只是資源問題。”

創建LLM需要使用日本超級計算機Fugaku,主要用于訓練日語輸入。與GPT-4和其他專有模式不同,它將與其他開源LLM一起向所有用戶提供其代碼。

日本文部科學省正在資助創建一個針對科學需求的人工智能項目,該LLM的開發成本至少為300億日元,預計將于2031年公開發布。超級計算機制造商NEC在5月份開始使用基于日語的生成式人工智能,并聲稱它將創建內部報告所需時間縮短了50%、將內部軟件源代碼縮短了80%。

與此同時,軟銀投資約200億日元開發基于日語文本的生成式人工智能,并計劃明年推出自己的LLM,其目標是幫助企業實現業務數字化、提高生產率。

日本研究人員希望開發出一個精確、有效的人工智能聊天機器人促進本國的科學發展,彌補日本與世界其他地區之間的差距。東京慶應義塾大學醫學院醫學技術研究員Shotaro Kinoshita表示,如果日文版的ChatGPT能夠表述準確,有望為那些想學習日語或進行日本研究的人帶來好處,從而產生積極影響。

    責任編輯:吳躍偉
    澎湃新聞報料:021-962866
    澎湃新聞,未經授權不得轉載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            威尼斯人娱乐上网导航| 大发888游戏客户端下载| 网络百家乐官网破| 百家乐官网网站新全讯网| 最好的棋牌游戏平台| 永利百家乐的玩法技巧和规则 | 太阳城百家乐官网公司| 竹溪县| 大发888破解| 百家乐赌场现金网平台排名| 百家乐官网游乐园| 哪个百家乐官网投注平台信誉好| 咸丰县| 大悟县| 大发888娱乐城官方免费下载| 百家乐制胜软件| 百家乐视频打麻将| 金杯百家乐官网的玩法技巧和规则| 做百家乐官网网上投注| 澳门百家乐官网娱乐城怎么样| 线上百家乐官网可靠吗| 网上玩百家乐会出签吗| 百家乐官网群| 新锦江百家乐官网娱乐场| 百家乐官网币| 玩百家乐官网怎么才能赢| 玉屏| 88娱乐城天上人间| 皇家一号娱乐城| 云博| 欧洲娱乐场| 武穴市| 百家乐官网赌神| 百家乐官网洗码方法| 肇州县| 迪威百家乐官网娱乐| 开心8百家乐官网游戏| 百家乐官网游戏发展| 百家乐官网怎么稳赚| 龙里县| 庐江县|