- +1
兩款開源模型曝光量突破千萬,階躍星辰將繼續開源圖生視頻模型
上海AI企業開源的大模型,市場反響如何?
2月22日上午,在上海西岸大劇院舉行的2025全球開發者先鋒大會開幕式上,階躍星辰創始人、CEO姜大昕發表主題演講,并劇透:將在今年3月繼續開源圖生視頻模型。本文圖片 澎湃新聞記者 俞凱 攝
2月22日上午,在上海西岸大劇院舉行的2025全球開發者先鋒大會開幕式上,階躍星辰創始人、CEO姜大昕發表主題演講時透露,自從2月18日階躍星辰開源了全球參數量最大的開源視頻生成模型 Step-Video-T2V,以及行業內首款產品級開源語音交互大模型 Step-Audio之后,在技術社區上的收藏量已遠遠超出了其他的多元模型,在海內外的各個社交媒體社交平臺上,這兩款開源模型的曝光量也突破了千萬級。
2月22日上午,在上海西岸大劇院舉行的2025全球開發者先鋒大會開幕式上,階躍星辰創始人、CEO姜大昕發表主題演講,并劇透:將在今年3月繼續開源圖生視頻模型。
姜大昕說,蛇年春節的兩大熱點,一個是電影《哪吒2》,一個就是DeepSeek的開源,這款強大的語言模型,為全球的開發者社區做出了了不起的貢獻。階躍星辰在多模態領域有著深厚的積累,也訓練了強大的模型。所以在DeepSeek的感召下,他們也決定開源,一個是文生視頻,另外一個是語音交互的動態大模型。
演講中,姜大昕饒有興致地展示了全球開發者用階躍星辰開源模型生成的視頻集錦。
演講中,姜大昕展示了全球開發者用階躍星辰開源模型生成的視頻集錦,并重點介紹了這次開源的行業內首款產品級開源語音交互大模型 Step-Audio,它的參數量達到了1300億,可以根據不同的場景,生成不同的方言、語種和情緒,以及個性化風格的表達,還能做高質量的音色復刻以及角色扮演,在5個主流的公開評測平臺上,它的指標也超過了同種類型的語音開源大模型,漢語水平的表現也非常出色。
演講中,姜大昕饒有興致地展示了全球開發者用階躍星辰開源模型生成的視頻集錦。
姜大昕提到,階躍星辰的模型和DeepSeek的R1模型一樣,背后采用了強化學習的方法,該公司和清華大學合作,在強化學習這一方向上有了更新的探索。現在機器的思考能力其實還是比較弱的,它只能進行幾十秒、最多達到幾分鐘這樣的一個思考。將來隨著模型能力越來越強大,機器的思考時間會變得越來越長,它思考問題的范圍也會越來越寬泛。目前在金融領域,在內容創作以及新零售和數字人方向,階躍和合作伙伴一起打造了垂直領域的模型。
演講中,姜大昕饒有興致地展示了全球開發者用階躍星辰開源模型生成的視頻集錦。
“在開源的過程當中,我們也收到了開發者強烈的反饋,他們希望我們能夠開源更多的模型。”姜大昕在演講時透露,為了回應開發者的需求,階躍星辰決定繼續開源,“這里我也可以劇透一下,階躍星辰將在今年3月份繼續開源我們強大的圖生視頻模型,也敬請大家關注。”





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司