News | Gate.com

06:18

Kimi發布全新通用音頻基礎模型Kimi-Audio

金十數據4月26日訊，今日，Kimi發布新的開源項目——全新通用音頻基礎模型 Kimi-Audio。據介紹，該模型支持語音識別、音頻理解、音頻轉文本、語音對話等多種任務。

03:22

阿里通義開源音頻語言模型Qwen2-Audio，相關論文入選頂會ACL 2024

金十數據8月13日訊，阿里通義大模型繼續開源，Qwen2系列開源家族新增音頻語言模型Qwen2-Audio。Qwen2-Audio可以不需文本輸入，直接進行語音問答，理解並分析用戶輸入的音頻信號，包括人聲、自然音、音樂等。該模型在多個權威測評中都顯著超越先前的最佳模型。通義團隊還同步推出了一套全新的音頻理解模型測評基準，相關論文已入選本週正在舉辦的國際頂會ACL2024。

AUDIO-1.59%