06:18Kimi發布全新通用音頻基礎模型Kimi-Audio金十數據4月26日訊,今日,Kimi發布新的開源項目——全新通用音頻基礎模型 Kimi-Audio。據介紹,該模型支持語音識別、音頻理解、音頻轉文本、語音對話等多種任務。AUDIO-1.59%
03:22阿里通義開源音頻語言模型Qwen2-Audio,相關論文入選頂會ACL 2024金十數據8月13日訊,阿里通義大模型繼續開源,Qwen2系列開源家族新增音頻語言模型Qwen2-Audio。Qwen2-Audio可以不需文本輸入,直接進行語音問答,理解並分析用戶輸入的音頻信號,包括人聲、自然音、音樂等。該模型在多個權威測評中都顯著超越先前的最佳模型。通義團隊還同步推出了一套全新的音頻理解模型測評基準,相關論文已入選本週正在舉辦的國際頂會ACL2024。AUDIO-1.59%