微軟宣布推出四種新的人工智慧文字轉語音語音,可與 Azure OpenAI 搭配使用

微軟宣布推出四種新的人工智慧文字轉語音語音,可與 Azure OpenAI 搭配使用

微軟宣布推出四種新的人工智慧驅動的神經語音,用於文字轉語音(TTS)應用程序,從今天開始可在Azure OpenAI GPT 中使用,以幫助創建基於語音的聊天機器人、語音助理或會話代理。

這四個語音分別名為en-US-AndrewNeural、en-US-BrianNeural、en-US-EmmaNeural(均為美式英語)和zh-CH-YunjieNeural(中文),“針對對話場景進行了優化”,現已推出在美國東部、東南亞和西歐三個地區進行公開預覽。

微軟展示了一些新語音範例,與目前可用的其他神經語音進行比較,以展示在使語音更加自然和流暢方面所做的改進。

透過使用 Azure 語音 SDK 或 REST API,語音本身可以整合到使用Azure OpenAI的現有應用程式中,以及使用 Azure Bot Framework 來開發能夠使用新的神經 TTS 語音的智慧機器人。

微軟接著說:

「我們首先精心設計每個聲音的角色,就好像它是一個真實的人,友好且對生活持樂觀態度,總是渴望幫助他人並分享有趣或實用的知識。聲音的說話方式就像是和熟人喝茶聊天,語氣自然不誇張。”

此外,我們不斷增強文字轉語音 (TTS) 建模技術,以提高人工智慧語音的品質。我們最近的項目,例如 DelightfulTTS 2 和 MuLanTTS,顯著縮小了人工智慧語音和專業真人錄音之間的品質差距,產生比以往更自然、更真實的聲音。這些技術進步是建構這些新的人工智慧聲音的基礎。

這四種新語音將與現有的 400 多種神經語音一起提供,涵蓋 140 多種語言和地區。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *