微軟 Azure Neural TTS新增了五種聲音模型(神經網絡版文本轉語音),讓我們再次體會到風格遷移技術 AI 強有力的支持語音模型多情感多風格。
芯片采購網專注于整合國內外授權IC代理商現貨資源,芯片庫存實時查詢,行業價格合理,采購方便IC芯片,國內專業芯片采購平臺。
更新的五種美式英語聲音模型包括青春甜美 Jane、低沉溫和的 Nancy、隨意而精力充沛 Davis、響亮激昂的 Jason 沙啞粗獷 Tony。在風格遷移技術的支持下,我們不僅快樂 (cheerful)、傷心 (sad)、生氣 (angry)、興奮 (excited)、期待 (hopeful)、友好 (friendly)、不友好 (unfriendly) 和恐懼 (terrified) 等待豐富的情感表現,還有第一次使用的呼喊 (shouting) 和耳語 (whispering) 兩種表達方式。到目前為止,用戶已經達到了可選的美國英語聲音模型 20 豐富的情感和風格使應用場景更加多樣化。
風格遷移技術的原理是將一個聲音模型的節奏和語調復制到另一個聲音模型上,使后者在音色不變的前提下也能有前者的節奏和語調。過去,聲音風格的構建主要依靠錄音演員錄制各種風格的聲音數據,然后使用錄音數據生成多種風格的智能語音模型,但錄音演員很難解釋所有風格的聲音。風格遷移技術創新地解決了這個問題,可以有效地給予更多 AI 情感和風格的聲音。
聲音風格和聲音情感模型的不斷更新,使 Azure Neural TTS 合成語音已廣泛應用于各種商業場景中,讓用戶感受到更現實的語音體驗。例如,游戲平臺可以快速為角色產生各種情感聲音,為游戲增加更個性化的情節表達,使虛擬游戲世界栩栩如生。State of Decay”(腐爛國NDK代理)創作者 —— 微軟亡靈工作室 (Undead Labs) 它的使命是為游戲創造一個新的方向,它們應用于游戲開發 Azure Neural TTS。推出包括推出Psychonauts 二、精神病患者 2)多種游戲,包括多種游戲 Double Fine 工作室也在使用 Azure Neural TTS 制作未來游戲項目的原型。音頻解決方案提供商 Remixd 集成在其平臺中 Azure Neural TTS 的聲音模型 Jenny 和 Davis,讓客戶在創建音頻內容時有更多的選擇。
關于 Azure Neural TTS
微軟 Azure Neural TTS 是 Azure 開發人員可以使用認知服務中強大的語音合成功能 AI 技術將文本轉化為逼真的聲音。到目前為止,微軟 Azure Neural TTS 支持全球 140 提供國家和地區的語言 400 聲音模型可以加速聲音的自動化生產,幫助各種企業更快地培養滿足業務場景的聲音,打造專屬的聲音品牌 —— 無論是呼叫中心、語音助手、有聲書制作、聊天機器人、語音導購,還是影視劇 / 動畫配音、自媒體短視頻、情感電臺、教育培訓等場景。
持續的技術迭代和版本更新,讓 Azure Neural TTS 它能為更多的企業和場景提供逼真、自然、腳踏實地的聲音體驗。同時,微軟的所有技術進步都接受微軟的責任 AI 流程指導遵循公平、包容、可靠、安全、透明、隱私、安全、負責任的原則,通過微軟負責人工智能辦公室 (ORA),人工智能、倫理與工程研究委員會 (Aether),以及負責任 AI 戰略管理團隊 (RAISE) 監督和實施這些道德標準。