OpenAI 周五在其官網上發表了博客文章,名為“駕馭合成聲音的挑戰和機遇”, 這也是 OpenAI 在官網首次展示了全新自定義音頻模型“Voice Engine”。
用戶只需要提供15秒左右的參考聲音,通過Voice Engine就能生成幾乎和原音一模一樣的全新音頻,在清晰度、語音連貫、音色、自然度等方面比市面上多數產品都強很多。
除了能合成音頻之外,OpenAI 還展示了Voice Engine很多其他際商業用途,例如,一位失去聲音表達能力的女孩,在Voice Engine幫助下能像以前一樣正常發音說話。
全文內容:OpenAI 官網
Voice Engine 應用場景:
1. 閱讀助手:可以通過自然且富有情感的聲音為非閱讀者和兒童提供閱讀輔助,實時個性化響應,與學生互動。
2. 內容翻譯:可以翻譯視頻和播客等內容,使創作者和企業能夠以流利且原汁原味的聲音觸達全球更多受眾。
3. 服務全球:改善偏遠地區的必要服務。
4. 幫助言語障礙人士:為言語障礙人士提供治療應用,以及為有學習需求的人士提供教育增強功能,使殘疾人能夠進行交流。
5. 幫助病人恢復聲音:幫助患有突發性或退行性言語障礙的患者恢復聲音。