![]() |
Amazon 文本轉(zhuǎn)語音服務(wù)-Polly
專用API
【更新時間: 2024.06.19】
Amazon Polly 是一種將文本換為逼真語音的服務(wù),借助文字轉(zhuǎn)語音服務(wù),您可以創(chuàng)建能夠說話的應(yīng)用程序,并構(gòu)建全新類別的支持語音功能的產(chǎn)品。文字到語音支持多種語言。
0元/月起
去服務(wù)商官網(wǎng)采購>
|
瀏覽次數(shù)
70
采購人數(shù)
0
試用次數(shù)
0
收藏
×
完成
取消
×
書簽名稱
確定
|
- API詳情
- 定價
- 使用指南
- 常見 FAQ
- 關(guān)于我們
- 相關(guān)推薦


什么是Polly的Amazon 文本轉(zhuǎn)語音服務(wù)?
Amazon Polly 是 Amazon Web Services (AWS) 提供的一項文本轉(zhuǎn)語音(Text-to-Speech, TTS)服務(wù)。它允許開發(fā)人員將文本內(nèi)容轉(zhuǎn)換為自然、類似人聲的語音輸出。通過 Polly 的 API,用戶可以將任何文本轉(zhuǎn)換為高質(zhì)量的音頻流,這些音頻流可以直接播放,或者作為文件保存。
什么是Polly的Amazon 文本轉(zhuǎn)語音服務(wù)接口?
Polly的Amazon 文本轉(zhuǎn)語音服務(wù)有哪些核心功能?
- 高質(zhì)量的語音輸出:提供逼真的語音,支持多種語言和方言。
- 廣泛的語音和語言選擇:提供多種標準語音和神經(jīng)文本轉(zhuǎn)語音(NTTS)聲音,并支持多種語言。
- 語音同步的元數(shù)據(jù):提供與語音輸出同步的元數(shù)據(jù),用于改善視覺體驗,如語音同步的面部動畫或文字突出提示。
- 靈活的音頻格式和采樣率:支持多種音頻格式和采樣率,以適應(yīng)不同的帶寬和音頻質(zhì)量要求。
- 語音合成標記語言(SSML)支持:支持 SSML 標簽,以進行更高級的文本處理,如斷句、重音和語調(diào)調(diào)整。
- 自定義詞典:允許用戶自定義特定詞語的發(fā)音,以適應(yīng)品牌名稱、首字母縮略詞等。
- 品牌之聲:為組織提供定制化的神經(jīng)文本轉(zhuǎn)語音(NTTS)語音,以創(chuàng)建獨特的品牌聲音。
Polly的Amazon 文本轉(zhuǎn)語音服務(wù)的技術(shù)原理是什么?
Amazon Polly 使用深度學(xué)習(xí)技術(shù)來合成聽起來自然的人類語音,讓您可以將文章轉(zhuǎn)換為語音。借助多種語言的數(shù)十種逼真的聲音,使用 Amazon Polly 構(gòu)建語音激活的應(yīng)用程序。
- 創(chuàng)建內(nèi)容
- 在線學(xué)習(xí)
- 電話語音
Polly的Amazon 文本轉(zhuǎn)語音服務(wù)的核心優(yōu)勢是什么?
- 多語言語音生成
- 在面向全球受眾的應(yīng)用程序(如RSS源、網(wǎng)站或視頻)中,支持數(shù)十種語言的語音生成。
- 自然聲音吸引客戶
- 利用Amazon Polly的語音輸出,以自然的聲音吸引并存儲客戶語音,便于在交互式或自動語音響應(yīng)系統(tǒng)中對來電客戶進行語音提示。
- 語音屬性調(diào)整
- 支持使用SSML(語音合成標記語言),這是一種基于XML的W3C標準標記語言,用于調(diào)整說話風(fēng)格、語速、音調(diào)和音量。
- 適用于語音合成應(yīng)用程序,支持斷句、重音和語調(diào)等通用SSML標簽。
- 自定義語音輸出
- 提供自定義選項,支持詞典和SSML標簽的語音輸出控制。
- 標準格式存儲與重放
- 語音可以以標準格式(如MP3和OGG)進行存儲和重放,便于在各種設(shè)備和平臺上使用。
- 快速響應(yīng)與逼真體驗
- 提供一貫的快速響應(yīng)速度,確保用戶獲得逼真的聲音和對話式用戶體驗。
在哪些場景會用到Polly的Amazon 文本轉(zhuǎn)語音服務(wù)?
- 輔助技術(shù):為視覺障礙或閱讀困難的用戶提供有聲讀物、網(wǎng)頁內(nèi)容或應(yīng)用內(nèi)文本的有聲版本。
- 智能助手和聊天機器人:為 Alexa 技能、聊天機器人或智能助手提供自然、逼真的語音響應(yīng)。
- 教育應(yīng)用:用于語言學(xué)習(xí)、閱讀輔助或電子教材的有聲化。
- 視頻和播客:為視頻內(nèi)容添加旁白,或為播客生成音頻內(nèi)容。


您按月付費,計費依據(jù)是您處理的文本的字符數(shù)量。Amazon Polly 的標準語音定價為:對于超出免費套餐的語音或語音標記請求,每 100 萬個字符 4.00 USD。Amazon Polly 的神經(jīng)語音定價為:對于超出免費套餐的語音或請求的語音標記,每 100 萬個字符 16.00 USD。Amazon Polly 的長格式語音定價為:對于超出免費套餐的語音或請求的語音標記,每 100 萬個字符 100.00 USD。 Amazon Polly 的生成式語音定價為:對于超出免費套餐的語音請求,每 100 萬個字符 30 USD。
對于 Amazon Polly 的標準語音,從您提交第一個 Polly 語音或語音標記請求起 12 個月內(nèi),針對該類請求,免費套餐每個月提供 500 萬個字符服務(wù)。對于神經(jīng)語音,從您提交第一個語音或語音標記請求起 12 個月內(nèi),針對該類請求,免費套餐每個月提供 100 萬個字符服務(wù)。對于長格式語音,從您提交第一個 Polly 語音或語音標記請求起 12 個月內(nèi),針對該類請求,免費套餐每個月提供 50 萬個字符服務(wù)。 對于生成式語音,從您提交第一個 Polly 語音請求起 12 個月內(nèi),針對該類請求,免費套餐每個月提供 10 萬字符的服務(wù)。


![]() |
![]() |
![]() |
設(shè)置并登錄您的 AWS 賬戶 | 觀看網(wǎng)絡(luò)研討會并閱讀文檔。 | 登錄 Polly 控制臺并開始構(gòu)建。 |




AWS 云計算
Amazon Web Services(AWS)是全球最全面、應(yīng)用最廣泛的云,從全球數(shù)據(jù)中心提供超過 200 項功能齊全的服務(wù)。數(shù)百萬客戶(包括增長最快速的初創(chuàng)公司、最大型企業(yè)和主要的政府機構(gòu))都在使用 AWS 來降低成本、提高敏捷性并加速創(chuàng)新。
最多的功能
從計算、存儲和數(shù)據(jù)庫等基礎(chǔ)設(shè)施技術(shù),到機器學(xué)習(xí)、人工智能、數(shù)據(jù)湖和分析以及物聯(lián)網(wǎng)等新興技術(shù),AWS 提供的服務(wù)以及其中的功能比其他任何云服務(wù)提供商的都要多得多。這使得將現(xiàn)有應(yīng)用程序遷移到云中并構(gòu)建您可以想象的幾乎任何東西都變得更快、更容易且更具成本效益。
AWS 的這些服務(wù)還具有最為多樣復(fù)雜的功能。例如,AWS 提供了種類繁多的數(shù)據(jù)庫,這些數(shù)據(jù)庫是為不同類型的應(yīng)用程序?qū)iT構(gòu)建的,因此您可以選擇適合作業(yè)的工具來獲得最佳的成本和性能。
最大的客戶和合作伙伴社區(qū)
AWS 擁有最大且最具活力的社區(qū),在全球擁有數(shù)百萬活躍客戶和成千上萬個合作伙伴。幾乎所有行業(yè)和規(guī)模的客戶(包括初創(chuàng)公司、企業(yè)和公共部門組織)都在 AWS 上運行所有可能的使用案例。AWS 合作伙伴網(wǎng)絡(luò) (APN) 包括專注于 AWS 服務(wù)的數(shù)千個系統(tǒng)集成商和成千上萬個將其技術(shù)應(yīng)用到 AWS 中的獨立軟件供應(yīng)商 (ISV)。
最安全
AWS 旨在成為當今市場上最靈活、最安全的云計算環(huán)境。我們的核心基礎(chǔ)設(shè)施是為了滿足軍事、全球的銀行和其他高度敏感性組織的安全要求而構(gòu)建。一組深度云安全工具對此提供支持,其中包括超過 300 項安全、合規(guī)性和監(jiān)管服務(wù)及功能,以及對 143 項安全標準和合規(guī)性認證的支持。
最快的創(chuàng)新速度
借助 AWS,您可以利用最新技術(shù)更快地進行實驗和創(chuàng)新。我們將不斷加快創(chuàng)新步伐,以發(fā)明您可用于轉(zhuǎn)變業(yè)務(wù)的全新技術(shù)。例如,在 2014 年,AWS 通過推出 AWS Lambda 在無服務(wù)器計算領(lǐng)域開創(chuàng)了先河,該平臺使開發(fā)人員無需預(yù)置或管理服務(wù)器即可運行其代碼。AWS 構(gòu)建了 Amazon SageMaker,這是一種完全托管的機器學(xué)習(xí)服務(wù),可讓日常開發(fā)人員和科學(xué)家無需任何前置經(jīng)驗即可運用機器學(xué)習(xí)。
最成熟的運營專業(yè)能力
AWS 具有無與倫比的經(jīng)驗、成熟度、可靠性、安全性和性能,您可以將其用于最重要的應(yīng)用程序。在超過 17 年的時間中,AWS 一直在為運行各種使用案例的全球數(shù)百萬客戶提供云服務(wù)。在所有云服務(wù)提供商中,AWS 擁有最豐富的大規(guī)模運營經(jīng)驗。
AWS 區(qū)域的全球網(wǎng)絡(luò)
AWS 擁有覆蓋范圍領(lǐng)先的全球云基礎(chǔ)設(shè)施。Gartner 已將 AWS 區(qū)域/可用區(qū)模型
視為一種值得推薦運行方式,適用于要求高可用性的企業(yè)應(yīng)用程序。


您按月付費,計費依據(jù)是您處理的文本的字符數(shù)量。Amazon Polly 的標準語音定價為:對于超出免費套餐的語音或語音標記請求,每 100 萬個字符 4.00 USD。Amazon Polly 的神經(jīng)語音定價為:對于超出免費套餐的語音或請求的語音標記,每 100 萬個字符 16.00 USD。Amazon Polly 的長格式語音定價為:對于超出免費套餐的語音或請求的語音標記,每 100 萬個字符 100.00 USD。 Amazon Polly 的生成式語音定價為:對于超出免費套餐的語音請求,每 100 萬個字符 30 USD。
對于 Amazon Polly 的標準語音,從您提交第一個 Polly 語音或語音標記請求起 12 個月內(nèi),針對該類請求,免費套餐每個月提供 500 萬個字符服務(wù)。對于神經(jīng)語音,從您提交第一個語音或語音標記請求起 12 個月內(nèi),針對該類請求,免費套餐每個月提供 100 萬個字符服務(wù)。對于長格式語音,從您提交第一個 Polly 語音或語音標記請求起 12 個月內(nèi),針對該類請求,免費套餐每個月提供 50 萬個字符服務(wù)。 對于生成式語音,從您提交第一個 Polly 語音請求起 12 個月內(nèi),針對該類請求,免費套餐每個月提供 10 萬字符的服務(wù)。


![]() |
![]() |
![]() |
設(shè)置并登錄您的 AWS 賬戶 | 觀看網(wǎng)絡(luò)研討會并閱讀文檔。 | 登錄 Polly 控制臺并開始構(gòu)建。 |






AWS 云計算
Amazon Web Services(AWS)是全球最全面、應(yīng)用最廣泛的云,從全球數(shù)據(jù)中心提供超過 200 項功能齊全的服務(wù)。數(shù)百萬客戶(包括增長最快速的初創(chuàng)公司、最大型企業(yè)和主要的政府機構(gòu))都在使用 AWS 來降低成本、提高敏捷性并加速創(chuàng)新。
最多的功能
從計算、存儲和數(shù)據(jù)庫等基礎(chǔ)設(shè)施技術(shù),到機器學(xué)習(xí)、人工智能、數(shù)據(jù)湖和分析以及物聯(lián)網(wǎng)等新興技術(shù),AWS 提供的服務(wù)以及其中的功能比其他任何云服務(wù)提供商的都要多得多。這使得將現(xiàn)有應(yīng)用程序遷移到云中并構(gòu)建您可以想象的幾乎任何東西都變得更快、更容易且更具成本效益。
AWS 的這些服務(wù)還具有最為多樣復(fù)雜的功能。例如,AWS 提供了種類繁多的數(shù)據(jù)庫,這些數(shù)據(jù)庫是為不同類型的應(yīng)用程序?qū)iT構(gòu)建的,因此您可以選擇適合作業(yè)的工具來獲得最佳的成本和性能。
最大的客戶和合作伙伴社區(qū)
AWS 擁有最大且最具活力的社區(qū),在全球擁有數(shù)百萬活躍客戶和成千上萬個合作伙伴。幾乎所有行業(yè)和規(guī)模的客戶(包括初創(chuàng)公司、企業(yè)和公共部門組織)都在 AWS 上運行所有可能的使用案例。AWS 合作伙伴網(wǎng)絡(luò) (APN) 包括專注于 AWS 服務(wù)的數(shù)千個系統(tǒng)集成商和成千上萬個將其技術(shù)應(yīng)用到 AWS 中的獨立軟件供應(yīng)商 (ISV)。
最安全
AWS 旨在成為當今市場上最靈活、最安全的云計算環(huán)境。我們的核心基礎(chǔ)設(shè)施是為了滿足軍事、全球的銀行和其他高度敏感性組織的安全要求而構(gòu)建。一組深度云安全工具對此提供支持,其中包括超過 300 項安全、合規(guī)性和監(jiān)管服務(wù)及功能,以及對 143 項安全標準和合規(guī)性認證的支持。
最快的創(chuàng)新速度
借助 AWS,您可以利用最新技術(shù)更快地進行實驗和創(chuàng)新。我們將不斷加快創(chuàng)新步伐,以發(fā)明您可用于轉(zhuǎn)變業(yè)務(wù)的全新技術(shù)。例如,在 2014 年,AWS 通過推出 AWS Lambda 在無服務(wù)器計算領(lǐng)域開創(chuàng)了先河,該平臺使開發(fā)人員無需預(yù)置或管理服務(wù)器即可運行其代碼。AWS 構(gòu)建了 Amazon SageMaker,這是一種完全托管的機器學(xué)習(xí)服務(wù),可讓日常開發(fā)人員和科學(xué)家無需任何前置經(jīng)驗即可運用機器學(xué)習(xí)。
最成熟的運營專業(yè)能力
AWS 具有無與倫比的經(jīng)驗、成熟度、可靠性、安全性和性能,您可以將其用于最重要的應(yīng)用程序。在超過 17 年的時間中,AWS 一直在為運行各種使用案例的全球數(shù)百萬客戶提供云服務(wù)。在所有云服務(wù)提供商中,AWS 擁有最豐富的大規(guī)模運營經(jīng)驗。
AWS 區(qū)域的全球網(wǎng)絡(luò)
AWS 擁有覆蓋范圍領(lǐng)先的全球云基礎(chǔ)設(shè)施。Gartner 已將 AWS 區(qū)域/可用區(qū)模型
視為一種值得推薦運行方式,適用于要求高可用性的企業(yè)應(yīng)用程序。

