![]() |
語音轉(zhuǎn)文本-Google Cloud
專用API
【更新時(shí)間: 2024.06.28】
Google Cloud語音轉(zhuǎn)文本使用功能強(qiáng)大的 API 將語音準(zhǔn)確地轉(zhuǎn)換為文本。它通過使用準(zhǔn)確的字幕轉(zhuǎn)錄您的語音來提供出色的用戶體驗(yàn)。它還通過從客戶互動(dòng)中獲取和轉(zhuǎn)錄的見解來幫助改進(jìn)您的服務(wù)。
|
瀏覽次數(shù)
107
采購人數(shù)
13
試用次數(shù)
0
收藏
×
完成
取消
×
書簽名稱
確定
|
- API詳情
- 定價(jià)
- 使用指南
- 常見 FAQ
- 關(guān)于我們
- 相關(guān)推薦


什么是Google Cloud的語音轉(zhuǎn)文本?
Google Cloud 依托 AI 技術(shù)的 API 可幫助您大規(guī)模翻譯文檔、網(wǎng)站、應(yīng)用、音頻文件、視頻等內(nèi)容,并提供出色的質(zhì)量以及企業(yè)級(jí)控制和安全性。 |
什么是Google Cloud的語音轉(zhuǎn)文本接口?
Google Cloud的語音轉(zhuǎn)文本有哪些核心功能?
1. 高級(jí)語音 AI
Speech-to-Text 可以利用 Chirp,這是 Google Cloud 的語音基礎(chǔ)模型,使用數(shù)百萬小時(shí)的音頻數(shù)據(jù)和數(shù)十億個(gè)文本句子訓(xùn)練而成。這與傳統(tǒng)語音識(shí)別技術(shù)(側(cè)重于大量特定于語言的監(jiān)督數(shù)據(jù))形成了鮮明對(duì)比。這些技術(shù)可以為用戶提高識(shí)別和轉(zhuǎn)錄能力,從而更好地理解口語和口音。
支持 125 種語言和語言變體
通過廣泛的語言支持打造全球用戶群。轉(zhuǎn)錄短音頻、長音頻甚至流式傳輸?shù)囊纛l數(shù)據(jù)。Speech-to-Text 還利用新一代通用語音模型 Chirp,為用戶提供更加準(zhǔn)確、覆蓋全球的翻譯和識(shí)別。Chirp 使用數(shù)百萬小時(shí)的音頻和 280 億個(gè)句子的文本(涵蓋 100 多種語言)的自監(jiān)督訓(xùn)練構(gòu)建而成。
2. 用于轉(zhuǎn)寫的預(yù)訓(xùn)練模型或可自定義的模型
從多種經(jīng)過訓(xùn)練的模型中進(jìn)行選擇,實(shí)現(xiàn)優(yōu)化的語音控制、電話和視頻轉(zhuǎn)錄,滿足特定領(lǐng)域的質(zhì)量要求。通過 Speech-to-Text 界面,輕松自定義、試驗(yàn)、創(chuàng)建和管理自定義資源。
3. 開箱即用的監(jiān)管和安全合規(guī)性
無需額外設(shè)置,Speech-to-Text API v2 即可幫助企業(yè)客戶滿足額外安全和監(jiān)管要求。數(shù)據(jù)駐留支持通過完全區(qū)域化的服務(wù)(該服務(wù)接入至新加坡和比利時(shí)等 Google Cloud 區(qū)域)來調(diào)用轉(zhuǎn)錄模型。借助識(shí)別器應(yīng)變性 (resourcefulness),您無需使用專用服務(wù)賬號(hào)進(jìn)行身份驗(yàn)證和授權(quán)。您可以在 Google Cloud 控制臺(tái)中輕松查看關(guān)于資源生成和轉(zhuǎn)寫的日志。Speech-to-Text API v2 為所有資源以及批量轉(zhuǎn)錄提供使用客戶管理的加密密鑰的企業(yè)級(jí)加密。
4. AI 賦能的語音識(shí)別和轉(zhuǎn)錄
Speech-to-Text 使用模型自適應(yīng)技術(shù)來提高常用字詞的準(zhǔn)確性、擴(kuò)充可用于轉(zhuǎn)錄的詞匯,并改善嘈雜音頻的轉(zhuǎn)錄效果。模型自適應(yīng)可讓用戶自定義 Speech-to-Text,使其能夠更頻繁地使用同音字詞中的某一個(gè)而非建議的其他選項(xiàng)。例如,您可以讓 Speech-to-Text 在轉(zhuǎn)錄時(shí)更多地使用“時(shí)常”而不是“時(shí)長”。
Google Cloud的語音轉(zhuǎn)文本的核心優(yōu)勢(shì)是什么?
在哪些場景會(huì)用到Google Cloud的語音轉(zhuǎn)文本?
創(chuàng)建音頻轉(zhuǎn)寫內(nèi)容 了解如何在 Cloud 控制臺(tái)中使用 Speech-to-Text API 只通過幾個(gè)步驟創(chuàng)建音頻轉(zhuǎn)寫內(nèi)容。您還可以轉(zhuǎn)錄短音頻、長音頻和流式音頻。 |
|
利用 AI 為視頻創(chuàng)建字幕 轉(zhuǎn)寫音頻和視頻以添加字幕。為現(xiàn)有內(nèi)容添加字幕,或?qū)崟r(shí)向流式傳輸內(nèi)容添加字幕。我們的視頻轉(zhuǎn)寫模型非常適合為視頻和/或有多人說話的內(nèi)容編制索引或編排字幕,該模型使用與 YouTube 視頻字幕類似的機(jī)器學(xué)習(xí)技術(shù)。本教程介紹了如何使用 Google Cloud AI 服務(wù) Speech-to-Text API 和 Translation API 為視頻添加字幕,以及提供其他語言的本地化字幕。 |
|
將 Speech-to-Text 添加到應(yīng)用 了解如何借助 Google Cloud 快速輕松地為您的應(yīng)用啟用 Speech-to-Text。此視頻介紹了如何在沒有大量機(jī)器學(xué)習(xí)模型經(jīng)驗(yàn)的情況下將 AI 添加到您的應(yīng)用。利用預(yù)訓(xùn)練的 Speech-to-Text API,您可以快速輕松地為應(yīng)用啟用 AI。 |
|
利用 Google Cloud API 處理語言、語音、文本和翻譯 在本課程中,您將使用 Speech-to-Text API 將音頻文件轉(zhuǎn)錄為文本文件,使用 Google Cloud Translation API 進(jìn)行翻譯,并使用 Natural Language AI 創(chuàng)建合成語音。 |




1. 創(chuàng)建或選擇項(xiàng)目
如需使用 Google Cloud 提供的服務(wù),您必須創(chuàng)建一個(gè)項(xiàng)目。項(xiàng)目用于組織您的所有 Google Cloud 資源。 項(xiàng)目由一組協(xié)作者、已啟用的 API(和其他資源)、監(jiān)控工具、結(jié)算信息以及身份驗(yàn)證和訪問權(quán)限控制組成。您可以創(chuàng)建一個(gè)項(xiàng)目,也可以創(chuàng)建多個(gè)項(xiàng)目,并使用這些項(xiàng)目按資源層次結(jié)構(gòu)組織 Google Cloud 資源。創(chuàng)建項(xiàng)目時(shí),請(qǐng)記下項(xiàng)目 ID。您需要此 ID 才能進(jìn)行 API 調(diào)用。 如需詳細(xì)了解項(xiàng)目,請(qǐng)參閱 Resource Manager 文檔。
2. 啟用結(jié)算功能
您必須啟用結(jié)算功能才能使用 Cloud Translation。如需詳細(xì)了解 Cloud Translation 價(jià)格,請(qǐng)參閱價(jià)格頁面。
3. 啟用 API
您必須為項(xiàng)目啟用 Cloud Translation API。如需詳細(xì)了解如何啟用 API,請(qǐng)參閱 Service Usage 文檔。
啟用 Cloud Translation API。
4. 設(shè)置用量配額
Cloud Translation 提供了配額管理系統(tǒng),可幫助您和 Google 管理服務(wù)的使用。默認(rèn)情況下,您每天可以發(fā)送的字符數(shù)沒有限制。如果您設(shè)置了預(yù)算,則建議您監(jiān)控每日使用量,并根據(jù)您計(jì)劃的支出調(diào)整配額。
如需詳細(xì)了解配額,請(qǐng)參閱配額和限制。
5. 設(shè)置身份驗(yàn)證
如果您計(jì)劃使用 Cloud Translation API,則需要設(shè)置身份驗(yàn)證。任何使用 API 的客戶端應(yīng)用都必須經(jīng)過身份驗(yàn)證,并且擁有所請(qǐng)求資源的訪問權(quán)限。如需了解詳情,請(qǐng)參閱向 Cloud Translation 進(jìn)行身份驗(yàn)證。
Identity and Access Management 角色
當(dāng)主賬號(hào)(用戶賬號(hào)、服務(wù)賬號(hào)等)調(diào)用 API 時(shí),Google Cloud 要求主賬號(hào)具有適當(dāng)?shù)臋?quán)限。您可以通過向主賬號(hào)授予角色來授予權(quán)限。如需了解詳情,請(qǐng)參閱使用 IAM 控制訪問權(quán)限。
指南詳情鏈接:https://cloud.google.com/translate/docs/setup?hl=zh-cn




為什么選擇 Google Cloud
科技發(fā)展正處于一個(gè)前所未有的時(shí)代。我們正經(jīng)歷 AI 技術(shù)所帶來的巨大變革。AI 技術(shù)開創(chuàng)了全新的方式,讓我們得以更高效地解決問題、與客戶互動(dòng)和完成工作。Google Cloud 已經(jīng)蓄勢(shì)待發(fā),隨時(shí)準(zhǔn)備幫助組織在日新月異的 AI 世界中開啟新的發(fā)展模式。
提高 AI 實(shí)力
生成式 AI 已經(jīng)成為全世界的話題焦點(diǎn)。接下來該怎么做呢? 讓組織中的每個(gè)人都學(xué)習(xí)生成式 AI 技術(shù),使用它構(gòu)建體驗(yàn)并部署生成式 AI,同時(shí)確保您的數(shù)據(jù)安全無虞。立即體驗(yàn)面向企業(yè)的生成式 AI 解決方案,開啟您的旅程。
讓數(shù)據(jù)發(fā)揮效用
將 Google 的信息方法帶入您的組織,利用其簡便性、規(guī)模、安全性和智能化助力組織發(fā)展。Google 可提供全面的數(shù)據(jù)基礎(chǔ),幫您統(tǒng)一所有工作負(fù)載并管理整個(gè)數(shù)據(jù)生命周期。借助這一解決方案,您可以在任何位置運(yùn)行數(shù)據(jù),在所有云環(huán)境和本地環(huán)境中使用數(shù)據(jù),亦可使用熱門的 SaaS 應(yīng)用訪問數(shù)據(jù)。這一解決方案依托 AI 技術(shù)構(gòu)建且專為 AI 打造,為您提供有關(guān)機(jī)器學(xué)習(xí)分析的最新工具,讓您可以對(duì)自定義基礎(chǔ)模型執(zhí)行提示和調(diào)優(yōu)操作,訓(xùn)練并部署這些模型 - 這些都與您的業(yè)務(wù)數(shù)據(jù)息息相關(guān)。 |
|
|
基礎(chǔ)架構(gòu)現(xiàn)代化改造
您已經(jīng)準(zhǔn)備好在 AI 時(shí)代一展身手,但您的云架構(gòu)能否滿足新時(shí)代的要求?Google Cloud 可幫助開發(fā)者快速、安全地構(gòu)建經(jīng)濟(jì)高效的新一代現(xiàn)代化基礎(chǔ)架構(gòu),從而滿足特定的工作負(fù)載和行業(yè)需求。它可以為您提供針對(duì) AI 優(yōu)化的基礎(chǔ)架構(gòu)、基于容器的應(yīng)用、傳統(tǒng)企業(yè)工作負(fù)載以及高性能的分布式工作負(fù)載,同時(shí)幫助您降低成本和減少碳足跡。 |
打造創(chuàng)新文化
助力各種規(guī)模的團(tuán)隊(duì)隨時(shí)隨地使用各種設(shè)備出色完成工作。Google Workspace 匯集了現(xiàn)代員工首選的協(xié)作和創(chuàng)作工具,包括 Gmail、Google Chat、Google 日歷、Google 云端硬盤、Google 文檔、Google 表格和 Google Meet。不僅如此,我們還在其中嵌入了易于使用的全新生成式 AI 功能,以幫助提高團(tuán)隊(duì)工作效率。Workspace 擁有超過 30 億的月活躍用戶,提供了全球備受歡迎的辦公和協(xié)作軟件。 |
|
|
獲享內(nèi)置安全功能
受益于 Google 提供的安全功能的用戶和組織數(shù)不勝數(shù),您也同樣可以從這些功能中受益。借助 Mandiant 提供的一線情報(bào),我們可以幫助組織實(shí)現(xiàn)信息安全轉(zhuǎn)型,讓他們了解最新的網(wǎng)絡(luò)攻擊。另外,我們還會(huì)為組織提供可檢測(cè)、調(diào)查和應(yīng)對(duì)威脅的現(xiàn)代安全運(yùn)營平臺(tái),以及從設(shè)計(jì)和根本上保證安全的基礎(chǔ)架構(gòu)平臺(tái),還有可幫助維護(hù)數(shù)字主權(quán)的各種控制措施。 |




1. 創(chuàng)建或選擇項(xiàng)目
如需使用 Google Cloud 提供的服務(wù),您必須創(chuàng)建一個(gè)項(xiàng)目。項(xiàng)目用于組織您的所有 Google Cloud 資源。 項(xiàng)目由一組協(xié)作者、已啟用的 API(和其他資源)、監(jiān)控工具、結(jié)算信息以及身份驗(yàn)證和訪問權(quán)限控制組成。您可以創(chuàng)建一個(gè)項(xiàng)目,也可以創(chuàng)建多個(gè)項(xiàng)目,并使用這些項(xiàng)目按資源層次結(jié)構(gòu)組織 Google Cloud 資源。創(chuàng)建項(xiàng)目時(shí),請(qǐng)記下項(xiàng)目 ID。您需要此 ID 才能進(jìn)行 API 調(diào)用。 如需詳細(xì)了解項(xiàng)目,請(qǐng)參閱 Resource Manager 文檔。
2. 啟用結(jié)算功能
您必須啟用結(jié)算功能才能使用 Cloud Translation。如需詳細(xì)了解 Cloud Translation 價(jià)格,請(qǐng)參閱價(jià)格頁面。
3. 啟用 API
您必須為項(xiàng)目啟用 Cloud Translation API。如需詳細(xì)了解如何啟用 API,請(qǐng)參閱 Service Usage 文檔。
啟用 Cloud Translation API。
4. 設(shè)置用量配額
Cloud Translation 提供了配額管理系統(tǒng),可幫助您和 Google 管理服務(wù)的使用。默認(rèn)情況下,您每天可以發(fā)送的字符數(shù)沒有限制。如果您設(shè)置了預(yù)算,則建議您監(jiān)控每日使用量,并根據(jù)您計(jì)劃的支出調(diào)整配額。
如需詳細(xì)了解配額,請(qǐng)參閱配額和限制。
5. 設(shè)置身份驗(yàn)證
如果您計(jì)劃使用 Cloud Translation API,則需要設(shè)置身份驗(yàn)證。任何使用 API 的客戶端應(yīng)用都必須經(jīng)過身份驗(yàn)證,并且擁有所請(qǐng)求資源的訪問權(quán)限。如需了解詳情,請(qǐng)參閱向 Cloud Translation 進(jìn)行身份驗(yàn)證。
Identity and Access Management 角色
當(dāng)主賬號(hào)(用戶賬號(hào)、服務(wù)賬號(hào)等)調(diào)用 API 時(shí),Google Cloud 要求主賬號(hào)具有適當(dāng)?shù)臋?quán)限。您可以通過向主賬號(hào)授予角色來授予權(quán)限。如需了解詳情,請(qǐng)參閱使用 IAM 控制訪問權(quán)限。
指南詳情鏈接:https://cloud.google.com/translate/docs/setup?hl=zh-cn






為什么選擇 Google Cloud
科技發(fā)展正處于一個(gè)前所未有的時(shí)代。我們正經(jīng)歷 AI 技術(shù)所帶來的巨大變革。AI 技術(shù)開創(chuàng)了全新的方式,讓我們得以更高效地解決問題、與客戶互動(dòng)和完成工作。Google Cloud 已經(jīng)蓄勢(shì)待發(fā),隨時(shí)準(zhǔn)備幫助組織在日新月異的 AI 世界中開啟新的發(fā)展模式。
提高 AI 實(shí)力
生成式 AI 已經(jīng)成為全世界的話題焦點(diǎn)。接下來該怎么做呢? 讓組織中的每個(gè)人都學(xué)習(xí)生成式 AI 技術(shù),使用它構(gòu)建體驗(yàn)并部署生成式 AI,同時(shí)確保您的數(shù)據(jù)安全無虞。立即體驗(yàn)面向企業(yè)的生成式 AI 解決方案,開啟您的旅程。
讓數(shù)據(jù)發(fā)揮效用
將 Google 的信息方法帶入您的組織,利用其簡便性、規(guī)模、安全性和智能化助力組織發(fā)展。Google 可提供全面的數(shù)據(jù)基礎(chǔ),幫您統(tǒng)一所有工作負(fù)載并管理整個(gè)數(shù)據(jù)生命周期。借助這一解決方案,您可以在任何位置運(yùn)行數(shù)據(jù),在所有云環(huán)境和本地環(huán)境中使用數(shù)據(jù),亦可使用熱門的 SaaS 應(yīng)用訪問數(shù)據(jù)。這一解決方案依托 AI 技術(shù)構(gòu)建且專為 AI 打造,為您提供有關(guān)機(jī)器學(xué)習(xí)分析的最新工具,讓您可以對(duì)自定義基礎(chǔ)模型執(zhí)行提示和調(diào)優(yōu)操作,訓(xùn)練并部署這些模型 - 這些都與您的業(yè)務(wù)數(shù)據(jù)息息相關(guān)。 |
|
|
基礎(chǔ)架構(gòu)現(xiàn)代化改造
您已經(jīng)準(zhǔn)備好在 AI 時(shí)代一展身手,但您的云架構(gòu)能否滿足新時(shí)代的要求?Google Cloud 可幫助開發(fā)者快速、安全地構(gòu)建經(jīng)濟(jì)高效的新一代現(xiàn)代化基礎(chǔ)架構(gòu),從而滿足特定的工作負(fù)載和行業(yè)需求。它可以為您提供針對(duì) AI 優(yōu)化的基礎(chǔ)架構(gòu)、基于容器的應(yīng)用、傳統(tǒng)企業(yè)工作負(fù)載以及高性能的分布式工作負(fù)載,同時(shí)幫助您降低成本和減少碳足跡。 |
打造創(chuàng)新文化
助力各種規(guī)模的團(tuán)隊(duì)隨時(shí)隨地使用各種設(shè)備出色完成工作。Google Workspace 匯集了現(xiàn)代員工首選的協(xié)作和創(chuàng)作工具,包括 Gmail、Google Chat、Google 日歷、Google 云端硬盤、Google 文檔、Google 表格和 Google Meet。不僅如此,我們還在其中嵌入了易于使用的全新生成式 AI 功能,以幫助提高團(tuán)隊(duì)工作效率。Workspace 擁有超過 30 億的月活躍用戶,提供了全球備受歡迎的辦公和協(xié)作軟件。 |
|
|
獲享內(nèi)置安全功能
受益于 Google 提供的安全功能的用戶和組織數(shù)不勝數(shù),您也同樣可以從這些功能中受益。借助 Mandiant 提供的一線情報(bào),我們可以幫助組織實(shí)現(xiàn)信息安全轉(zhuǎn)型,讓他們了解最新的網(wǎng)絡(luò)攻擊。另外,我們還會(huì)為組織提供可檢測(cè)、調(diào)查和應(yīng)對(duì)威脅的現(xiàn)代安全運(yùn)營平臺(tái),以及從設(shè)計(jì)和根本上保證安全的基礎(chǔ)架構(gòu)平臺(tái),還有可幫助維護(hù)數(shù)字主權(quán)的各種控制措施。 |