跳至主要內容
Open In ColabOpen on GitHub

Google Cloud 文字轉語音

Google Cloud 文字轉語音 使開發人員能夠合成自然發聲的語音,具有 100 多種聲音,並提供多種語言和變體。它應用 DeepMind 在 WaveNet 中的突破性研究和 Google 強大的神經網路,以提供最高的逼真度。

它支援多種語言,包括英語、德語、波蘭語、西班牙語、義大利語、法語、葡萄牙語和印地語。

本筆記本展示如何與 Google Cloud Text-to-Speech API 互動以實現語音合成功能。

首先,您需要設定一個 Google Cloud 專案。您可以按照此處的說明進行操作。

!pip install --upgrade langchain-google-community[texttospeech]

例項化

from langchain_google_community import TextToSpeechTool
API 參考:TextToSpeechTool

已棄用的 GoogleCloudTextToSpeechTool

from langchain_community.tools import GoogleCloudTextToSpeechTool
text_to_speak = "Hello world!"

tts = GoogleCloudTextToSpeechTool()
tts.name

我們可以產生音訊,將其儲存到臨時檔案,然後播放。

speech_file = tts.run(text_to_speak)

此頁面是否對您有幫助?