Google Cloud 文字轉語音
Google Cloud 文字轉語音 使開發人員能夠合成自然發聲的語音,具有 100 多種聲音,並提供多種語言和變體。它應用 DeepMind 在 WaveNet 中的突破性研究和 Google 強大的神經網路,以提供最高的逼真度。
它支援多種語言,包括英語、德語、波蘭語、西班牙語、義大利語、法語、葡萄牙語和印地語。
本筆記本展示如何與 Google Cloud Text-to-Speech API
互動以實現語音合成功能。
首先,您需要設定一個 Google Cloud 專案。您可以按照此處的說明進行操作。
!pip install --upgrade langchain-google-community[texttospeech]
例項化
from langchain_google_community import TextToSpeechTool
API 參考:TextToSpeechTool
已棄用的 GoogleCloudTextToSpeechTool
from langchain_community.tools import GoogleCloudTextToSpeechTool
API 參考:GoogleCloudTextToSpeechTool
text_to_speak = "Hello world!"
tts = GoogleCloudTextToSpeechTool()
tts.name
我們可以產生音訊,將其儲存到臨時檔案,然後播放。
speech_file = tts.run(text_to_speak)