【2023年最新版】OpenAIのText to Speech APIで日本語テキストを読み上げる

OpenAIのText to Speech APIで日本語テキストを読み上げる

POSTED BY
2023-12-16

MacOSにはPythonが最初から入っているので、Python版を使ってみる。

which python3
/usr/bin/python3

python3 -V
Python 3.9.6

which pip3
/usr/bin/pip3

OpenAIライブラリのインストール

pip3 install openai

OpenAIサイトでAPIの使用契約(クレジットカード登録)は済ませているものとする。

https://platform.openai.com/api-keys

APIキーを確認して環境変数にセットする。ここでは.profileや.bashrcにセキュア設定ファイル.bash_securesを読み込ませるようにしている。

cat >> .bash_secures
export OPENAI_API_KEY="YOUR-OPENAI-API-KEY"

chmod go-rwx .bash_secures

if [ -f "$HOME/.bash_secures" ]; then
  . "$HOME/.bash_secures"
fi

まずは公式サンプルをそのまま実行してみる。tts.pyというファイル名で保存するとする。

from pathlib import Path
from openai import OpenAI
client = OpenAI()

speech_file_path = Path(__file__).parent / "speech.mp3"
response = client.audio.speech.create(
  model="tts-1",
  voice="alloy",
  input="Today is a wonderful day to build something people love!"
)

response.stream_to_file(speech_file_path)

実行

pytyon3 tts.py

エラーが無ければspeech.mp3というファイルができるので、これをダブルクリックして読み上げ再生確認。inputを「あいうえおかきくけこ」と日本語に変更しても、ちゃんと読んだ。

https://platform.openai.com/docs/api-reference/audio/createSpeech

に、詳しいAPI仕様がある。これによると、入力テキストは4096文字までで、声優モデルはalloy, echo, fable, onyx, nova, and shimmerが設定できる。

日本語もちゃんと読むのだが、やはり上記全員アメリカ人とあって、読み上げが全部結婚式で誓わせるエセ神父っぽくなるのは仕方ないか。

【次の記事】Gmailでメールの振り分け（受信トレイ以外に置く）

【前の記事】【C++】std::bitsetでデータを2進数形式で表示し任意のビットがONかも調べる

Android 　iPhone/iPad 　Flutter 　MacOS 　Windows 　Debian 　Ubuntu 　CentOS 　FreeBSD 　RaspberryPI 　HTML/CSS 　C/C++ 　PHP 　Java 　JavaScript 　Node.js 　Swift 　Python 　MatLab 　Amazon/AWS 　CORESERVER 　Google 　仮想通貨　 LINE 　OpenAI/ChatGPT 　IBM Watson 　Microsoft Azure 　Xcode 　VMware 　MySQL 　PostgreSQL 　Redis 　Groonga 　Git/GitHub 　Apache 　nginx 　Postfix 　SendGrid 　Hackintosh 　Hardware 　Fate/Grand Order 　ウマ娘　将棋　ドラレコ

【WEBMASTER/管理人】

自営業プログラマーです。お仕事ください！
ご連絡は以下アドレスまでお願いします★

【キーワード検索】

【最近の記事】【全部の記事】

nohupで常時起動したPythonスクリプトがログを出力しない場合
Intel Macbook2020にBootCampで入れたWindows11 Pro 23H2のBluetoothを復活させる
Windowsのデスクトップ画面をそのまま配信するための下準備
WindowsでGPUの状態を確認するには(ASUS系監視ソフトの自動起動を停止する)
CORESERVER v1プランからさくらインターネットスタンダートプランへ引っ越しメモ
さくらインターネットでPython MecabをCGIから使う
さくらインターネットのPHPでAnalytics-G4 APIを使う
インクルードパスの調べ方
【Git】特定ファイルを除外する.gitignore
【Ubuntu/Debian】NVIDIA関係のドライバを自動アップデートさせない

【カテゴリーリンク】