カテゴリー【OpenAI/ChatGPT、MacOS、Ubuntu】
OpenAIのText to Speech APIで日本語テキストを読み上げる
POSTED BY
2023-12-16
2023-12-16
MacOSにはPythonが最初から入っているので、Python版を使ってみる。
which python3 /usr/bin/python3 python3 -V Python 3.9.6 which pip3 /usr/bin/pip3
OpenAIライブラリのインストール
pip3 install openai
OpenAIサイトでAPIの使用契約(クレジットカード登録)は済ませているものとする。
https://platform.openai.com/api-keys
APIキーを確認して環境変数にセットする。ここでは.profileや.bashrcにセキュア設定ファイル.bash_securesを読み込ませるようにしている。
cat >> .bash_secures export OPENAI_API_KEY="YOUR-OPENAI-API-KEY" chmod go-rwx .bash_secures
if [ -f "$HOME/.bash_secures" ]; then . "$HOME/.bash_secures" fi
まずは公式サンプルをそのまま実行してみる。tts.pyというファイル名で保存するとする。
from pathlib import Path from openai import OpenAI client = OpenAI() speech_file_path = Path(__file__).parent / "speech.mp3" response = client.audio.speech.create( model="tts-1", voice="alloy", input="Today is a wonderful day to build something people love!" ) response.stream_to_file(speech_file_path)
実行
pytyon3 tts.py
エラーが無ければspeech.mp3というファイルができるので、これをダブルクリックして読み上げ再生確認。inputを「あいうえおかきくけこ」と日本語に変更しても、ちゃんと読んだ。
https://platform.openai.com/docs/api-reference/audio/createSpeech
に、詳しいAPI仕様がある。これによると、入力テキストは4096文字までで、声優モデルはalloy, echo, fable, onyx, nova, and shimmerが設定できる。
日本語もちゃんと読むのだが、やはり上記全員アメリカ人とあって、読み上げが全部結婚式で誓わせるエセ神父っぽくなるのは仕方ないか。
Android
iPhone/iPad
Flutter
MacOS
Windows
Debian
Ubuntu
CentOS
FreeBSD
RaspberryPI
HTML/CSS
C/C++
PHP
Java
JavaScript
Node.js
Swift
Python
Amazon/AWS
CORESERVER
Google
仮想通貨
LINE
OpenAI/ChatGPT
IBM Watson
Microsoft Azure
Xcode
VMware
MySQL
PostgreSQL
Redis
Groonga
Git/GitHub
Apache
nginx
Postfix
SendGrid
Hackintosh
Hardware
Fate/Grand Order
ウマ娘
将棋
ドラレコ
※本記事は当サイト管理人の個人的な備忘録です。本記事の参照又は付随ソースコード利用後にいかなる損害が発生しても当サイト及び管理人は一切責任を負いません。
※本記事内容の無断転載を禁じます。
※本記事内容の無断転載を禁じます。
【WEBMASTER/管理人】
自営業プログラマーです。お仕事ください!ご連絡は以下アドレスまでお願いします★
☆ServerNote.NETショッピング↓
ShoppingNote / Amazon.co.jp
☆お仲間ブログ↓
一人社長の不動産業務日誌
【キーワード検索】
【最近の記事】【全部の記事】
アプリにPrivacyInfoを追加しITMS-91053: Missing API declarationに対応するnvidia-smiを1秒ごとに実行してGPU使用率をモニタリング
TSUKUMOのマルチGPUパソコンWA9J-X211/XTのUbuntu Server 22.04でMYCOEIROINK作成コードを実行し音声合成モデルをトレーニングする
TSUKUMOのマルチGPUパソコンWA9J-X211/XTにUbuntu Server 22.04とCOEIROINK Engineを導入する
Python venv(仮想環境作成)でError: Command returned non-zero exit status 1のエラー対処法
【Ubuntu】プロジェクトごとに複数のPythonバージョンを使い分ける
【PHP】フォーム入力を受け取り出力する
【Ubuntu】aptでインストールしたapache2にソースコンパイルしたphpをマルチスレッドモードで組み込む
【PHP】HTMLファイルを読み込んで文字列変換して出力する
TSUKUMOのマルチGPUパソコンWA9J-X211/XTにUbuntu Server 22.04とVOICEVOX Engineを導入する
【人気の記事】【全部の記事】
進研ゼミチャレンジタッチをAndroid端末化するWindows版Google Driveが使用中と言われアンインストールできない場合
Googleファミリーリンクで子供の端末の現在地がエラーで取得できない場合
【Windows10】リモートデスクトップ間のコピー&ペーストができなくなった場合の対処法
Windows11+WSL2でUbuntuを使う【2】ブリッジ接続+固定IPの設定
Androidホームで左にスワイプすると出てくるニュース共を一切表示させない方法
【C/C++】小数点以下の切り捨て・切り上げ・四捨五入
【Apache】サーバーに同時接続可能なクライアント数を調整する
Googleスプレッドシートを編集したら自動で更新日時を入れる
【Javascript】JSON配列内にある特定要素の取得法【Node.js】
【カテゴリーリンク】
Android
iPhone/iPad
Flutter
MacOS
Windows
Debian
Ubuntu
CentOS
FreeBSD
RaspberryPI
HTML/CSS
C/C++
PHP
Java
JavaScript
Node.js
Swift
Python
Amazon/AWS
CORESERVER
Google
仮想通貨
LINE
OpenAI/ChatGPT
IBM Watson
Microsoft Azure
Xcode
VMware
MySQL
PostgreSQL
Redis
Groonga
Git/GitHub
Apache
nginx
Postfix
SendGrid
Hackintosh
Hardware
Fate/Grand Order
ウマ娘
将棋
ドラレコ