開発ガイド
基本知識
基本用語
言語
音声合成サービスは複数の言語をサポートしており、リクエストでテキストの言語を指定できます。現在、プラットフォームは日本語、英語、中国語の3種類の合成言語をサポートしています。
ボイス
現在、音声合成サービスは異なる言語の複数のボイスをサポートしています。サポートされているボイスについては、以下の「言語とボイスのサポート」をご覧ください。
サンプリングレート(sample rate)
音声のサンプリングレートとは、録音デバイスが1秒間内に音声信号をサンプリングする回数を指します。サンプリングレートが高いほど、音声の再現がより真実かつ自然になります。合成音声のサンプリングレートを指定することができます。現在、音声合成サービスは8000Hz、16000Hz、24000Hzのサンプリングレートの音声をサポートしています。
音声エンコーディング(format)
pcm/wav/mp3の形式をサポートしています。注意:wav はストリーミングをサポートしていません。
実用機能
ボイスの選択
様々なシーンでの合成ニーズを満たすため、多言語、多ボイスを提供します。ボイスの詳細については、以下の「ボイスリスト」をご参照ください。
話速の調整
話速のカスタマイズをサポートしており、通常の話速よりも最大4倍速くまたは遅くすることができます。
ピッチの調整
合成音声のピッチを設定することをサポートしており、デフォルトの出力よりも最大20半音高くまたは低くすることができます。
音量の調整
合成音声の音量を調整することをサポートしており、出力音量を最大16db、最小-96dbまで設定できます。
感情・スタイルの選択
ボイスの感情・スタイルを調整することをサポートしており、喜び、カスタマーサービスなどを含みます。感情・スタイルの詳細については、以下の「感情・スタイル設定」をご参照ください。
言語とボイスのサポート
言語コードは language-variant-script-region の形式を採用します。
- language:言語(ISO 639-1)、すべては小文字、例えば、中国語は zh、英語は enです。
- variant(オプション):発音または方言(ISO 639-3)、すべては小文字、例えば、普通話は cmn、広東語はyueです。
- script(オプション):スクリプト(ISO 15924)、頭文字は大文字、例えば、簡体字はHans、繁体字はHantです。
- region:言語の使用地域(ISO 3166)、すべては大文字、例えば、中国本土はCN、香港はHK、アメリカはUSです。
音声合成サービスは現在、以下の言語とボイスをサポートしています。
ボイスリスト
注意:以下の中国語ボイスは中国語および中英混合の音声をサポートしています。英語のみの使用を想定する場合は、英語ボイスを使用することをお勧めします。
| 言語 | 言語コード | 場面 | ボイス名 | ボイスコード | 説明 | 感情・スタイル設定 |
|---|---|---|---|---|---|---|
| 日本語 | ja-JP | 汎用シーン | 優子 | Yuko | 汎用的な女の声 | |
| 日本語 | ja-JP | 汎用シーン | 紀香 | Norika | 汎用的な女の声 | |
| 日本語 | ja-JP | 汎用シーン | 陽介 | Yosuke | 汎用的な男の声 | |
| アメリカ英語 | en-US | 汎用シーン | ジュリー | Julie | 元気な女の声 | |
| アメリカ英語 | en-US | 汎用シーン | ジョン | John | 元気な男の声 | |
| 中国語(普通話) | zh-cmn-Hans-CN | 汎用シーン | 暁恵 | Xiaohui | 汎用的な女の声 | サポートする |
| 中国語(普通話) | zh-cmn-Hans-CN | 汎用シーン | 若萱 | Ruoxuan | 汎用的な女の声 | サポートする |
| 中国語(普通話) | zh-cmn-Hans-CN | 汎用シーン | 思越 | Siyue | 汎用的な男の声 | |
| 中国語(普通話) | zh-cmn-Hans-CN | 音声読み上げ | 明誠 | Mingcheng | 汎用的な男の声 | サポートする |
| 中国語(普通話) | zh-cmn-Hans-CN | 音声読み上げ | 浩軒 | Haoxuan | 汎用的な男の声 | サポートする |
| 中国語(普通話) | zh-cmn-Hans-CN | 音声読み上げ | 思達 | Sida | 優しい男の声 | サポートする |
| 中国語(普通話) | zh-cmn-Hans-CN | 音声読み上げ | 子逸 | Ziyi | 優しい男の声 | サポートする |
| 中国語(普通話) | zh-cmn-Hans-CN | 音声読み上げ | 子揚 | Ziyang | 古風な男の声 | サポートする |
| 中国語(普通話) | zh-cmn-Hans-CN | スマートアシスタント | 暁悦 | Xiaoyue | 古風な女の声 | |
| 中国語(普通話) | zh-cmn-Hans-CN | スマートアシスタント | 浩宇 | Haoyu | 元気な男の声 | |
| 中国語(普通話) | zh-cmn-Hans-CN | スマートアシスタント | 夢琪 | Mengqi | 元気な女の声 | |
| 中国語(普通話) | zh-cmn-Hans-CN | 特色あるボイス | 童童 | Tongtong | 可愛い児童(男)の声 | |
| 中国語(普通話) | zh-cmn-Hans-CN | 特色あるボイス | 慧雅 | Huiya | 優しい女の声 | |
| 中国語(普通話) | zh-cmn-Hans-CN | 特色あるボイス | 明宇 | Mingyu | 優しい男の声 |
感情・スタイル設定
感情やスタイルをサポートするボイスのみがこの機能を呼び出すことができます。
感情やスタイルは emotion を設定して呼び出す必要があり、一般的な感情は emotion を設定する必要はありません。
DolphinVoice プラットフォームは現在 11 種類の感情と 15 種類のスタイルをサポートしており、各ボイスがサポートする感情・スタイルは完全には一致しません。詳細は以下の表をご参照ください。
pleased(喜び)、sorry(お詫び)、annoyed(非難)、happy(嬉しい)、sad(悲しい)、angry(怒り)、scare(怖い)、hate(嫌悪)、surprise(驚き)、tear(泣き)、novel_dialog(静か)、customer_service(カスタマーサービス)、professional(プロ)、serious(厳粛)、narrator(ナレーション/緩和)、narrator_immersive(ナレーション/没入感)、comfort(慰めと励まし)、lovey-dovey(甘え)、conniving(腹黒い)、tsundere(ツンデレ)、charming(色っぽい)、storytelling(物語り)、radio(感情ラジオ)、yoga(ヨガ)、advertising(広告)、assistant(アシスタント)
| 言語 | ボイスコード | ボイス名 | 感情・スタイル設定 |
|---|---|---|---|
| 中国語(普通話) | Xiaohui | 暁恵 | pleased、sorry、annoyed、happy、sad、angry、scare、hate、surprise、tear、customer_service、professional、serious、comfort、lovey-dovey、conniving、tsundere、storytelling、radio、charming、yoga |
| 中国語(普通話) | Ruoxuan | 若萱 | happy、sad、angry、scare、hate、surprise、customer_service、comfort、storytelling、advertising、assistant |
| 中国語(普通話) | Mingcheng | 明誠 | happy、sad、angry、scare、hate、surprise、tear、novel_dialog、narrator、narrator_immersive |
| 中国語(普通話) | Haoxuan | 浩軒 | happy、sad、angry、scare、hate、surprise、novel_dialog、narrator |
| 中国語(普通話) | Sida | 思達 | happy、sad、angry、scare、hate、surprise、novel_dialog、narrator |
| 中国語(普通話) | Ziyi | 子逸 | happy、sad、angry、scare、hate、surprise、novel_dialog、narrator |
| 中国語(普通話) | Ziyang | 子揚 | happy、sad、angry、scare、hate、surprise、novel_dialog、narrator |
DolphinVoice