開発ガイド

基本知識

基本用語

言語

音声合成サービスは複数の言語をサポートしており、リクエストでテキストの言語を指定できます。現在、プラットフォームは日本語、英語、中国語の3種類の合成言語をサポートしています。

ボイス

現在、音声合成サービスは異なる言語の複数のボイスをサポートしています。サポートされているボイスについては、以下の「言語とボイスのサポート」をご覧ください。

サンプリングレート(sample rate)

音声のサンプリングレートとは、録音デバイスが1秒間内に音声信号をサンプリングする回数を指します。サンプリングレートが高いほど、音声の再現がより真実かつ自然になります。合成音声のサンプリングレートを指定することができます。現在、音声合成サービスは8000Hz、16000Hz、24000Hzのサンプリングレートの音声をサポートしています。

音声エンコーディング(format)

pcm/wav/mp3の形式をサポートしています。注意:wav はストリーミングをサポートしていません。

実用機能

ボイスの選択

様々なシーンでの合成ニーズを満たすため、多言語、多ボイスを提供します。ボイスの詳細については、以下の「ボイスリスト」をご参照ください。

話速の調整

話速のカスタマイズをサポートしており、通常の話速よりも最大4倍速くまたは遅くすることができます。

ピッチの調整

合成音声のピッチを設定することをサポートしており、デフォルトの出力よりも最大20半音高くまたは低くすることができます。

音量の調整

合成音声の音量を調整することをサポートしており、出力音量を最大16db、最小-96dbまで設定できます。

感情・スタイルの選択

ボイスの感情・スタイルを調整することをサポートしており、喜び、カスタマーサービスなどを含みます。感情・スタイルの詳細については、以下の「感情・スタイル設定」をご参照ください。

言語とボイスのサポート

言語コードは language-variant-script-region の形式を採用します。

  • language:言語(ISO 639-1)、すべては小文字、例えば、中国語は zh、英語は enです。
  • variant(オプション):発音または方言(ISO 639-3)、すべては小文字、例えば、普通話は cmn、広東語はyueです。
  • script(オプション):スクリプト(ISO 15924)、頭文字は大文字、例えば、簡体字はHans、繁体字はHantです。
  • region:言語の使用地域(ISO 3166)、すべては大文字、例えば、中国本土はCN、香港はHK、アメリカはUSです。

音声合成サービスは現在、以下の言語とボイスをサポートしています。

ボイスリスト

注意:以下の中国語ボイスは中国語および中英混合の音声をサポートしています。英語のみの使用を想定する場合は、英語ボイスを使用することをお勧めします。

言語言語コード場面ボイス名ボイスコード説明感情・スタイル設定
日本語ja-JP汎用シーン優子Yuko汎用的な女の声
日本語ja-JP汎用シーン紀香Norika汎用的な女の声
日本語ja-JP汎用シーン陽介Yosuke汎用的な男の声
アメリカ英語en-US汎用シーンジュリーJulie元気な女の声
アメリカ英語en-US汎用シーンジョンJohn元気な男の声
中国語(普通話)zh-cmn-Hans-CN汎用シーン暁恵Xiaohui汎用的な女の声サポートする
中国語(普通話)zh-cmn-Hans-CN汎用シーン若萱Ruoxuan汎用的な女の声サポートする
中国語(普通話)zh-cmn-Hans-CN汎用シーン思越Siyue汎用的な男の声
中国語(普通話)zh-cmn-Hans-CN音声読み上げ明誠Mingcheng汎用的な男の声サポートする
中国語(普通話)zh-cmn-Hans-CN音声読み上げ浩軒Haoxuan汎用的な男の声サポートする
中国語(普通話)zh-cmn-Hans-CN音声読み上げ思達Sida優しい男の声サポートする
中国語(普通話)zh-cmn-Hans-CN音声読み上げ子逸Ziyi優しい男の声サポートする
中国語(普通話)zh-cmn-Hans-CN音声読み上げ子揚Ziyang古風な男の声サポートする
中国語(普通話)zh-cmn-Hans-CNスマートアシスタント暁悦Xiaoyue古風な女の声
中国語(普通話)zh-cmn-Hans-CNスマートアシスタント浩宇Haoyu元気な男の声
中国語(普通話)zh-cmn-Hans-CNスマートアシスタント夢琪Mengqi元気な女の声
中国語(普通話)zh-cmn-Hans-CN特色あるボイス童童Tongtong可愛い児童(男)の声
中国語(普通話)zh-cmn-Hans-CN特色あるボイス慧雅Huiya優しい女の声
中国語(普通話)zh-cmn-Hans-CN特色あるボイス明宇Mingyu優しい男の声

感情・スタイル設定

感情やスタイルをサポートするボイスのみがこの機能を呼び出すことができます。

感情やスタイルは emotion を設定して呼び出す必要があり、一般的な感情は emotion を設定する必要はありません。

DolphinVoice プラットフォームは現在 11 種類の感情と 15 種類のスタイルをサポートしており、各ボイスがサポートする感情・スタイルは完全には一致しません。詳細は以下の表をご参照ください。

  • pleased(喜び)、sorry(お詫び)、annoyed(非難)、happy(嬉しい)、sad(悲しい)、angry(怒り)、scare(怖い)、hate(嫌悪)、surprise(驚き)、tear(泣き)、novel_dialog(静か)、customer_service(カスタマーサービス)、 professional(プロ)、serious(厳粛)、 narrator(ナレーション/緩和)、 narrator_immersive(ナレーション/没入感)、comfort(慰めと励まし)、lovey-dovey(甘え)、conniving(腹黒い)、tsundere(ツンデレ)、charming(色っぽい)、storytelling(物語り)、radio(感情ラジオ)、yoga(ヨガ)、 advertising(広告)、assistant(アシスタント)
言語ボイスコードボイス名感情・スタイル設定
中国語(普通話)Xiaohui暁恵pleased、sorry、annoyed、happy、sad、angry、scare、hate、surprise、tear、customer_service、professional、serious、comfort、lovey-dovey、conniving、tsundere、storytelling、radio、charming、yoga
中国語(普通話)Ruoxuan若萱happy、sad、angry、scare、hate、surprise、customer_service、comfort、storytelling、advertising、assistant
中国語(普通話)Mingcheng明誠happy、sad、angry、scare、hate、surprise、tear、novel_dialog、narrator、narrator_immersive
中国語(普通話)Haoxuan浩軒happy、sad、angry、scare、hate、surprise、novel_dialog、narrator
中国語(普通話)Sida思達happy、sad、angry、scare、hate、surprise、novel_dialog、narrator
中国語(普通話)Ziyi子逸happy、sad、angry、scare、hate、surprise、novel_dialog、narrator
中国語(普通話)Ziyang子揚happy、sad、angry、scare、hate、surprise、novel_dialog、narrator