Logo
短いテキストの音声合成

H5/JS SDK

1. ブラウザ互換性

オペレーティングシステム対応ブラウザの最低バージョン
chromeFirefox
Windows 741.0.2272.7646
Windows 10/1143.0.2357.8146
MAC OS43.0.2357.8146

2. 導入

<!-- 【1.1】ストリーミングプレーヤーのファイルを導入する -->
<script type="text/javascript" src="static/pcm-player.js"></script>

<!-- 【1.2】SDKのコアファイルを導入する -->
<script type="text/javascript" src="sdk/TtsSDK.min.js"></script>

注意:

音声ストリームの再生。 音声ストリームの再生には、pcm-player プラグインを使用することができますが、他の方法でも構いません。あくまで参考としてご利用ください。

3. パラメータの配置

3.1 エンジンパラーメータ

(1)パラメータのインスタンス

  • app_id と secretの設定

  • app_id と secretを取得するために、営業担当にご連絡ください。

  • signature と timestamp

    • ユーザーはインターフェースを呼出して、 timestamp と signatureを取得します。
  • 合成パラメータの設定

    • JSON を通して、 payload フィールドに合成パラメータを設定します。
    • パラーメータが不足している場合や、値が範囲を超えている場合、 onError コールバックでエラーコード及びエラーメッセージが返されます。
パラーメータタイプ必須かどうか説明デフォルト値
textStringはい合成音声のテキストの長さの制限は、1024バイト(UTF-8エンコード)です。必須
formatStringいいえ音声エンコードの形式は、wav / pcm / mp3で、デフォルト形式はpcmです。pcm
sample_rateIntegerいいえ音声のサンプリングレートは、デフォルト値は 24000ですが、8000も16000も選択できる。24000
lang_typeStringはい言語のオプション必須
voiceStringいいえボイスのオプション日本語Yuko
英語Julie
中国語Xiaohui
emotionStringいいえ感情・スタイルなし
volumeFloatいいえ音量、範囲は [0.1, 3]で、デフォルト値は1で、通常は小数点以下1桁で十分です。1
speech_rateFloatいいえ話速、範囲は [0.2, 3]で、デフォルト値は1で、通常は小数点以下1桁で十分です。1
pitch_rateFloatいいえピッチ、範囲は [0.1,3.0]で、デフォルト値は1で、通常は小数点以下1桁で十分です。1
silence_durationIntegerいいえ文末の無音時間、単位はms,デフォルト値は125です125
enable_timestampBooleanいいえ是否开启返回时间戳功能false

例 (方法1、おすすめ):バックエンドから timestamp、signatureを取得します。

new TTSEngine({
  app_id: '',
  signature : '',
  timestamp : 1234567890,
  payload: {
    text: '',
    format: '',
    sample_rate: 24000,
    lang_type: '',
    voice: '',
    emotion: '',
    volume: 1,
    speech_rate: 1,
    pitch_rate: 1,
    silence_duration: 125,
    enable_timestamp: false,
  }
})

例 (方法2,不安全): secret をプロジェクトエンドに記述し、 signatureでフロントエンド側で生成します。

new TTSEngine ({
  app_id: '',
  secret : '',
  payload: {
    text: '',
    format: '',
    sample_rate: 24000,
    lang_type: '',
    voice: '',
    emotion: '',
    volume: 1,
    speech_rate: 1,
    pitch_rate: 1,
    silence_duration: 125,
    enable_timestamp: false,
  }
})

3.2 初期化方法

(1)パラーメータの配置

名前タイプ説明デフォルト値
engineFirstInitDoneFunction初期化成功時のコールバック方法なし
engineFirstInitFailFunction初期化失敗時のコールバック方法なし

(2)パラメータのインスタンス

new TTSEngine ({
  engineFirstInitDone : function () {},
  engineFirstInitFail : function (status,msg) {} 
})

3.3 合成結果の返却

(1) パラーメータの配置

名前タイプ説明デフォルト値
onTimestampFunctionエンジンが返すタイムスタンプ情報なし
onDurationFunctionエンジンが返す合成音声の長さなし
onResultFunctionエンジンが返す合成されたバイナリデータのコールバックなし
onCompletedFunctionエンジンが返す合成されたtask_idの情報なし
onWarningFunctionエンジンからの警告結果のコールバックメソッドなし
onErrorFunctionエンジンからのエラー結果のコールバックメソッドなし

(2) パラメータのインスタンス

new TTSEngine ({
  onTimestamp : function (taskId, payload) {},
  onDuration : function (taskId, payload) {},
  onResult : function (data) {},
  onCompleted : function (taskId) {},
  onWarning : function (status, msg, taskId) {},
  onError : function (status, msg, taskId) {}
})

3.4 ネットワーク

(1)パラーメータの配置

名前タイプ説明デフォルト値
onNetworkErrorFunctionネットワーク監視用のコールバック

(2)パラーメータのインスタンス

new TTSEngine ({ 
  onNetworkError : function (status, msg) {},
})

4. メソッド呼出し

startSynthesis()

機能:音声合成を開始します。

cancelSynthesis()

機能:音声合成をキャンセルします。

destroySynthesis()

機能:音声合成インスタンスを破棄します。

5. SDKダウンロード

H5 SDK