はじめに

DolphinVoice プラットフォームは、株式会社 DolphinAI 独自の音声認識、音声合成などの技術を基づいて、インタラクティブな人間と機械の対話体験を実現しています。会議の議事録、コールセンターの通話書き起こし、医療現場の音声電子記録、ライブコマースの自動音声生成など、様々なビジネスシーンにご活躍できます。

一発話認識

60秒間以内の短い音声をリアルタイム認識する特別なAPIです。コマンドコントロール、会話チャットなどの短い音声認識シーンに適しています。

リアルタイム音声認識

長さ無制限の音声ストリームをリアルタイムで認識し、「言いながら文字も同時出力」効果を実現します。お集まりの講演会、動画ライブショーなどの長時間連続のリアル音声認識シーンに適しています。

録音ファイルの書き起こし(通常版)

ユーザー様がアップロードする音声・ビデオファイルをバッチ処理でテキスト結果を返します。1時間のオーディオファイル、`平均15分`で結果を返す。会議の事後議事録や動画字幕生成などに適しています。

録音ファイルの書き起こし(急速版)

ユーザー様がアップロードする音声・ビデオファイルをバッチ処理でテキスト結果を返します。1時間のオーディオファイル、`平均5分`で結果を返す。会議の事後議事録や動画字幕生成などに適しています。

短いテキストの音声合成

テキストを音声データに変換するサービスで、音声合成分野における画期的なエンドツーエンドの合成技術を採用し、高忠実度かつパーソナライズされた音声を提供します。音声・動画制作や音声読み上げなどのシーンに適しています。

製品の料金体系

Cloud API サービス

AI機能請求単位単価月無料枠
リアルタイム音声認識(ログ保存あり)0.0250円/秒600分(各分野ごと)
リアルタイム音声認識(ログ保存なし)0.0375円/秒なし
録音ファイル書き起こし(通常版・ログ保存あり)0.0150円/秒600分(各分野ごと)
録音ファイル書き起こし(通常版・ログ保存なし)0.0225円/秒なし
録音ファイル書き起こし(急速版・ログ保存あり)0.0200円/秒600分(各分野ごと)
録音ファイル書き起こし(急速版・ログ保存なし)秒  0.0300円/秒なし
  • 音声データ「ログ保存なし」の場合、音声データや認識テキスト結果はサーバーに保存されません。音声データ「ログ保存あり」の場合、保存された音声は弊社製品・サービスの研究開発・品質向上のみにご活用されます。
  • 合計認識時間数の従量課金(秒単位で切り捨て、例えば、呼び出し時間が4.8秒の場合、4秒と記録します)。
  • ステレオの二チャンネル音声ファイルの認識であれば、チャンネルごと時間数の合計で料金を請求します。つまり、チャンネル数×音声の長さで課金します。
言語請求単位単価月無料枠
日本語文字数25円/万文字1万文字
英語文字数6円/万文字1万文字
中国語文字数20円/万文字1万文字

オフラインサービス・オンプレミス

お問い合わせください。