Logo

はじめに

DolphinVoice プラットフォームは、株式会社 DolphinAI 独自の音声認識、音声合成などの技術を基づいて、インタラクティブな人間と機械の対話体験を実現しています。会議の議事録、コールセンターの通話書き起こし、医療現場の音声電子記録、ライブコマースの自動音声生成など、様々なビジネスシーンにご活躍できます。

リアルタイム音声認識

長さ無制限の音声ストリームをリアルタイムで認識し、「言いながら文字も同時出力」効果を実現します。お集まりの講演会、動画ライブショーなどの長時間連続のリアル音声認識シーンに適しています。

録音ファイルの書き起こし(急速版)

ユーザー様がアップロードする音声・ビデオファイルをバッチ処理でテキスト結果を返します。1時間のオーディオファイル、`平均5分`で結果を返す。会議の事後議事録や動画字幕生成などに適しています。

録音ファイルの書き起こし(通常版)

ユーザー様がアップロードする音声・ビデオファイルをバッチ処理でテキスト結果を返します。1時間のオーディオファイル、`平均15分`で結果を返す。会議の事後議事録や動画字幕生成などに適しています。

一発話認識

60秒間以内の短い音声をリアルタイム認識する特別なAPIです。コマンドコントロール、会話チャットなどの短い音声認識シーンに適しています。

短いテキストの音声合成

テキストを音声データに変換するサービスで、音声合成分野における画期的なエンドツーエンドの合成技術を採用し、高忠実度かつパーソナライズされた音声を提供します。音声・動画制作や音声読み上げなどのシーンに適しています。

製品の料金体系

Cloud API サービス

AI機能請求単位単価月無料枠
リアルタイム音声認識・一発話認識(日本語・英語・中国語)0.020円/秒600分(各分野ごと)
最大3600分
録音ファイル書き起こし(通常版/日本語・英語・中国語)0.010円/秒600分(各分野ごと)
最大3600分
録音ファイル書き起こし(急速版/日本語・英語・中国語)0.020円/秒600分(各分野ごと)
最大3600分
  • すべての価格は日本円(税込)です。
  • 合計認識時間数の従量課金(秒単位で切り捨て、例えば、呼び出し時間が4.8秒の場合、4秒と記録します)。
  • ステレオの二チャンネル音声ファイルの認識であれば、チャンネルごと時間数の合計で料金を請求します。つまり、チャンネル数×音声の長さで課金します。
言語請求単位単価月無料枠
日本語文字数25円/万文字1万文字
英語文字数6円/万文字1万文字
中国語文字数20円/万文字1万文字
  • すべての価格は日本円(税込)です。

オフラインサービス・オンプレミス

お問い合わせください。