はじめに

DolphinVoice プラットフォームは、株式会社 DolphinAI 独自の音声認識、音声合成などの技術を基づいて、インタラクティブな人間と機械の対話体験を実現しています。会議の議事録、コールセンターの通話書き起こし、医療現場の音声電子記録、ライブコマースの自動音声生成など、様々なビジネスシーンにご活躍できます。

リアルタイム音声認識

音声ストリームをリアルタイムで認識し、「言いながら文字も同時出力」効果を実現します。お集まりの講演会、動画ライブショーなどの長時間連続のリアル音声認識シーンに適しています。

録音ファイルの書き起こし（急速版）

ユーザー様がアップロードする音声・ビデオファイルをバッチ処理でテキスト結果を返します。1時間のオーディオファイル、最短2分で結果を返す。会議の事後議事録や動画字幕生成などに適しています。

録音ファイルの書き起こし（通常版）

ユーザー様がアップロードする音声・ビデオファイルをバッチ処理でテキスト結果を返します。1時間のオーディオファイル、最短10分で結果を返す。会議の事後議事録や動画字幕生成などに適しています。

一発話認識

60秒間以内の短い音声を認識する特別なAPIです。コマンドコントロール、会話チャットなどの短い音声認識シーンに適しています。

短いテキストの音声合成

テキストを音声データに変換するサービスで、音声合成分野における画期的なエンドツーエンドの合成技術を採用し、高忠実度かつパーソナライズされた音声を提供します。音声・動画制作や音声読み上げなどのシーンに適しています。

製品の料金体系

Cloud API サービス

AI機能	請求単位	単価	月無料枠
リアルタイム音声認識・一発話認識（日本語・英語・中国語）	秒	0.020円/秒	600分（各分野ごと）最大3600分
録音ファイル書き起こし（通常版/日本語・英語・中国語）	秒	0.010円/秒	600分（各分野ごと）最大3600分
録音ファイル書き起こし（急速版/日本語・英語・中国語）	秒	0.020円/秒	600分（各分野ごと）最大3600分

すべての価格は日本円（税込）です。
合計認識時間数の従量課金（秒単位で切り捨て、例えば、呼び出し時間が4.8秒の場合、4秒と記録します）。
ステレオの二チャンネル音声ファイルの認識であれば、チャンネルごと時間数の合計で料金を請求します。つまり、チャンネル数×音声の長さで課金します。

言語	請求単位	単価	月無料枠
日本語	文字数	25円/万文字	1万文字
英語	文字数	6円/万文字	1万文字
中国語	文字数	20円/万文字	1万文字

すべての価格は日本円（税込）です。

オフラインサービス・オンプレミス

お問い合わせください。