はじめに
DolphinVoice プラットフォームは、株式会社 DolphinAI 独自の音声認識、音声合成などの技術を基づいて、インタラクティブな人間と機械の対話体験を実現しています。会議の議事録、コールセンターの通話書き起こし、医療現場の音声電子記録、ライブコマースの自動音声生成など、様々なビジネスシーンにご活躍できます。
リアルタイム音声認識
長さ無制限の音声ストリームをリアルタイムで認識し、「言いながら文字も同時出力」効果を実現します。お集まりの講演会、動画ライブショーなどの長時間連続のリアル音声認識シーンに適しています。
録音ファイルの書き起こし(急速版)
ユーザー様がアップロードする音声・ビデオファイルをバッチ処理でテキスト結果を返します。1時間のオーディオファイル、`平均5分`で結果を返す。会議の事後議事録や動画字幕生成などに適しています。
録音ファイルの書き起こし(通常版)
ユーザー様がアップロードする音声・ビデオファイルをバッチ処理でテキスト結果を返します。1時間のオーディオファイル、`平均15分`で結果を返す。会議の事後議事録や動画字幕生成などに適しています。
一発話認識
60秒間以内の短い音声をリアルタイム認識する特別なAPIです。コマンドコントロール、会話チャットなどの短い音声認識シーンに適しています。
短いテキストの音声合成
テキストを音声データに変換するサービスで、音声合成分野における画期的なエンドツーエンドの合成技術を採用し、高忠実度かつパーソナライズされた音声を提供します。音声・動画制作や音声読み上げなどのシーンに適しています。
製品の料金体系
Cloud API サービス
| AI機能 | 請求単位 | 単価 | 月無料枠 |
|---|---|---|---|
| リアルタイム音声認識・一発話認識(日本語・英語・中国語) | 秒 | 0.020円/秒 | 600分(各分野ごと) 最大3600分 |
| 録音ファイル書き起こし(通常版/日本語・英語・中国語) | 秒 | 0.010円/秒 | 600分(各分野ごと) 最大3600分 |
| 録音ファイル書き起こし(急速版/日本語・英語・中国語) | 秒 | 0.020円/秒 | 600分(各分野ごと) 最大3600分 |
- すべての価格は日本円(税込)です。
- 合計認識時間数の従量課金(秒単位で切り捨て、例えば、呼び出し時間が4.8秒の場合、4秒と記録します)。
- ステレオの二チャンネル音声ファイルの認識であれば、チャンネルごと時間数の合計で料金を請求します。つまり、チャンネル数×音声の長さで課金します。
| 言語 | 請求単位 | 単価 | 月無料枠 |
|---|---|---|---|
| 日本語 | 文字数 | 25円/万文字 | 1万文字 |
| 英語 | 文字数 | 6円/万文字 | 1万文字 |
| 中国語 | 文字数 | 20円/万文字 | 1万文字 |
- すべての価格は日本円(税込)です。