はじめに
DolphinVoice プラットフォームは、株式会社 DolphinAI 独自の音声認識、音声合成などの技術を基づいて、インタラクティブな人間と機械の対話体験を実現しています。会議の議事録、コールセンターの通話書き起こし、医療現場の音声電子記録、ライブコマースの自動音声生成など、様々なビジネスシーンにご活躍できます。
一発話認識
60秒間以内の短い音声をリアルタイム認識する特別なAPIです。コマンドコントロール、会話チャットなどの短い音声認識シーンに適しています。
リアルタイム音声認識
長さ無制限の音声ストリームをリアルタイムで認識し、「言いながら文字も同時出力」効果を実現します。お集まりの講演会、動画ライブショーなどの長時間連続のリアル音声認識シーンに適しています。
録音ファイルの書き起こし(通常版)
ユーザー様がアップロードする音声・ビデオファイルをバッチ処理でテキスト結果を返します。1時間のオーディオファイル、`平均15分`で結果を返す。会議の事後議事録や動画字幕生成などに適しています。
録音ファイルの書き起こし(急速版)
ユーザー様がアップロードする音声・ビデオファイルをバッチ処理でテキスト結果を返します。1時間のオーディオファイル、`平均5分`で結果を返す。会議の事後議事録や動画字幕生成などに適しています。
短いテキストの音声合成
テキストを音声データに変換するサービスで、音声合成分野における画期的なエンドツーエンドの合成技術を採用し、高忠実度かつパーソナライズされた音声を提供します。音声・動画制作や音声読み上げなどのシーンに適しています。
製品の料金体系
Cloud API サービス
| AI機能 | 請求単位 | 単価 | 月無料枠 |
|---|---|---|---|
| リアルタイム音声認識(ログ保存あり) | 秒 | 0.0250円/秒 | 600分(各分野ごと) |
| リアルタイム音声認識(ログ保存なし) | 秒 | 0.0375円/秒 | なし |
| 録音ファイル書き起こし(通常版・ログ保存あり) | 秒 | 0.0150円/秒 | 600分(各分野ごと) |
| 録音ファイル書き起こし(通常版・ログ保存なし) | 秒 | 0.0225円/秒 | なし |
| 録音ファイル書き起こし(急速版・ログ保存あり) | 秒 | 0.0200円/秒 | 600分(各分野ごと) |
| 録音ファイル書き起こし(急速版・ログ保存なし) | 秒 | 0.0300円/秒 | なし |
- 音声データ「ログ保存なし」の場合、音声データや認識テキスト結果はサーバーに保存されません。音声データ「ログ保存あり」の場合、保存された音声は弊社製品・サービスの研究開発・品質向上のみにご活用されます。
- 合計認識時間数の従量課金(秒単位で切り捨て、例えば、呼び出し時間が4.8秒の場合、4秒と記録します)。
- ステレオの二チャンネル音声ファイルの認識であれば、チャンネルごと時間数の合計で料金を請求します。つまり、チャンネル数×音声の長さで課金します。
| 言語 | 請求単位 | 単価 | 月無料枠 |
|---|---|---|---|
| 日本語 | 文字数 | 25円/万文字 | 1万文字 |
| 英語 | 文字数 | 6円/万文字 | 1万文字 |
| 中国語 | 文字数 | 20円/万文字 | 1万文字 |
DolphinVoice