Logo

更新とお知らせ

本文は DolphinVoice プラットフォームの製品機能の最新情報と関連ドキュメントについて紹介します。

20250918

機能種類機能名機能説明更新説明
音声認識録音ファイルの書き起こし
通常版 & 急速版
1. ステレオのファイルにもVAD処理を行います。最適化
DolphinVoiceユーザーパネル1. プロジェクト名と説明は、プロジェクトが作成された後に変更できます。追加

20250814

機能種類機能名機能説明更新説明
音声認識単語関連1. 単語を登録する際に、単語辞書のIDをカスタマイズできる。
2. 日本語の単語効果を最適化する。
追加
最適化

20250701

機能種類機能名機能説明更新説明
音声認識一発話認識

リアルタイム音声認識
1. 単語情報の信頼度の返却機能を新たに追加する。追加

20250627

機能種類機能名機能説明更新説明
音声認識リアルタイム音声認識1. リアルタイム音声認識の話者識別機能を新たに追加する。追加

20250618

機能種類機能名機能説明更新説明
音声認識一発話認識

リアルタイム音声認識
1. 言い淀みフィルターのルールを最適化する。
2. 日本語の分詞効果を最適化する。
3. API に読み方と動的な文節区切りパラーメータを追加する。
最適化
追加
録音ファイルの書き起こし
通常版 & 急速版
1. 言い淀みフィルターのルールを最適化する。
2. 日本語の分詞効果を最適化する。
3. 録音ファイルの転写における分割ロジックを最適化する。
最適化

20250606

機能種類機能名機能説明更新説明
音声認識全般1. 単語辞書がサポートする単語数の上限を調整する。最適化

20250424

機能種類機能名機能説明更新説明
音声認識一発話認識1. 一発話認識の最大音声の長さを調整するため、インターフェースパラメータを追加する。追加

20250408

機能種類機能名機能説明更新説明
音声認識短いテキストの音声合成1. 短いテキストの音声合成機能のリリース。初期リリース

20250226

機能種類機能名機能説明更新説明
音声認識一発話認識

リアルタイム音声認識

録音ファイルの書き起こし
通常版 & 急速版
1. 一度限り有効な単語機能の追加。
2. 一部パラメータのデフォルト値の変更。
追加
最適化
単語関連1. 単語の作成、削除、変更、照会、ダウンロード用のAPIの追加。
2. 日語および日英混合の言語において、単語は単語セットという形式で設定されます。単語セットの構成は「表記、読み、クラス」となります。
追加
最適化
DolphinVoiceユーザーパネル1. 単語登録プロセスを最適化し、手動入力およびファイルアップロードの2つの登録方法をサポートします。
2. 単語関連APIアドレスの表示を追加。
最適化

20250121

機能種類機能名機能説明更新説明
音声認識一発話認識1. HTTP インターフェースに単語情報を追加。追加
録音ファイルの書き起こし
通常版 & 急速版
1. オーディオの時間制限を5時間に変更。
2. オーディオのサイズ上限を1GB に変更。
最適化
DolphinVoice全般1. 充実したホームページ体験デモ機能。
2. アカウント登録体験の最適化。
最適化

20241226

機能種類機能名機能説明更新説明
音声認識一発話認識1. 信頼回復を高める。
2. ロジックの一部を最適化する。
最適化
リアルタイム音声認識

録音ファイルの書き起こし
通常版 & 急速版
1. 信頼回復を高める。最適化

20241127

機能種類機能名機能説明更新説明
音声認識一発話認識

リアルタイム音声認識
1. 日本語、日英混合言語をサポートするNGワード設定。
2. 日英混合モデルの更新。
最適化
録音ファイルの書き起こし1. 音声ファイル書き起こしサービスを 通常版急速版 に分割。
2. サービスパフォーマンスの最適化。
3. 日英混合モデルの更新。
最適化
DolphinVoiceユーザーパネル1. 英語バージョンを追加。追加

20240926

機能種類機能名機能説明更新説明
音声認識一発話認識

リアルタイム音声認識
1. 日本語・日英混合・中英混合のモデルを更新し、認識効果を最適化。
2. 8kHz 音声の認識に対応。
最適化
追加
録音ファイルの書き起こし1. 日本語・日英混合・中英混合のモデルを更新し、認識効果を最適化。最適化

20240806

機能種類機能名機能説明更新説明
音声認識一発話認識1. 最大60秒間の一回発話音声をテキストに変換します。初期リリース
リアルタイム音声認識1. 音声ストリームをリアルタイムで認識し、認識すると同時にテキストの結果を返します。初期リリース
録音ファイルの書き起こし1. 音声ファイルをバッチ処理でテキストに変換し、テキストの結果を返します。1時間の音声ファイルは15分以内に認識を完了し、結果を返します。初期リリース