Cloud API On Device On-Prem (Eng. Edition)

更新とお知らせ

本文は DolphinVoice プラットフォームの製品機能の最新情報と関連ドキュメントについて紹介します。

20251218

機能種類	機能名	機能説明	更新説明
音声認識	単語関連	1. 単語の登録および編集はクラスコードの使用をサポートしています。	追加
DolphinVoice	ユーザーパネル	1. GoogleとGitHubでのログインをサポートします。	追加

20251106

機能種類	機能名	機能説明	更新説明
音声認識	リアルタイム音声認識	1. 話者ダイアライゼーションを有効にする際の `TranscriptionStarted` イベントの返却遅延を最適化します。	最適化
音声認識	録音ファイルの書き起こし（通常版 & 急速版）	1. 言い淀みフィルター機能の最適化：テキストスムージングが追加されました。 2. スピードの改善。	追加最適化

20250918

機能種類	機能名	機能説明	更新説明
音声認識	録音ファイルの書き起こし（通常版 & 急速版）	1. ステレオのファイルにもVAD処理を行います。	最適化
DolphinVoice	ユーザーパネル	1. プロジェクト名と説明は、プロジェクトが作成された後に変更できます。	追加

20250814

機能種類	機能名	機能説明	更新説明
音声認識	単語関連	1. 単語を登録する際に、単語辞書のIDをカスタマイズできる。 2. 日本語の単語効果を最適化する。	追加最適化

20250701

機能種類	機能名	機能説明	更新説明
音声認識	一発話認識リアルタイム音声認識	1. 単語情報の信頼度の返却機能を新たに追加する。	追加

20250627

機能種類	機能名	機能説明	更新説明
音声認識	リアルタイム音声認識	1. リアルタイム音声認識の話者識別機能を新たに追加する。	追加

20250618

機能種類	機能名	機能説明	更新説明
音声認識	一発話認識リアルタイム音声認識	1. 言い淀みフィルターのルールを最適化する。 2. 日本語の分詞効果を最適化する。 3. API に読み方と動的な文節区切りパラーメータを追加する。	最適化追加
音声認識	録音ファイルの書き起こし（通常版 & 急速版）	1. 言い淀みフィルターのルールを最適化する。 2. 日本語の分詞効果を最適化する。 3. 録音ファイルの転写における分割ロジックを最適化する。	最適化

20250606

機能種類	機能名	機能説明	更新説明
音声認識	全般	1. 単語辞書がサポートする単語数の上限を調整する。	最適化

20250424

機能種類	機能名	機能説明	更新説明
音声認識	一発話認識	1. 一発話認識の最大音声の長さを調整するため、インターフェースパラメータを追加する。	追加

20250408

機能種類	機能名	機能説明	更新説明
音声認識	短いテキストの音声合成	1. 短いテキストの音声合成機能のリリース。	初期リリース

20250226

機能種類	機能名	機能説明	更新説明
音声認識	一発話認識リアルタイム音声認識録音ファイルの書き起こし（通常版 & 急速版）	1. 一度限り有効な単語機能の追加。 2. 一部パラメータのデフォルト値の変更。	追加最適化
音声認識	単語関連	1. 単語の作成、削除、変更、照会、ダウンロード用のAPIの追加。 2. 日語および日英混合の言語において、単語は単語セットという形式で設定されます。単語セットの構成は「表記、読み、クラス」となります。	追加最適化
DolphinVoice	ユーザーパネル	1. 単語登録プロセスを最適化し、手動入力およびファイルアップロードの２つの登録方法をサポートします。 2. 単語関連APIアドレスの表示を追加。	最適化

20250121

機能種類	機能名	機能説明	更新説明
音声認識	一発話認識	1. HTTP インターフェースに単語情報を追加。	追加
音声認識	録音ファイルの書き起こし（通常版 & 急速版）	1. オーディオの時間制限を５時間に変更。 2. オーディオのサイズ上限を１GB に変更。	最適化
DolphinVoice	全般	1. 充実したホームページ体験デモ機能。 2. アカウント登録体験の最適化。	最適化

20241226

機能種類	機能名	機能説明	更新説明
音声認識	一発話認識	1. 信頼回復を高める。 2. ロジックの一部を最適化する。	最適化
音声認識	リアルタイム音声認識録音ファイルの書き起こし（通常版 & 急速版）	1. 信頼回復を高める。	最適化

20241127

機能種類	機能名	機能説明	更新説明
音声認識	一発話認識リアルタイム音声認識	1. 日本語、日英混合言語をサポートするNGワード設定。 2. 日英混合モデルの更新。	最適化
音声認識	録音ファイルの書き起こし	1. 音声ファイル書き起こしサービスを通常版と急速版に分割。 2. サービスパフォーマンスの最適化。 3. 日英混合モデルの更新。	最適化
DolphinVoice	ユーザーパネル	1. 英語バージョンを追加。	追加

20240926

機能種類	機能名	機能説明	更新説明
音声認識	一発話認識リアルタイム音声認識	1. 日本語・日英混合・中英混合のモデルを更新し、認識効果を最適化。 2. ８kHz 音声の認識に対応。	最適化追加
音声認識	録音ファイルの書き起こし	1. 日本語・日英混合・中英混合のモデルを更新し、認識効果を最適化。	最適化

20240806

機能種類	機能名	機能説明	更新説明
音声認識	一発話認識	1. 最大６０秒間の一回発話音声をテキストに変換します。	初期リリース
	リアルタイム音声認識	1. 音声ストリームをリアルタイムで認識し、認識すると同時にテキストの結果を返します。	初期リリース
	録音ファイルの書き起こし	1. 音声ファイルをバッチ処理でテキストに変換し、テキストの結果を返します。１時間の音声ファイルは１５分以内に認識を完了し、結果を返します。	初期リリース

はじめに

DolphinVoice プラットフォームは、株式会社 DolphinAI 独自の音声認識、音声合成などの技術を基づいて、インタラクティブな人間と機械の対話体験を実現しています。会議の議事録、コールセンターの通話書き起こし、医療現場の音声電子記録、ライブコマースの自動音声生成など、様々なビジネスシーンにご活躍できます。

はじめに

次ページ

目次