
目次
記事の要約
- エーアイスクエアが生成要約サービス「QuickSummary2.0」の音声ファイルアップロード機能を追加
- PBXや通話録音システムとの連携不要で音声認識と要約が可能に
- wav、mp3、opus、ogg形式の音声ファイル(250MBまで)に対応
生成要約サービス「QuickSummary2.0」に音声ファイルアップロード機能追加
株式会社エーアイスクエアは2025年5月14日、生成要約サービス「QuickSummary2.0」に音声ファイルのアップロード機能を追加したことを発表した。これにより、利用中のPBXや通話録音システムとの連携なしに、音声ファイルからの文字起こし、要約が可能になったのだ。
「QuickSummary2.0」は2023年6月のリリース以降、多くのコンタクトセンターで導入され、業務効率化に貢献している。従来はシステム連携が必須だったが、今回のアップデートでより手軽に音声認識と要約を利用できるようになった。音声認識には、OpenAIの「Whisper」をカスタマイズした「AI2ASR」を採用している。
対応ファイル形式はwav、mp3、opus、oggで、ファイルサイズは250MBまでだ。ステレオ形式の音声ファイルであれば、顧客とオペレーターの発言を区別して文字起こしを行うことも可能である。この新機能によって、より多くの企業が「QuickSummary2.0」を活用し、業務効率化を図ることが期待される。
「QuickSummary2.0」の新機能と仕様
項目 | 詳細 |
---|---|
サービス名 | QuickSummary2.0 |
新機能 | 音声ファイルアップロード機能 |
対応ファイル形式 | wav、mp3、opus、ogg |
ファイルサイズ上限 | 250MB |
音声認識サービス | AI2ASR(OpenAIのWhisperをカスタマイズ) |
ステレオ音声対応 | 顧客とオペレーターの発言識別 |
AI2ASRについて
AI2ASRは、エーアイスクエアが提供する音声認識サービスだ。OpenAIが提供する「Whisper」をコンタクトセンター向けにカスタマイズしており、90%を超える高い認識精度と低コストを両立している。
- 高い認識精度
- 低コスト
- 専門用語辞書による誤変換補正
Whisperは68万時間分の教師データで学習されているため、高い精度でテキスト化が可能だ。さらに、専門用語辞書を用いた独自の誤変換補正機能により、Whisper単独ではカバーできない専門用語にも対応できる。
QuickSummary2.0の音声ファイルアップロード機能に関する考察
音声ファイルのアップロード機能追加は、QuickSummary2.0の利便性を大幅に向上させる大きな一歩だ。PBXとの連携が不要になったことで、導入障壁が低くなり、中小企業を含む幅広いユーザーへの普及が期待できる。しかし、ファイルサイズ制限や対応ファイル形式の制限など、今後の改善余地も残されているだろう。
今後起こりうる問題としては、大量の音声ファイルアップロードによるサーバー負荷の増加や、音声データのセキュリティ対策が挙げられる。これらの問題への対策として、サーバー増強や高度なセキュリティ技術の導入が必要となるだろう。また、対応ファイル形式の拡大やファイルサイズ制限の緩和も検討すべきだ。
今後追加してほしい機能としては、複数ファイルの一括アップロード機能や、音声ファイルの自動分割機能などが考えられる。これにより、より効率的な音声データ処理が可能になるだろう。さらに、多言語対応や、より高度な音声認識技術の導入も期待したい。
参考サイト/関連サイト
- PR TIMES.「生成要約サービス「QuickSummary2.0」に音声ファイルアップロード機能が追加 | 株式会社エーアイスクエアのプレスリリース」.https://prtimes.jp/main/html/rd/p/000000030.000062562.html, (参照 2025-05-15).