転写精度の向上

前提条件

Genesys Cloud の音声およびテキスト分析 (STA) では、音声文字変換により、音声をテキストに変換することで対話の意味を解き明かす価値が提供されます。STA により、監督者や品質管理者は対話の録音を聞く必要がなくなります。

音声の書き起こしは、さらなるインタラクション分析の基礎となります。たとえば、コンテンツ検索、トピックの発見、感情分析、共感、非専門的な行動はすべて転写分析に基づいて構築されます。 

正確な転写は有用な洞察を提供します。通話の書き起こしが不十分だと、聞き逃した話題や、誤って評価された感情を確認するために、スーパーバイザーが録音を聞く必要が生じます。精度が向上すると、すべての STA 機能が向上します。 

転写の精度を理解する

音声転写の精度は、一般的にWER(Word Error Rate)測定で理解されます。 精度は、負のWER値(例えば、100%-WER%)で表されます。 詳しくは、Word error rate をご覧ください。

転写精度に影響を与える要因について

以下の要因が転写の精度に影響します。

  • オーディオ品質
  • 録音品質
  • 接続性の問題
  • トランスクリプションサービスの構成
  • トレーニングやトランスクリプションに使用されるエンジン
  • モデル構築に使用するトレーニングデータ
  • インタラクションで使用する語彙

転写精度が低い

転写の精度が低い場合は、次の手順を実行して、転写に悪影響を与える根本的な問題が存在しないことを確認します。

  1. システム的な問題を排除する。
  2. 録音のサンプルを手作業で確認し、書き起こし、ベンチマークする。
  3. 定期的に間違って書き写されている語彙がないか確認する。

これらの手順を実行した後、構成が正しいことを確認します。正確な転写機能を実現するには、キューとフローを適切な方言に設定する必要があります。

構成と根本的な問題を排除した後、転写エラーの範囲を分析します。この分析を実行するには、サンプル録音を収集し、生成されたトランスクリプトを手動で転記されたトランスクリプトと比較します。高い録音精度の信頼レベルに到達するには、このプロセスで約 2 時間の録音の書き起こしが必要になる場合があります。2 時間の書き起こし録音には、一見問題のあるやり取りの選択ではなく、ランダムに集めたやり取りが含まれる必要があります。

Genesys Cloudからの録画のエクスポートの詳細については、AWS S3録画一括アクション統合について をご覧ください。

音声テキスト転写モデルは適応し、拡張するトピックにフレーズを追加するとき。 もし重要な用語それ相互作用の転写で常に誤って解釈される場合は、転写の精度を高めるために次の手順を実行してください。

  1. 追加 用語 NS 内のフレーズリスト 新規または既存 トピック。
  2. 特定のトピックがトピックリストに追加されました対話を書き写すために使用されたプログラムの。

 メモ:   スペルミスのある単語や転記したくない単語を含むフレーズを追加しないでください。

例えば、COVIDという単語が通常covertと表記される場合、既存のトピックを変更するか、新しいトピックを作成するCOVIDという単語を含むフレーズ。たとえば、「COVID の検査を受けた」、「COVID の状況」、「COVID のロックダウン」などです。

詳細については、以下を参照してください。 フレーズを使って作業する.

問題のある単語やフレーズ 

多くの場合、問題は全体的な転写にあるのではなく、不正確に転写された特定の単語に関するものです。

次のリストは、問題のある単語やフレーズを改善するために実行できる方法を示しています。

  • 辞書管理を使用して用語やフレーズを追加する
  • トピック定義にフレーズを追加する
  • 拡張音声文字変換サービスを利用する
  • データ寄付
  • 言葉の発見

辞書管理で用語やフレーズを追加する

辞書管理は、ビジネス用語やドメイン固有の用語の認識を向上させる手段を提供します。特定のブランド、単語、頭字語は、組織の仕様に基づいて転写される。この機能により、顧客は辞書に用語を追加することができ、文字起こしサービスの認識可能性が向上します。詳細については、辞書管理を理解する

辞書管理を使用すると、組織固有の用語を指定し、サンプルフレーズを提供し、似た発音の用語を識別し、音声文字変換の感度ブーストを割り当てることができます。ブースト値の範囲は1~10であり、対数スケールで用語の識別尤度を増加させる。ブースト値は API でのみ使用できます。

トピック定義にフレーズを追加する

トピックスポッティングにより、企業はインタラクション内の特定のトピックを見つけることができます。トピックは、インタラクション内で検出されたビジネス レベルの意図をカプセル化します。問題のある単語やフレーズをトピックとして追加し、キューが適切に構成されていることを確認することで、これらのフレーズを識別するようにトランスクリプション エンジンをバイアスすることができます。詳細については、以下を参照してください。 トピックを取り上げる.

拡張音声文字変換サービス(EVTS)を使用する

EVTSはAzure STT 統合音声によるやり取りを書き起こします。統合は Genesys Cloud に直接統合されるため、トランスクリプトは他のトランスクリプトと同様に [インタラクションの詳細] ページに表示されます。

記述されている方言によっては、EVTS を使用すると転写の精度が高くなる可能性があります。

詳細については、音声文字変換 – Genesys Cloud Voice TranscriptionとExtended Voice Transcription Servicesの違いは何ですか? 。 EVTSでサポートされている言語の詳細については、以下を参照してください。 Genesys Cloud でサポートされる言語。 

データ寄付

録音に手動の文字起こしを含めると、ホスト言語の文字起こしエンジンを会社関連の用語で再トレーニングし、精度を向上させることができます。手動トランスクリプトによる録音に関連付けられたデータにより、すべての方言の全体的な精度が向上します。このデータの処理と方言モデルの再トレーニングには数か月かかる場合があります。200 時間以上の寄付により、精度が向上します。

ロードマップの精度向上

Genesys は、音響モデルと言語モデル、および転写に使用される基礎となる転写エンジンを継続的に更新します。このプロセスにより、精度が継続的に向上します。今後の機能リリースの詳細については、以下を参照してください。機能リリースとコミュニケーション。 手動トランスクリプトデータを使用した録音に関するその他の質問や精度の向上については、カスタマー・ケアへのお問い合わせ