前提条件

Genesys Cloud Speech and Text Analytics(STA)の中で、音声転写は音声をテキスト化することで、対話の意味を紐解く価値を提供します。 また、コンテンツセンターのスーパーバイザーや品質管理者は、対話の録音を聴くことから解放されます。

音声の書き起こしは、さらなるインタラクション分析のための基礎となるものです。 例えば、コンテンツ検索、トピックスポッティング、感情分析、共感/非専門的行動、これらはすべて転写分析で構築されています。 

有用な知見を提供するためには、正確な書き起こしが必要です。 録音が不十分な場合、スーパーバイザーは録音を聴かなければならず、聞き逃したトピックや、間違って採点された感情などを確認する必要があります。 精度の向上は、すべてのSTAの能力を向上させます。 

転写精度の向上は、Genesys Cloudの最初の転写機能以来、注目されてきました。 音声転写は、発売以来、新しい転写エンジンの導入や転写モデルの更新など、方言の違いによる大幅な精度向上が図られています。

転写精度の把握

音声転写の精度は、一般的にWER(Word Error Rate)測定で理解されます。 精度は、負のWER値(例えば、100%-WER%)で表されます。 詳しくは、Word error rate をご覧ください。

転写精度に影響を与える要因について

  • オーディオ品質
  • 録音品質
  • 接続性の問題
  • トランスクリプションサービスの構成
  • トレーニングやトランスクリプションに使用されるエンジン
  • モデル構築に使用するトレーニングデータ
  • インタラクションで使用する語彙

転写精度が低い

転写精度が低い場合、以下の手順を実行し、転写に悪影響を及ぼす根本的な問題がないことを確認してください。

  1. システム的な問題を排除する。
  2. 録音のサンプルを手作業で確認し、書き起こし、ベンチマークする。
  3. 定期的に間違って書き写されている語彙がないか確認する。

後者の手順を実行した後、構成が正しいかどうかを確認する必要があります。 トランスクリプションが正確に機能するためには、キューとフローを適切な方言に設定する必要があります。

設定や根本的な問題が除外されたら、サンプル録音を収集し、生成されたトランスクリプトと手動でトランスクリプトを比較することによって、トランスクリプトエラーの程度を分析する必要があります。 録音精度の信頼度を高くするためには、この作業で約2時間の録音を書き起こす必要がある場合があります。 2時間の書き起こし録音は、一見問題がありそうなやり取りを選んで録音するのではなく、ランダムに取り揃えたやり取りで構成する必要があります。

Genesys Cloudからの録画のエクスポートの詳細については、AWS S3録画一括アクション統合について をご覧ください。

音声からテキストへの文字起こしモデルが適応および拡張 フレーズがトピックに追加されたとき。 ある場合 重要な用語 それ 相互作用の文字起こしで一貫して誤って解釈される場合、文字起こしの精度を上げるには、次の手順を実行する必要があります。

  1. 追加 用語 NS 内のフレーズリスト 新規または既存 トピック。
  2. 確認 NS 明確な トピックがトピックリストに追加されます 相互作用を転写するために使用されるプログラムの。

  注意: 誤字脱字や書き写されたくない単語を含むフレーズを追加しないでください。

たとえば、COVIDという単語が定期的に秘密として転写されている場合、 あなたがすべき 既存のトピックを変更するか、新しいトピックを作成します covidという単語を含むフレーズで。 例えば、 「COVIDのテスト済み、」 「「COVIDの状況、」 「COVIDの封鎖、」 等々。

詳細については、以下を参照してください。 フレーズを使って作業する.

問題のある単語やフレーズ 

多くの場合、問題はテープ起こし全体にあるのではなく、特定の単語が不正確にテープ起こされていることにある。

以下のリストは、問題のある単語やフレーズを改善するために実行できる方法を表しています。

  • 辞書管理APIを使用した用語とフレーズの追加
  • トピック定義にフレーズを追加する
  • 拡張音声書き起こしサービスの利用
  • データ寄贈
  • ワーズディスカバリー

辞書管理APIを使用した用語とフレーズの追加

辞書管理は、ビジネス用語やドメイン固有の用語の認識を向上させる手段を提供する。 特定のブランド、単語、頭字語は、組織の仕様に基づいて転写される。 この機能により、顧客は辞書に用語を追加することができ、テープ起こしサービスの認知度が高まる。

この機能は開発者APIを通じてのみ利用可能である。詳細については、Dictionary Management API を参照のこと。

APIを使用すると、組織固有の用語を指定し、フレーズの例を提供し、類似した響きを持つ用語を特定し、音声書き起こしの感度を高めることができます。 ブースト値の範囲は1~10であり、対数スケールで用語の識別尤度を増加させる。

トピック定義にフレーズを追加する

トピック・スポッティングは、企業がインタラクションの中の特定のトピックを発見することを可能にします。 トピックは、インタラクション内で検出されたビジネスレベルの意図をカプセル化します。 問題のある単語やフレーズをトピックとして追加し、キューを適切に設定することで、お客様がそのフレーズを識別するようにトランスクリプションエンジンをバイアスをかけることができます。 詳細については、以下を参照してください。 トピックを取り上げる.

拡張音声書き起こしサービスの利用

EVTSでは、Azure STTを使用して音声のやり取りを書き起こします。 トランスクリプションはGenesys Cloudに直接統合されるため、他のトランスクリプションと同様にInteractions Detailページで表示されます。

方言によっては、EVTSを使用した方が転写精度が高くなる場合があります。

詳しくは、音声トランスクリプション - Genesys Cloud Voice TranscriptionとExtended Voice Transcription Servicesの違いについて をご覧ください。  

EVTS の対応言語については、Genesys Cloud の対応言語 をご覧ください。 

データ寄贈

手書きのテープ起こしに録音を含めると、母国語のテープ起こしエンジンに企業関連の用語を再教育することができ、精度を高めることができます。 手書き文字起こしのある録音に関連するデータは、すべての方言で全体の精度を向上させます。 このデータを処理し、方言モデルを再トレーニングするのに数ヶ月かかることもあります。 200時間以上の寄付で精度の向上につながります。

ロードマップの精度向上

Genesysは、音響モデルや言語モデル、そしてトランスクリプションに使用する基礎的なトランスクリプションエンジンを継続的に更新しています。 これにより、継続的な精度向上につながります。 今後の機能リリースの詳細については、機能リリースと通信 を参照してください。

手動トランスクリプトデータを使用した録画に関するその他の質問、および精度の向上については、カスタマーケア までご連絡ください。