hp5_1

話者識別

人が発した音声から声紋の特徴量を抽出し、人を識別する「話者識別」という技術の開発を行っています。この話者識別では、様々な人の膨大な音声データから声紋の特徴量をディープラーニングにより学習させモデルを作成することで、5秒程度の音声から話者識別を実現すべく研究を重ねています。コールセンターや通常の会議の議事録を、AIで自動的に文章とするなどの活用を検討しています。

AI議事録

手書きやPCで文字を書き起こす従来の議事録では、聞き逃しや書き漏れなどが起こり得ます。長い会議では文字の書き起こしに手間が掛かり、また議事内容の確認にも手間が掛かります。

そこで、NSD先端技術研究所では上記の話者識別を用いた議事録作成アプリケーションの開発を行っております。従来の議事録作成アプリケーションでは、マイクを人数分必要とし、マイクから話者を特定していますが、話者識別と組み合わせることにより、誰が何を話しているのか、マイクではなく音声から特定し、自動で議事録を作成できます。また、議題からトピックを抽出することで、膨大な議事録の中から、必要な議事録を容易に検索することができる機能や、要点のみを抑えることができる要約機能も研究しています。

レポート解析

一般的な日本企業では、自由な表現によるレポートを作成しながら業務を遂行しています。一方で、収集されるレポートは蓄積するのみとなり、活用の難しさを感じている企業が多数あります。

実際に活用することを考えると、膨大な数のレポートを全て読み、カテゴライズや集計、業務に生かせる類似事案や引用を探すなど、人が介在する作業が必要となるため、人の関与を最小限に抑えるための判断を支援するITが必要不可欠となります。そこで、NSD先端技術研究所では、新しい技術や学習モデルを活用したレポート解析について研究しています。個別レポートは人が作成した文書であるため、表現などに曖昧さが残り、既存ITの技術では解析に限界が生じます。よって、曖昧さを判断する技術として、学習モデルを活用する試みを開始しました。例えば、文章の分類化については、人が分類した数十件のレポートを元にモデル化し、新規のレポートを自動的にカテゴライズするAIを試行しています。

【テーマ】