IVR機能

IVR機能

進化したIVR機能がコミュニケーションの可能性を変える!

IVR機能について

くらし情報から各種案内まで広範囲に活用可能

電話やFAXからさまざまな情報が24時間手軽に取り出せます。
欲しい情報が声で呼び出せる音声認識機能や、情報コンテン ツがホームページと共用できるWeb-FAX連携機能など、機能拡張も容易。
一般家庭に多いダイヤル回線にも対応し、広い対象に向けた各種サービスが提供できます。

くらし情報から各種案内まで広範囲に活用可能

VOISTAGEのIVR機能における付加価値・アドバンテージ

VOISTAGEの音声認識機能「Vrec」(ブイレック)

数多くのメニューや情報の中から、目的のコンテンツをピンポイントで指定できる音声認識。
N-BESTやワードスポッティングもサポートし、進化し続ける音声認識エンジン「Vrec®」
VOISTAGEでは、他の機能とともに音声認識もこれからの CTI/CRMには必須と考え標準でサポートしています。

知りたい情報をすばやく指定できるバリアフリーなシステム

通常、自動音声情報サービスでは、システムからのガイダンス(「○○の場合は1を、△△の場合は2を押してください。」など)に従ってプッシュボタンを押しメニューを選択したり情報を入力します。しかし、提供されるメニューや情報項目が数多い場合、プッシュボタンでの入力では、めざす情報にたどり着くまで、かなりのプッシュ操作が必要です。また、コードレス電話や携帯電話ではプッシュ操作のたびに電話機を耳からはなさなければなりません。それが、音声認識技術を利用することにより、情報の指定が音声で行え、直感的かつピンポイントですばやく目的の情報にアクセスすることができます。プッシュ操作の煩わしさから解放され、自然な対話ベースの操作になるので、操作に不慣れな人やお年寄りにもやさしいバリアフリーな機能でもあります。


マルチメディアカードには、NTTデータが独自に開発した音声認識エンジン「Vrec」が標準搭載されています。
認識させようとする単語をあらかじめテキストにて辞書設定しておくことにより、不特定話者の人が話す声をリアルタイムに認識することができます。同時認識単語数は最大1000単語×4連続。
もちろんシステム全体での単語登録数に制限はありません。認識率は500単語の認識において95%以上を実現しています。50万語におよぶ大語彙認識、バージイン機能にも対応した高性能な音声認識が可能です。

※同時認識単語数や、認識率は使用メモリ、回線数により変わります。

Vrec2の特長
50万語の大語彙認識

新音声認識ロジックと高精度汎用音響モデルの採用により、認識性能を飛躍的に向上。最大登録語彙数を従来の10万語から50万語に拡大。

高精度バージイン(割り込み発話)機能をサポート

発話中のガイダンス音声停止をハードウェア(DSP)で処理することで、より自然で高感度な会話環境を実現。

圧倒的なコストパフォーマンス

汎用音響モデルによりトレーニングは不要。追加ライセンスも一切不要で、短期間・低コストで音声認識システムが構築可能に。

豊富なオプション

専門スタッフがシステムの構築をサポートする「チューンアップサービス」や、数字/氏名/住所/企業名/金融機関名などの「専用音響モデル」をオプション設定し、高度で多彩なシステム構築をサポート。


さらに進化した音声認識エンジン「Vrec2」が可能にした、3つの付加機能!

※マルチメディアカード基本ソフトウェアVer.6に搭載。

N-BEST

一回の認識で複数(第3)候補までアプリケーションに通知が可能。よく似た候補語を聞き返していくことで絞込みを行い、認識の確度を高める。
(例)「お名前をどうぞ」→「もり」→「毛利さんですか?」→「いいえ」→「森さんですか?」

ワードスポッティング

前後の不要語を除き、特定のキーワードのみを認識。
「えーっと、山田です」→「山田さんですね」(「山田」だけ認識)

VoiceXMLへの対応

アプリケーションで動的に辞書の作成が可能に。また、VOISTAGE音声合成機能と組み合わせ、Webを音声で操るボイスポータルにも容易に対応。


ANSWERで培ったVOISTAGEの音声認識技術
ANSWERで培ったVOISTAGEの音声認識技術

音声認識には、実用的な認識率を確保するための専門的なノウハウや高い信頼性が求められます。
さらにはストレスなく操作できるよう、対話コミュニケーションや人間心理からのアプローチも必要です。NTTデータでは、自社内およびNTTグループ内の旧電電公社時代からの蓄積された技術資産が自在に活用できるアドバンテージがあります。
また、実際に大規模なシステムに導入され活躍している事例も数多くあります。その一つが「ANSER」です。ANSERは、82年の誕生以来、17,000回線以上の実績を持つ、国内最大の金融系CTI/CRMシステムです。このミッションクリティカルなシステムに導入され、鍛えられた技術がVOISTAGEの音声認識です。
高度な機能を標準搭載で提供できるのも、これらのバックボーンがあってこそなのです。


さらに進化した音声認識エンジン「Vrec2」

独自方式の採用で、より自然な音声を追求 VOISATGEの音声合成機能

漢字・カナまじりのテキストを音声に変換する音声合成(テキストスピーチ)。
音声認識とならび、次世代におけるヒューマン インターフェースの中核をなす重要な機能です。
これまでの合成音声は、いわゆるロボット音声に例えられる独特な機械音声でしたが、VOISTAGEが独自の合成方式で従来のイメージを一新、より自然な音声を実現しました。


さまざまなサービスに利用が可能な音声合成

音声合成はカーナビなどのほか、すでにさまざまな音声案内サービスに利用されています。まず、金融分野では銀行口座の残高照会や証券会社の株価案内、公共分野では市政情報や 緊急情報、各種交通情報やダイヤ・運賃案内、ニュースや気象情報の案内にも利用が可能です。
また、商業分野では、通販受注商品の復唱や特売情報のアナウンス、商品説明ナレーションなどにも最適です。一方、ビジネスシーンだ けでなく、メールやホームページの読み上げ、文章・数字の校正などプライベートシーンにも活躍するなど、きわめて利用範囲の広い技術です。
いずれの場合も可変情報を瞬時に組み合わせ、指定された情報をリアルタイムに案内することができます。音声生成の方法も、テキストデータを自動的に音声に変換するため、だれも簡単に操作でき、録音に相当するコストも発生しないなど、手軽かつ自在に音声コンテンツを作成しサービスすることができます。



VOISTAGE音声合成機能の特長
自然で高品質な音声を生成

独自方式により、漢字・カナまじりのテキストデータを高品質な音声データに変換します。
話者は男声と女声の2パターンを用意。用途に応じた音声が選択できます。

25万語の強力なテキスト解析辞書を搭載

10万語の基本辞書に加えて地名8万語、人名5万語、英語2万語のテキスト解析辞書を標準搭載したことにより、これまでユーザ自身で登録せざるを得なかった言葉もそのまま読み上げることが可能です。

自在な操作環境

読み上げる文章のイントネーションやアクセントなどの韻律を編集できます。また、声の高低、アクセントの強弱、発声の速度といった読み上げに関する各種設定が可能です。これらの設定を調整することで、より一層肉声に近い発声をさせることができます。


さらに進化した音声合成
さらに進化した音声合成

マルチメディアカード基本ソフトウェアVer.6では、さらに高品質な音声合成をサポート。
女性音声に徹底したチューニングを施し、生き生きとした自然な音声を実現。
業界最高水準の音声 生成が可能になりました。また、複数フレーズに対応した韻律編集、辞書・話者数の拡大や読み上げ設定項目の拡充など、ユーティリティも一層充実し、大きな進化を果たしました。


新音声合成機能の特長
よりなめらかでバリエーション豊かな音声

音声のクオリティ向上とともに、新たに女性音声を加え、話者バリエーションも3種類に充実しました。

27.7万語に辞書も充実

従来の25万語に、新たに基本辞書5千語、英語2千語、地名1万1千語、人名2千語の計2万7千語を辞書に追加。最新・難解な語もスラスラと読み上げます。

複数フレーズにわたる韻律編集が可能に

韻律編集の単位が、従来の1フレーズから複数フレーズに拡大し、長い文章も1つの操作画面で編集可能になり、編集効率を格段に向上させました。

きめ細かい読み上げ設定

読み上げの調整も一層きめ細かい設定が可能になりました。発声時に無視する文字や区切り文字、英数字・記号などの各種項目も簡単に設定でき、思い通りの音声を合成することができます。

IVR機能を使った導入事例

音声認識テレフォンガイドシステム

欲しい情報が声で呼び出せる、新世代のテレホンガイド

音声認識テレフォンガイドシステム

知りたい情報が24時間、電話やFAXから得られ、様々な分野で活躍するテレホンガイド。
従来のシステムでは事前に配布されたメニューコード表から目的の情報を選択しそのコード番号をダイヤルする必要があり、利用率の低下や情報内容の陳腐化といった問題があったが、利用者が思いついた言葉を電話で話すだけでコンピューターが内容を理解して対応する「人にやさしい」システムです。