| ハードウエア
> マルチメディアカードの特長
> 音声合成機能
|
![]() |
独自方式の採用で、より自然な音声を追求 VOISATGEの音声合成機能 漢字・カナまじりのテキストを音声に変換する音声合成(テキストスピーチ)。音声認識とならび、次世代におけるヒューマンインターフェースの中核をなす重要な機能です。これまでの合成音声は、いわゆるロボット音声に例えられる独特な機械音声でしたが、VOISTAGEが独自の合成方式で従来のイメージを一新、より自然な音声を実現しました。 |
|
|
| さまざまなサービスに利用が可能な音声合成 |
| 音声合成はカーナビなどのほか、すでにさまざまな音声案内サービスに利用されています。 まず、金融分野では銀行口座の残高照会や証券会社の株価案内、公共分野では市政情報や緊急情報、各種交通情報やダイヤ・運賃案内、ニュースや気象情報の案内にも利用が可能です。また、商業分野では、通販受注商品の復唱や特売情報のアナウンス、商品説明ナレーションなどにも最適です。一方、ビジネスシーンだけでなく、メールやホームページの読み上げ、文章・数字の校正などプライベートシーンにも活躍するなど、きわめて利用範囲の広い技術です。いずれの場合も可変情報を瞬時に組み合わせ、指定された情報をリアルタイムに案内することができます。 音声生成の方法も、テキストデータを自動的に音声に変換するため、だれでも簡単に操作でき、録音に相当するコストも発生しないなど、手軽かつ自在に音声コンテンツを作成しサービスすることができます。 |
![]() |
| VOISTAGE音声合成機能 |
|
||
|
|
|||
| VOISTAGEでは、音声合成に三洋電機ハイパーメディア研究所が開発した独自方式「局所歪最小化波形編集合成方式」を採用し、マルチメディアカードシリーズのデビュー当初から標準機能としてサポートしてきました。この方式は、1つの音素に対して複数候補の音素波形を用意し、組み合わされる語によって音素接続の歪みが最小(最適)になるよう編集合成する方式です。 さらに、大量のテキスト解析辞書の搭載や柔軟な開発・操作環境など、より自然で扱いやすい音声合成を実現しました。 |
|||
| 音声合成ソフトウエア概念図 |
| さらに進化した音声合成 |
|
||
|
|
|||
| マルチメディアカード基本ソフトウェアVer.6では、さらに高品質な音声合成をサポート。女性音声に徹底したチューニングを施し、生き生きとした自然な音声を実現。業界最高水準の音声生成が可能になりました。また、複数フレーズに対応した韻律編集、辞書・話者数の拡大や読み上げ設定項目の拡充など、ユーティリティも一層充実し、大きな進化を果たしました。 | |||
| 新音声合成ユーティリティ画面 |
|
(新音声合成機能の特長) よりなめらかでバリエーション豊かな音声 音声のクオリティ向上とともに、新たに女性音声を加え、話者バリエーションも3種類に充実しました。 27.7万語に辞書も充実 従来の25万語に、新たに基本辞書5千語、英語2千語、地名1万1千語、人名2千語の計2万7千語を辞書に追加。最新・難解な語もスラスラと読み上げます。 複数フレーズにわたる韻律編集が可能に 韻律編集の単位が、従来の1フレーズから複数フレーズに拡大し、長い文章も1つの操作画面で編集可能になり、編集効率を格段に向上させました。 きめ細かい読み上げ設定 読み上げの調整も一層きめ細かい設定が可能になりました。発声時に無視する文字や区切り文字、英数字・記号などの各種項目も簡単に設定でき、思い通りの音声を生成することができます。 |
|||||||||||||||||||
| 音声合成関連ページ | その他の機能 | ||||||||||||||||||||
|
|
||||||||||||||||||||
|
|
| Copyright (C) 2009 NTT DATA INTELLILINK CORPORATION |