音声合成機能

独自方式の採用で、より自然な音声を追求   VOISATGEの音声合成機能

漢字・カナまじりのテキストを音声に変換する音声合成(テキストスピーチ)。音声認識とならび、次世代におけるヒューマンインターフェースの中核をなす重要な機能です。これまでの合成音声は、いわゆるロボット音声に例えられる独特な機械音声でしたが、VOISTAGEが独自の合成方式で従来のイメージを一新、より自然な音声を実現しました。

さまざまなサービスに利用が可能な音声合成

音声合成はカーナビなどのほか、すでにさまざまな音声案内サービスに利用されています。
まず、金融分野では銀行口座の残高照会や証券会社の株価案内、公共分野では市政情報や緊急情報、各種交通情報やダイヤ・運賃案内、ニュースや気象情報の案内にも利用が可能です。また、商業分野では、通販受注商品の復唱や特売情報のアナウンス、商品説明ナレーションなどにも最適です。一方、ビジネスシーンだけでなく、メールやホームページの読み上げ、文章・数字の校正などプライベートシーンにも活躍するなど、きわめて利用範囲の広い技術です。いずれの場合も可変情報を瞬時に組み合わせ、指定された情報をリアルタイムに案内することができます。
音声生成の方法も、テキストデータを自動的に音声に変換するため、だれでも簡単に操作でき、録音に相当するコストも発生しないなど、手軽かつ自在に音声コンテンツを作成しサービスすることができます。

VOISTAGE音声合成機能

音声合成ソフトウエア概念図

VOISTAGEでは、音声合成に三洋電機ハイパーメディア研究所が開発した独自方式「局所歪最小化波形編集合成方式」を採用し、マルチメディアカードシリーズのデビュー当初から標準機能としてサポートしてきました。この方式は、1つの音素に対して複数候補の音素波形を用意し、組み合わされる語によって音素接続の歪みが最小(最適)になるよう編集合成する方式です。
さらに、大量のテキスト解析辞書の搭載や柔軟な開発・操作環境など、より自然で扱いやすい音声合成を実現しました。

音声合成機能搭載
マルチメディアカード
VS-201
VS-402MC
VS-403MC
VS-404MC
VS-406MC

 販売終了品

VOISTAGE音声合成機能の特長

自然で高品質な音声を生成
独自方式により、漢字・カナまじりのテキストデータを高品質な音声データに変換します。話者は男声と女声の2パターンを用意。用途に応じた音声が選択できます。
25万語の強力なテキスト解析辞書を搭載
10万語の基本辞書に加えて地名8万語、人名5万語、英語2万語のテキスト解析辞書を標準搭載したことにより、これまでユーザ自身で登録せざるを得なかった言葉もそのまま読み上げることが可能です。
自在な操作環境
読み上げる文章のイントネーションやアクセントなどの韻律を編集できます。また、声の高低、アクセントの強弱、発声の速度といった読み上げに関する各種設定が可能です。これらの設定を調整することで、より一層肉声に近い発声をさせることができます。

さらに進化した音声合成

新音声合成ユーティリティ画面

マルチメディアボックス基本ソフトウェアVer.8では、さらに高品質な音声合成をサポート。女性音声に徹底したチューニングを施し、生き生きとした自然な音声を実現。業界最高水準の音声生成が可能になりました。また、複数フレーズに対応した韻律編集、辞書・話者数の拡大や読み上げ設定項目の拡充など、ユーティリティも一層充実し、大きな進化を果たしました。

新音声合成機能搭載
マルチメディアボックス
  VS-411MB
  VS-412MB
  VS-2301MB

 在庫僅少

新音声合成機能の特長

よりなめらかでバリエーション豊かな音声
音声のクオリティ向上とともに、新たに女性音声を加え、話者バリエーションも3種類に充実しました。
27.7万語に辞書も充実
従来の25万語に、新たに基本辞書5千語、英語2千語、地名1万1千語、人名2千語の計2万7千語を辞書に追加。最新・難解な語もスラスラと読み上げます。
複数フレーズにわたる韻律編集が可能に
韻律編集の単位が、従来の1フレーズから複数フレーズに拡大し、長い文章も1つの操作画面で編集可能になり、編集効率を格段に向上させました。
きめ細かい読み上げ設定
読み上げの調整も一層きめ細かい設定が可能になりました。発声時に無視する文字や区切り文字、英数字・記号などの各種項目も簡単に設定でき、思い通りの音声を生成することができます。

 

音声合成関連ページ
その他の機能