東芝デジタルソリューションズ株式会社(本社:神奈川県川崎市、取締役社長:島田 太郎、以下 当社)は、RECAIUS音声合成ミドルウェア 「ToSpeak」において、DNN(深層ニューラルネットワーク)技術に基づき人間の声により忠実な音質のAI合成音声を生成する、ハイエンド機器向けの新ラインアップ「ToSpeakHx」シリーズの提供を開始しました。「ToSpeakHx」シリーズは、従来製品に比べて、合成音声の抑揚・リズム(韻律面)と声としての音色(声質面)の自然さを高め、手本にする人の声に極めて近い自然な音声で情報を読み上げることが可能です。
RECAIUS音声合成ミドルウェア「ToSpeak」は、音声認識、音声合成、知識処理、対話応答の4つの音声技術を基にお客様のコミュニケーションをサポートする当社のコミュニケーションAI「RECAIUS(リカイアス)」のサービスの1つで、多様な電子デバイス上で自然な音声発話が実現できる音声合成ソフトウェアです。滑らかで良好な音質のAI合成音声をテキストから自動生成し、かつ、汎用CPU上でコンパクトなメモリサイズで軽快に動作可能な特長を有し、組み込み応用に適したAPI
(注)形式のSDK(ソフトウェア開発キット)製品です。
2000年頃からカーナビなどの車載機器に組み入れて利用されているほか、ゲーム機、ポータブル翻訳機などにも搭載されています。企業向けにライセンス提供し、企業の開発者が自社の機器やアプリケーションなど製品やサービスに「ToSpeak」を組み込むことにより、テキストを音声化する(テキストから合成音声を生成して読み上げる)機能を自社の製品・サービスに付加することができます。
スマートフォンやPCなどのナビゲーションアプリや、電車のアナウンス、ゲームのキャラクターボイス、オーディオブックなどでは、情報を読み上げる音声の自然さがサービスの質に影響します。
今回提供を開始した「ToSpeakHx」シリーズは、合成音声の手本にする人の声をモデル化する際にDNN技術を適用した新しい商品ラインアップです。DNN技術の適用により、テキスト化された文字情報をより人間の声に近い自然な声で読み上げるだけでなく、例えば、収録したナレーターの声を手本に機械学習すれば、そのナレーターの声の特徴をより反映したAI合成音声を生成することもできます。
「ToSpeakHx」シリーズは、必要メモリサイズ・処理負荷の異なる2種類を取りそろえています。1つは、数メガバイト程度のコンパクトな音声合成データを使って従来製品より自然なAI合成音声を生成できる「ToSpeakHx」、もう1つは、声質面と韻律面の両面で本人らしさをさらに高めた「ToSpeakHx Pro」です。既存の「ToSpeak」に、新たにこれらの「ToSpeakHx」シリーズを加えることで、搭載可能なメモリサイズや処理負荷を加味しながら、AI合成音声の質感へのこだわりに応じて、より幅広いラインアップから選択できます。
「ToSpeakHx」シリーズは今回、日本語対応の提供を開始しましたが、今後は英語や中国語など、サポート言語を拡大し、幅広い応用に対応していきます。
「ToSpeakHx」シリーズ活用シーンのイメージ(例)
※当社ニュースリリースサイトでは音声サンプルを公開しています。
https://www.global.toshiba/jp/news/digitalsolution/2024/11/news-20241106-01.html
●東芝コミュニケーションAI 「RECAIUS(リカイアス)」について
音声認識、音声合成、自然言語処理、知識処理など、東芝が長年研究開発してきた音声言語領域の技術に基づき、お客様のビジネスや生活の快適な活動やコミュニケーションをサポートするサービスです。
注:アプリケーション・プログラミング・インターフェース(Application Programming Interface)。ソフトウェアやプログラム、Webサービスの間をつなぐインターフェース
*RECAIUS、ToSpeakは、東芝デジタルソリューションズ株式会社の日本またはその他の国における登録商標または商標です。
*その他、本文章に記載されている社名および商品名はそれぞれ各社が商標または登録商標として使用している場合があります。
*ニュースリリース/トピックスに掲載されている情報(サービスの内容/価格/仕様/関連リンク/お問い合わせ先など)は、
発表日現在の情報です。予告なしに変更されることがありますので、あらかじめご了承ください。