ザリガニが見ていた...。

音声合成の聴き比べ（SayKana、やるじゃん！）

雑記

富士通、ナレーターの発音とほとんど変わらない新方式の音声合成技術を開発
2009/7/27 18:23 UTC − 富士通 (6702) 研究所は27日、プロのアナウンサーによる発声とほとんど変わらない品質が得られる新方式の音声合成技術を開発したことを発表した。
この新方式の音声合成技術は流暢な音声の発声を実現するために、独自の発話リズム制御モデルと大規模な音声波形データベースを組み合わせたもので、従来型のロボットのような音声とは異なり、極めて自然な抑揚で音声の生成を可能としたものなる。
http://www.technobahn.com/news/200907271823

試聴

そうなのか！「プロのアナウンサーによる発声とほとんど変わらない品質」に惹かれて聴いてみた。（期待大）

富士通従来方式を試聴

富士通新方式を試聴

あれれ、ちょっと記事を読んでバイアスがかかり過ぎたのかもしれないけど、個人的にはAITalkに惹かれてしまう。

AITalk 声の職人（以下の文章をコピーして、合成ボタンで試聴した）

近畿地方の天気概況をお知らせします。今日の近畿各地は、日本海に中心を持つ高気圧に覆われて、中部、南部では晴れるでしょう。北部は、かんきの影響で、雲が広がり易いでしょう。空気が乾燥し、火災が発生し易い状態が続きます。火の取り扱いには十分注意してください。

AITalkを個人で利用するにはちょっと高価で退いてしまうが、そんな時はSayKanaコマンド。（非商用ならフリー）

SayKanaで試聴

saykana "きんきち'ほう(の)/て'んきが'いきょー(を)/おしらせし(ま'す)。きょ'う(の)+き'んき+か'くち(わ)、にほ'んかい(に)/ちゅーしん(を)も'つ/こうき'あつ(に)/おおわれ(て)、ちゅ'うぶ、な'んぶ/(で'わ)/はれ'る+(でしょ'う)。ほ'くぶ(わ)/か'んき(の)+えいきょー(で)、く'も(が)/ひろがりやす'い+(でしょ'う)。く'うき(が)/かんそーし、かさい(が)はっせい+しやす'いじょーたい(が)/つずき(ま'す)。ひ'(の)/とりあつかい(に'わ)/じゅうぶ'ん/ちゅ'ーい+し(て)くださ'い。"

- - 上記のかな文字列は、saykanji経由で出力した音声記号列を若干調整したもの。
  - saykanjiについては、saykanjiコマンドを定義して漢字仮名混じり文を読み上げるから続く全5シリーズをどうぞ。

所感

富士通新方式は、とても上品に発音するけど、部分的にちょっと聴き取りにくい感じがした。（音量を大きくしても）
- 所々、前後の発音が重なるような、キーが外れて裏声のように聞こえてしまうのが惜しいところ。

AITalkはやっぱり素晴らしい！あかりさん、という方が本当にそこに居るような錯覚に陥る。
- なにより、普通の漢字仮名混じり文を即、流暢に読み上げるところがかなり賢く、使い易いところ。

SayKanaはちょっと舌足らずな女の子っぽい話し方なのだけど、男性には人気がありそう。（女性には支持されないかも）
- ちょっと幼稚な感じがするところは、怒っている人をなだめる効果もありそう。

AITalk、素晴らしい！SayKana、やるじゃん！富士通、頑張れ！