Re:参照されてるWaveNetが凄いんだが (#3338707) | 人間そっくりの音声を合成可能なGoogleの音声合成システム「Tacotron 2」

「人間そっくりの音声を合成可能なGoogleの音声合成システム「Tacotron 2」」記事へのコメント

記事ページを表示すべてのコメント取得

検索22コメント Log In/Create an Account

参照されてるWaveNetが凄いんだが (スコア:4, 参考になる)

by minet (45149)

寡聞にして知らなかったのだが、以前の技術として参照されているWaveNetが驚きだ。
https://techcrunch.com/2016/09/09/googles-wavenet-uses-neural-nets-to-... [techcrunch.com]
https://deepmind.com/blog/wavenet-generative-model-raw-audio/ [deepmind.com]
特に後半の、目標テキストなしで生成させた音声が、息継ぎや舌打ちの音の感じが生々しい。
この音声は意味のない発音らしく、英語ネイティブ話者にとって「馬鹿げた」感じに聞こえるらしいが、
非ネイティブな俺には完全に、どこかの外国人がリラックスして私的な会話をしてるのを録ったのか、マイク下手だなぁ舌打ち音入って
- Re: (スコア:0)
  
  by Anonymous Coward
  
  やっぱ日本語は難しいのかなあ
  市場規模が小さいから優先順位が低いのかもしれないけど、Macやスマホの合成音声聞いても微妙なもの多い
  人語と区別つかなくなったらなったで専ら犯罪に使われるんじゃないか？とか思っちゃうが…
  - Re:参照されてるWaveNetが凄いんだが (スコア:0)
    
    by Anonymous Coward on 2018年01月01日 4時22分 (#3338707)
    
    ボカロとかに応用できないかな…
    
    シェア
    
    親コメント
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      ディープラーニングではないですが、CeVIOは読み上げ、歌ともに隠れマルコフ連鎖を元データから学習して作っていて、ボカロなどのサンプリングベースとは違う手法のようですね。
      読み上げの場合アクセントの情報が必要になるので、完全に辞書を廃するのは難しいようですが。
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        HMMは20年前の技術だからなぁ。いまそれを選択する理由があるのかという。
        ここ20年、音声再生、音声認識は研究レベルでまったく進歩が無かったと聞いているので、今後の動きに期待。

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

人間そっくりの音声を合成可能なGoogleの音声合成システム「Tacotron 2」 More ログイン

「人間そっくりの音声を合成可能なGoogleの音声合成システム「Tacotron 2」」記事へのコメント

参照されてるWaveNetが凄いんだが (スコア:4, 参考になる)

Re: (スコア:0)

Re:参照されてるWaveNetが凄いんだが (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

スラド