人工知能技術を使った歌声合成エンジン「NEUTRINO」、容易に人間らしい歌声を合成可能として話題に 42
ストーリー by hylom
突如登場 部門より
突如登場 部門より
人工知能技術を使っているという新たな音声合成エンジン「NEUTRINO」が発表された。歌詞とメロディを入力するだけで歌声を合成できるソフトウェアで、実際に人間が歌ったデータから特徴を抽出することで、その歌声と似た音声を作り出せるという(すずしめにっき)。
現在2つの音声ライブラリが公開されており、すでにこれらを使った音源も公開されている。今までの歌声合成ソフトウェアでは人間らしく歌わせるためにはパラメータの調節などが必須だったが、NEUTRINOではそのような調整を行わずとも人間らしい歌声を作り出せるという。
歌って「いただく」ソフトウエア (スコア:3)
制限とも取れるが,むっちゃリアル,という向きもある。
Re: (スコア:0)
とりあえずTWO-MIX(コナン君)のTRUTHを試したい。
Re: (スコア:0)
とりあえず、たてかべさんの声で「俺はジャイアン」を試したい。
#近年の「ぼぇ~♪」は実に味気ない。
Re:歌って「いただく」ソフトウエア (スコア:2)
(より破壊力がある)
ボーカロイドの曲で学習すれば (スコア:2)
ボーカロイドっぽくうたってくれるようになるのかな。
既にCeVIOがあった (スコア:0)
CeVIOでもボカロよりは十分に人間っぽかったけど、
その開発に関わってた名工大の研究室が、2年くらい前に
CeVIOの次の技術としてディープラーニング系でデモ発表してたけど関係あるのだろうか?
余談だけど、CeVIOはまだ無料アップデート続けてくれててすごい。64bit化もしたし。
Re:既にCeVIOがあった (スコア:4, 参考になる)
CeVIO用だったかは忘れたけど、技術デモにあった歌声はすごかったですよね。
でもそのあと音沙汰無くてどうなったんだろうと思ったけど。
twitterで訓練元音源を公開した教授もわかってくれたかと喜んでましたが、この辺り [km4osm.com]にまとまってるように
今回のNEUTRINOのおかげで、ディープラーニングを使った歌声合成がどんなものか一般にもわかってきたみたい。
特徴として
・楽譜と歌詞を渡せば人間ぽく歌ってくれる
ってのは想像どうりだったんだけど、
・訓練したNNにとって得意な曲はきれいに歌えるけど苦手な曲は変になる。
・人間でも歌えないような曲は声ですらなくなる。(事がある)
・歌声調整の方法がボカロの調整と異なり、指示する楽譜と歌詞で調整する形
ってあたりが、製品化しずらいところなのかも。
でも、本当に楽譜と歌詞だけで「普通に上手な素人がカラオケで歌っている。」
くらいにはなるのはすごいですね。だけど、そのあとが難しい。どういう風に使うのが良いか、
公開した人も、そのあたりも含めて、利用者側からの発展に期待しているんじゃないかな。
Re:既にCeVIOがあった (スコア:2)
あとは権利関係だけですかねえ。きりたんは商用利用できないので。
Re:既にCeVIOがあった (スコア:1)
少しずつパラメータを変えたNETUTRINOインスタンスを並べて仮想合唱団でも作るとか?
Re:既にCeVIOがあった (スコア:1)
ボーカロイドは声を発する楽器で、AIシンガーはロボット歌手。
みたいなイメージ。
訓練したことはできるが、訓練内容にないことをさせると破綻する。
だから、たぶん、ボカロ曲を学習させたら、ボカロっぽくボカロ曲を歌えるようになるんだろう。
Re: (スコア:0)
これだけマイナスモデした人は#3769207の行為は続けて欲しいと思ってるのかね。
Re: (スコア:0)
ニュースリリース見つけた。
2時間程度の収録でいけるところがすごい。
https://www.techno-speech.com/news-20181214a [techno-speech.com]
話題 (スコア:0)
だってばよ!
製品よりも凄いと思えるのが (スコア:0)
何ともかんとも
# メーカーさんはどうする!?
失業の危機 (スコア:0)
声優さんが絶滅危惧種指定されるのも時間の問題かと。
(既に指定済み?、失礼しました。)
Re: (スコア:0)
以前ぼかりすがリリースされた頃に友人の声優さん(Wikipediaには載ってるぐらいの)と話しましたが、
仕事が細分化して間口自体は広がるんじゃないかな。
こういった音声のデータソースとなる仕事と学習データのソースとなる仕事と。
Re:失業の危機 (スコア:1)
その声優さんも語ってたと思うが、その「声」がヒットすればいわゆる「中の人」需要がある。
関連イベントや配信のゲストや司会として呼ばれたり、その物まね音源で小銭稼いだり等、
声優ランク料金体系に縛られない仕事が来るのでいい稼ぎになるのだとか。
Re: (スコア:0)
風雅なおとさんをすこれ
Re: (スコア:0)
> 「中の人」需要
かつては声優の顔出しは禁忌と言われていたのに時代は変わるものだ
Re: (スコア:0)
顔出せねえレベルの声優が表に出れなくなっただけだ
Re: (スコア:0)
時間の問題と言ったら何でも時間の問題なわけですが、それはそれとして。
「楽譜どおりに音が出せる機械があったら楽器や演奏家は不要になる」かと言えばそうではないように、この辺は色々複雑な要因で良し悪し(好み)が変わるのでそこまで簡単ではありませんね。
もちろんどこかのフェイズで市場が狭まる、商売になる人数が減る、という可能性はありますが。
生まれつき特殊な声をした子、とかの声にはある種のプレミアがつく、とか、
最初はへたっぴだけどカワイイ声だった子が成長するにつれ上手になっていく様、とか、
「機械で再現は可能だけどヒトがそうである様に感情を動かされる」みたいな枠もあるわけで。
Re: (スコア:0)
この場合、演奏家が「声優」から「音声作成技術者」に置き換わるのでは。
Re: (スコア:0)
だから、シンセ等でいろいろな楽器の音が出せてもオーケストラや実際に楽器を弾く人がいなくなっていないように、様々な需要があるからそう簡単に置き換わらない、って話ですよ
Re: (スコア:0)
「ドラムは打ち込みです。」なんてのは珍しくないですし仕事は無くならなくても減りはするんじゃないかな。
失業の危機というのは間違いではないのでは。
Re:失業の危機 (スコア:2)
Re: (スコア:0)
確かにドラムセットを一人で持つのは大変そうですね(違
Re: (スコア:0)
「絶滅するかも」に対する「減るかもしれないけど無くならないのでは」ってコメントに「無くならないかもしれないけど減るよね。失業の危機」ってつけてどうするんだ
Re: (スコア:0)
オイラはドラマ~♪ ヤクザなドラマ~♪
>「ドラムは打ち込みです。」なんてのは珍しくない
打ち(殴り)込みに行っちゃいましたか。
Re: (スコア:0)
この音声を作った人に会いたいと言われて、会ってみたらがっかりされるところまで想像できた。
Re: (スコア:0)
歌唱力ではなく便利に使える機動力やスキルで売ってた人達はだんだん厳しくなる気がするる。
いらすとやが便利すぎることによって小さなデザイン事務所などに起こったのと同じことが起きるのではないかと思ってる。
Re: (スコア:0)
演技力が求められる仕事を、これが駆逐出来るとは思えない
Re: (スコア:0)
・声の元は声優さん
・感情表現を再現しようとしたら感情の分だけ声色の録音が必要になる
(単純な喜怒哀楽だけじゃなくて、泣きながら怒ってるとか、静かに喜んでるとか)
ってこと考えるとまだまだ声優さんの仕事はありそうだよね
# 演技力のない人は割と早い段階で駆逐されそうだけど
Re: (スコア:0)
> 若くて、スケジュールが押さえやすく、製作サイドが求める特技(をもっている人)。
> これが揃っていれば、むしろ演技のほうをイチから教育しようということになる。
> 声優の能力価値の逆転が起きているのである。
https://note.com/ever_blue/n/n16ed7c79b534 [note.com]
最近の声優さんてアイドル性も求められてるしなぁ。
ナレーションなんかの分野はもっとしんどいかも。
会社で動画作った時に女性社員でナレーション入れようかという話が出たけど、
修正入れるたびに録り直すのめんどくさいからVOICEROID使いましょうで押したw
ゆかりさんにお願いしたけどそんな違和感なかった。
Re: (スコア:0)
自然だと思うけど、うまいとは思わなかったので、ちゃんと歌手の人ならまだ大丈夫でしょう。
逆に下手な人は、歌ってもらった方がよかったりして。
#win-win
かなり癖はある。 (スコア:0)
得意とする楽譜なら、違和感ない歌唱ができるそうだけど、
不得手な楽譜だと、かなりひどい物になるそうな。
VOCALOIDなら後で調整するけど、これの場合は、処理前の楽譜の段階で調整する必要がある。
人工知能技術を使った歌声合成エンジン「NEUTRINO」 (スコア:0)
右の耳に入った歌声は、左耳に抜けて行きそう(=印象に残らない)。
Re: (スコア:0)
光速で聞こえる音って何なんだろう。
Re: (スコア:0)
S波=横波(但し同速の重力波はP波=縦波かも)
Re: (スコア:0)
NEUTRINOだけに引かれるものがなくて心(核)に当たらないと。
NETRINOかと空目 (スコア:0)
と言ってみたかっただけです。