パスワードを忘れた? アカウント作成
15370345 story
ソフトウェア

商用l利用も可能な音声合成ツール「VOICEVOX」が公開。現時点では窓の杜からダウンロード可能 73

ストーリー by nagazou
一文を長くすると処理が重い感じ 部門より
音声合成ソフトは商用利用に制限があるものが多いが、ヒホ(ヒロシバ)氏が8月1日に公開した「VOICEVOX」は、商用・非商用問わず無料で利用できるのが特徴。入力したテキストから音声を生成し、アクセントの調整や文字単位でのイントネーションの簡単な調整などが行える。現時点での音声は女性の声(お姉さん風、幼女風)2種類となっている。公開されているファイルサイズはおよそ3.26GBと大きめ。公式はGoogleドライブ上に置かれていたが、ダウンロード制限に達していることが多いことから、一時的に窓の杜からダウンロードできるようになっている模様(VOICEVOX公式サイト窓の杜ヒホ(ヒロシバ)さんのツイート)。
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2021年08月07日 7時26分 (#4086294)

    ってあんまり期待してなかったのですがデモは予想よりずっと品質が良くてびっくり。
    有料ソフトで手持ちのかんたん!AITalk3やWorldvoice2日中英韓、CevioCS6と比べて
    遜色ないどころか軽く上回ってるじゃないですか。
    これで棒読みちゃん連携できればなぁ…

  • by Anonymous Coward on 2021年08月07日 7時34分 (#4086298)

    ソフトの利用規約もあれだけど、そもそもエンジンがオープンソース(LGPL)なんで、
    https://github.com/Hiroshiba/voicevox [github.com]
    いろいろ発展性があるね。中間ファイルから3Dモデルの口パクを作ったりできるんじゃないかな。

    • by Anonymous Coward

      そもそも口の動きをデータベース化したITAコーパスから、音声データだけ抜き出して学習しているので……。
      親和性が高いと見るか、主従逆転と見るか。

    • by Anonymous Coward

      オープンソースの場合、特許関係が怖いんよね。
      ディープラーニングの普及で特許が濫造されて、クロスライセンス前提みたいになっている。

      • by Anonymous Coward

        ほとんどの人にとって、合成した音声を動画とかで使うだけなんだから、特許は関係ないでしょ。これを利用した自作ソフトを売り抜けよう、みたいな、かなり特殊な用途じゃないと。

        • by Anonymous Coward

          動画で使うのは特許と関係ないなら動画コーデックが特許ゴロの巣窟になってないだろ・・・

          • by Anonymous Coward

            動画のコーデックは動画を再生するのに「使用する」から特許に抵触するわけで、
            動画自体をファイルとして保存しておくのに特許料はかからない。
            できあがった音声データを再生するのには、それを作成するのに必要な特許は
            「使用しない」からかからないという理屈だろ。

          • by Anonymous Coward

            例えばH246で変換した動画を売るのに特許料払う必要があるの?
            とも思ったが、
            その変換したツールが特許侵害してた場合、
            変換した動画はその後どうなるんでしたっけ?
            侵害してないツールで作り直し?金払えばOK?特許は関係無し?

            • by Anonymous Coward

              作り直さなくても、そのまま変換すればOKでしょ。

              ガリレオは望遠鏡を特許通りに作って月のクレーターを観察してスケッチを出版したけど、特許料は一切払ってない。望遠鏡を売れば特許権の侵害かもしれないが、望遠鏡で見た内容は特許の範囲じゃない。

        • by Anonymous Coward

          特許料を支払う必要があるか否かの話ではないんでは。
          収益スキームだとか開発者のリソース・やる気だとか、コミュニティーが崩壊しかねない。

  • URLが/21/08/05/になってるから、5日に文章だけ作って今日公開するように設定したんだろうけど
    状況が変わるものを題名に入れなきゃいいのに

  • by Anonymous Coward on 2021年08月07日 7時30分 (#4086295)

    経営の苦しい地方鉄道、バス会社の車内アナウンスが軒並み音声合成になったりして

    # 調整に手をかける位なら社員にドスの利いた声で読ませた方が安上がりか

    • by Anonymous Coward on 2021年08月07日 7時35分 (#4086299)

      バスは既に結構多いですね。

      親コメント
    • by Anonymous Coward on 2021年08月07日 7時55分 (#4086310)

      5年ほど前に御殿場駅まで高速バスで向かった際に、車内アナウンスが伊吹マヤ(中の人という意味ではなく、伊吹マヤとしてやっていた)でビビりました。
      箱根つながりらしいけど、エヴァとはQ以降関係ないじゃん。

      東京メトロは大原さやかさんでしたっけ?

      親コメント
    • by Anonymous Coward

      都会の方がさっさと合成音声になってません?

    • by Anonymous Coward

      規則合成の話だと勝手に思ってたので、このツリーのリプライは???だったが、
      波形接続型音声合成も音声合成でしたね。

      wikipedia情報だと統計的パラメトリック音声合成ってのがあるんですか。
      VOICEVOXはこれ?

  • by Anonymous Coward on 2021年08月07日 12時34分 (#4086463)

    クオリティーが高くて素晴らしいと思うんだけど、
    もし、もっと普通に使えそうな音声が入っていて、多くの人が普通に業務に使えるようなものだったら、
    業界破壊的なことになって、いろいろ厄介なことになるのかなぁ・・・?

    • by Anonymous Coward on 2021年08月07日 12時40分 (#4086469)

      機械学習ものでオープンソースでしょ?
      デフォの音声が嫌なら自分でデータセットを用意してトレーニングすればいい

      親コメント
typodupeerror

日々是ハック也 -- あるハードコアバイナリアン

読み込み中...