パスワードを忘れた? アカウント作成
15236921 story
Google

デスクトップ版Chromeで自動字幕起こし機能が利用可能に 35

ストーリー by headless
字幕 部門より
Googleは18日、デスクトップ版Chromeブラウザーで自動字幕起こし機能が利用可能になったことを発表した(The Keywordの記事Mac Rumorsの記事The Vergeの記事SlashGearの記事)。

自動字幕起こし機能はブラウザーが再生する任意のオーディオ・ビデオで話されている内容をテキスト化して表示するもので、現在のところ英語のみに対応している。ストリーミングサービスやソーシャルメディア、オーディオ・ビデオチャットなどサイトを問わず利用でき、ローカルメディアに字幕付けすることも可能だ。処理はローカルで行われるため、ローカルメディア再生時はインターネットに接続していなくても字幕が表示される。

この機能はWindows/Mac/Linux版の最新版Chromeで利用可能となっており、Chromeの設定画面で「詳細設定→ユーザー補助機能→自動字幕起こし」をオンにすれば有効になる。字幕はデフォルトでウィンドウの中央下に表示されるが、移動することも可能だ。Chrome OSでも近く利用できるようになるという。字幕の精度はソース次第であり、間違いが目立つものや、ほとんど字幕が表示されないものもあった。「Moderna COVID-19 vaccine (モデルナのCOVID-19ワクチン)」が「Madonna covet 19 vaccine (マドンナが19のワクチンを望む)」になるといった間違いは何度か見かけた。
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 早速試してみた (スコア:4, 参考になる)

    by Anonymous Coward on 2021年03月21日 12時58分 (#3998279)

    BBCのサイトでニュースの字幕を表示させてみた。
    ニュース自体のキャプションと大体合っていた(さすがにキャプションを参考にしてはいないだろう...)。
    アナウンサーのきれいな英語だからわかりやすいというのはあるだろうけど。

    • by Anonymous Coward

      てかTOEFL/TOEIC受けて一番初めに驚くのは外人の滑舌の悪さ。
      「字幕なしで映画/ニュースが見れる」程度の英語力では、まずあれにやられる。
      日本だったら「もっとはっきり喋れ」と義務教育期間から相当怒られそうなものだが、何故か英語圏ではあれが許されてる。
      ネイティブスピーカー故の先読み能力の高さがあると、以外と問題にならないものなんだろうか。

      • by Anonymous Coward

        お前は日本語ネイティブだからわからないだけで外国人からはきっと「もっと聞き取りやすく喋れ」と思われてるよ

      • by Anonymous Coward

        「ネイティブスピーカー」の定義自体がね。
        イメージ的にはアメリカの白人の標準語みたいな感じなのかな。
        必ずしもネイティブな人と会話するわけじゃないんだし、相手に合わせる能力の方が必要だわ。
        この部分の教育がない。

        • by nim (10479) on 2021年03月22日 17時57分 (#3999004)

          > イメージ的にはアメリカの白人の標準語みたいな感じなのかな。

          「アメリカの白人」でも、ニューイングランドの弁護士と、南部の農家と、
          テキサスの牧場経営では全然発音違いますし……

          親コメント
      • by Anonymous Coward

        滑舌が悪いのではなく、発音していないか、発音が異なるのではないかな?どの言語でも時代が下がると単語の末尾の発音が無声音になったり、音自体が変化したり、フランス語のように全く発音しなくなったりと手を抜いていくもの。ニュースなどはそこを多少抑え目にしているだけで。

      • by Anonymous Coward
        日本人でも、日常生活でニュースのアナウンサーや映画の登場人物のような話し方してたら不自然でしょ。
        「字幕なしで映画/ニュースが見れる」程度の英語力があれば、あとは少し慣れればなんとでもなりますよ。
        むしろ、訛りはあっても第2言語として英語を話す人と会話する方が、私は楽だと感じます。
    • by Anonymous Coward

      居間でPCしてるとうるさがられるんで、ほとんどの時間はミュートしてる。
      Youtubeには字幕サポートもあるけど、ない動画も多いからこれは助かる。

  • by Anonymous Coward on 2021年03月21日 13時01分 (#3998282)

    日本政府も日本語の認識APIでも民間に作らせてばらまいてくれないかな。
    そして今回と同じようにChromiumに組み込んでくれると良い。
    そうすれば日本語の輪が広がり、本邦のプレゼンスが高まるだろう。

    #個人でやれればいいが規模的に難しい

    • by Anonymous Coward

      TRONとCOCOAの話をする前振りか

      • by Anonymous Coward

        いえいえ、Σプロジェクトと情報大航海プロジェクトですよ

    • by Anonymous Coward

      日本政府も日本語の認識APIでも民間に作らせてばらまいてくれないかな。

      国会答弁を正しく英語に訳せたら完成ですね

    • by Anonymous Coward

      そういうのはとっくに未踏ソフトウェアにありそうな気がする

      • by Anonymous Coward

        サーバー側リソースを使わない組み込みの音声認識なんて、さほど認識率が高くない気がする。
        SaaSで提供するなら、民間での初期開発はいいが、運営や維持は金がかかるから行政府の補助がないと不可能だろう。

        こういうのは結局、札束で一度殴るというよりは継続的に未来に投資できるかどうかだからな。
        その辺り、箱物行政しかできない日本政府にできるとは思えんが。

    • by Anonymous Coward

      企業が作ってるものだと結構ある
      案の定だけど殆どが有料なので使いづらい

  • Youtube以外のWebinarとかで確認用に字幕が欲しかったり、
    日英同時で字幕が欲しい時に便利そうとおもってためしてみた。

    某海外ドラマ(英語音声日本語字幕)で試したけれど、
    掛け合いで話し手が変わると止まる。
    沈黙がしばらく続くと直ることもある。
    一人が電話で話しているだけのシーンで途中で止まった。

    など、まだまだかなぁという印象。Androidアプリの文字起こしの方が優秀かも?

    フローティングウィンドウだったけど、Chromeの外に字幕ウィンドウをだせなかった(出してもChrome内に強制的にもどされる。Macでのみ確認。)

    あとは、有効にすると追加のダウンロードが発生していたけど、音声が送信されている可能性も多分にあると思うので
    通信量とセキュリティ(会議とか)に注意ですね。

    • by Anonymous Coward

      ユーザー補助機能のところに、ローカルで処理されるって書いてあった。

      それ以前に

      > 処理はローカルで行われるため、ローカルメディア再生時はインターネットに接続していなくても字幕が表示される。

      って記事にも書いてありましたね。すいません。

      • by Anonymous Coward

        結果を持ち出されたらアウト

  • by Anonymous Coward on 2021年03月21日 20時01分 (#3998477)

    Windows標準の音声認識ツールが全然アップデートされないよね
    関連ストーリーにあるように主軸がクラウドに移ってそれっきり

  • そういうことだろ?

  • by Anonymous Coward on 2021年03月23日 6時54分 (#3999211)

    アメリカは移民の国という事情のおかげで発声によるコミュニケーションスキルのレベルが高い。文法的に正しく、論理的に、文脈に分かりやすく沿って喋らないやつはダメとはっきり教え込まれてる。そんな人間の発声なら機械学習アルゴリズムはかなりの確率で正確な文字起こしができる。

    ところが日本人ときたら、なにがなんだか。雑談程度ならまだしも、カメラを向けられるとまるで白痴。理論らしいものが吹き飛んで文法もめちゃくちゃ。滑舌はとうぜん悪く、余計なエーアーウーといちいち挟んで、こんなのをアルゴリズムが処理できるようになるとはまったく思えない。

    • by Anonymous Coward

      カメラを向けられるとまるで白痴。理論らしいものが吹き飛んで文法もめちゃくちゃ。滑舌はとうぜん悪く、余計なエーアーウーといちいち挟んで、こんなのをアルゴリズムが処理できるようになるとはまったく思えない。

      国の見本たるお上の答弁がアレですからねぇ

      /*
      正しい日本語としての上位者へのお願いの仕方
      ~お醤油を取っていただきたい編~

      ×:お醤油をっとっていただけますでしょうか?
      ×:お醤油をお貸しいただけますでしょうか?
      ○:あのぉ、、、お醤油、、、

      上位者にお願いをすること自体が不遜であり
      上位者に暗に気づいてもらい上位者から賜るようにする
      というのが正しい日本語なのですからどうにもならんでしょう
      */

typodupeerror

物事のやり方は一つではない -- Perlな人

読み込み中...