パスワードを忘れた? アカウント作成
13203459 story
Google

Google発のJPEGエンコーダー「Guetzli 1.0」リリース 50

ストーリー by hylom
まだ改善の余地があったのか 部門より
maia 曰く、

Googleが3月15日、新たなJPEGエンコーダー「Guetzli」をリリースした(Google Research BlogQiitaEngadget JapaneseOSDN Magazine)。

Guetzli(グエツリ)はスイスドイツ語でクッキー)という意味。圧縮率の改善に取り組むJPEGエンコーダーは他にもあるが、Guetzliの性能やいかに。色々説があるみたいで……。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2017年03月22日 20時03分 (#3180675)

    リンク先のGoogle Research Blogのリンク [arxiv.org]から。

    23人の被験者に対して、31枚の画像でlibjpegによる圧縮と比較した結果、75%の被験者がGuetzliを好ましいと評価したらしい。

  • by Anonymous Coward on 2017年03月22日 23時34分 (#3180806)

    にGuetzli試すつもりだったけど、コマンド打つのが面倒。
    探してたらツール [autistici.org](jpegtran_do_plus)を見つけました。参考までに。

    なお、Guetzliをデジカメの画像に試してみたら、40-50%ぐらいサイズが小さくなっていい感じに。
    処理速度が遅いのが課題か。

  • by Anonymous Coward on 2017年03月22日 19時35分 (#3180664)

    エンコード時間が1枚10秒↑だったりしてちょっと使いにくい

    • by Anonymous Coward on 2017年03月23日 1時17分 (#3180859)

      LZMAと同じように、圧縮よりも配布・伸長が多いケースで重宝すると思われます(画質が同じと仮定)。

      # 以下、アレです。
      なぜ既存の方式よりさらに35%も圧縮できるか。スカートの内側やシャツの中の下着、さらにその中など、
      通常では表示されない部分のデータを大胆に削除しているからなのです。まさしくハリボテなのです。

      3Dだと回転させればすぐにばれるところを、回転方向に制限のある2Dの特徴を活かした今回の方式、
      さすがGoogleという感じです。

      親コメント
      • by Anonymous Coward

        それでは既存のエンコーダーは見えないところにある男の夢もデータとしては持っているって事か?
        ちょっとデータ解析して来る。

      • by Anonymous Coward

        と、いうことは、既存の方式とこの方式の差分をとれば・・・!?

    • by Anonymous Coward on 2017年03月23日 1時49分 (#3180872)

      どこにコメント付けるか悩みましたが。

      https://arxiv.org/abs/1703.04421 [arxiv.org]
      グーグル先生による論文の要旨(abstract)翻訳

      Guetzliは、他の一般的なJPEGエンコーダよりも低いビットレートで視覚的に区別できない画像を生成することを目指す新しいJPEGエンコーダです。クローズドループオプティマイザを使用して、各JPEGブロック内のJPEGグローバル量子化テーブルとDCT係数値の両方を最適化します。Guetzliは、我々の知覚距離測定基準であるButteraugliを最適化プロセスのフィードバック源として使用しています。Butteraugliによると、私たちが試した他の圧縮機と比較して、知覚距離のデータサイズが29〜45%減少しています。Guetzliの計算は現在非常に遅く、静的コンテンツを圧縮することの適用範囲が限定されており、先進的な心理感覚モデルと損失圧縮技術を組み合わせることでサイズの大幅な縮小を達成できるという概念の証明となります。

      「Guetzliの計算は現在非常に遅く」はhttps://github.com/google/guetzli#using [github.com]によると入力画像1MPixに対してCPU時間1分+300MBのメモリを使用するとのこと。

      親コメント
    • by Anonymous Coward

      バッチ回してエロサイト見てれば終わるよ

      # さあwaifu2x caffeと組み合わせるのじゃ

      • by Anonymous Coward on 2017年03月23日 0時15分 (#3180828)

        10秒だと、カメラなんかが困るんだろうけど。

        親コメント
        • 撮影時の保存はrawでいいんじゃない?

          親コメント
          • by Anonymous Coward

            シャッター押した瞬間はそれでいいんだろうけど、写真をアップロードしたり、メールで送ったりする時に、10秒ってのはヤバイ気がする。スマホとかだと、計算量自体からくる性能への影響や、電池の消費量も問題になるだろうし。

        • by Anonymous Coward

          初めて買ったデジカメのPowershot 350は1枚あたり7~8秒かかってたな。
          JPEG圧縮が遅いのか、CFへの記録が遅いのかわからんけど。

    • by Anonymous Coward

      四半世紀前なら普通のJPEG圧縮で1枚1分以上かかってたんだし、
      それを思えばなんてことないでしょう。どうせそのうち改善される。

      • by Anonymous Coward

        四半世紀前はCPUの性能が1年で2倍ぐらいに上がっていた。
        かつマルチメディア処理用ハードウェアアクセラレーションなんてものも、まだなかったころの話。

        プロセッサの性能向上が頭打ちになって久しい昨今、また今回のような特殊な処理用に
        ハードウェアアクセラレーションが用意されるとも思えないので、昔の「普通のJPEG圧縮」
        が経たような目覚ましい圧縮処理の時間短縮は望めないだろう。

        • by Anonymous Coward

          Radeon「たかが16スレッドとは笑えるな」

          そこまで厳密にやらなければ並列処理化で結構早くなるはず

        • by Anonymous Coward

          JPEG圧縮/伸張拡張ボードがあったの思い出しましたよ。
          CバスだったかISAバスだったか。
          CPU性能上がって消えたようですが、今ならFPGAで専用回路作るかな。

          思うに、AI用のアクセラレーション回路を積んだコプロセッサみたいなの、今後出てくるんじゃないでしょうかね。
          最初はGPGPUとかでソフトウェア動作としても、将来的にAIの計算方法の方向性が確立したなら、専用のプロセッサになってもおかしくない。
          FPGAみたいなもの使って、動的に回路の最適化をするようなのも出てくるだろうし。

          だから、めざましい進歩は望めない、とか絶望するのは早計じゃないかと思うのです。

          • by Anonymous Coward

            FPU入れたら、一晩かかってたレイトレの計算が1時間で終わって笑いがこみ上げたの思い出したました。

            それまでは、専用回路でもたいして変わらんだろとか思ってたんですよね。
            ソフトウェアで代用できる程度の違いだろ? と。まさかあそこまで変わるとは。

  • ソフトバンク回線 (スコア:0, すばらしい洞察)

    by Anonymous Coward on 2017年03月22日 19時48分 (#3180668)

    わざわざ画質を下げてサイズを大きくする「最適化」がますます捗りそう

    • by Anonymous Coward

      画質を下げた後には復元 [it.srad.jp]すればOK!

    • by Anonymous Coward

      > わざわざ画質を下げてサイズを大きくする

      「サイズを小さくする」じゃなくて? 何を言ってるのかわからん。

      • by Anonymous Coward

        「通信の最適化」によって、容量が増えることも [srad.jp]

        でも元画像の圧縮が甘くて容量が大きくても、今ならその分通信量上限に早く到達するだけで、キャリアが頑張る必要性は薄いですよね。
        今の回線速度ならそれに対応する機材を投入する方がコストがかかる気がします。

        • by Anonymous Coward

          > 今ならその分通信量上限に早く到達するだけで

          二段階通信料の契約者の場合単純に水増し請求できる(される)という結果になる
          また、本来は格安SIMで十分な人に対して本来よりも通信量が多いように錯覚させれば格安SIMへの移行の阻止にもなる

        • by Anonymous Coward

          > でも元画像の圧縮が甘くて容量が大きくても、今ならその分通信量上限に早く到達するだけで、キャリアが頑張る必要性は薄いですよね。

          キャリアにしてみれば、通信量を圧縮できれば、空いた分に他のトラフィックを詰めて収容効率を上げられるので意味がある。

  • by Anonymous Coward on 2017年03月22日 19時51分 (#3180669)

    雑なピクセル比較で品質を評価してGuetzliをディスってたせい、かつ投稿者もスルースキル無くて半炎上状態にあるな。

    • by Anonymous Coward on 2017年03月22日 20時30分 (#3180687)

      とはいえ擁護派もあんまり説得的じゃない感じ。
      「Google様の考えたButteraugliアルゴリズムでよいスコアになるようなエンコーダーなんだから、
      それで評価しないのは筋違いだー」って批判してるんだけど、そのButteraugliアルゴリズムがどういうものかは
      擁護派も理解していないという。

      この論評 [qiita.com]によると、

      ソースコードをのぞくと結構な数のマジックナンバー(定数値)が散りばめられており、それらの値をどうやって決めたのか/なぜその値が妥当なのかという説明を見つけられませんでした。

      「俺が考えた最強のアルゴリズム実装してみた」感が拭えず、もう少し情報がほしいなと思う次第です。

      だそうで。

      親コメント
      • by Anonymous Coward

        機械学習ってマジックナンバーの塊だよ

        定量評価したいなら PSNR くらいしかないが(ほかにあるなら教えて)、
        結局は画像コーデックはNを稼いだ官能評価しかないんじゃないかと思うんだが。

        • by Anonymous Coward

          まあ思考停止するのは自由だけど、このGuetzliはその官能評価とやらをどれだけやってるのかね。

          擁護している人たちの根拠は何? と考えると、結局Googleブランドにころっとまいってるだけじゃないかと思える。

          • by Anonymous Coward on 2017年03月23日 1時41分 (#3180867)

            「ニューラルネットワークは気味が悪い」というのは共通認識ではあるらしい。

            要するに、適切かどうかわからないネットワークを構築し、十分に代表的であることを祈るしかない画像でトレーニングし、うまく機能する理由または重大な間違いが生じる理由は正確にはわからない、ということです。優秀なエンジニアがどうしてこんなことができるでしょうか。

            研究者やますます多くのエンベデッド・システム開発者がわざわざこんな苦労をする理由は簡単です。それは CNN がうまく機能することにほかなりません。トレーニング結果は、概して実際の結果を予測しています。また、CNN は標準的な物体認識および分類問題において、その他のアルゴリズムを上回る性能を一貫して示しており、物体のサイズ、位置、および照明の変化に比較的反応しにくいという特長もあります。さらに、Google とスタンフォード大学の研究者らが最近発表した論文によれば、異なる CNN のクラスタは、画像内の物体の分類だけでなく、画像内の状況を説明するキャプションの記述にも高度な正確性を示すことが明らかになっています。現在、そこまで到達している既知のアルゴリズムは他にありません。

            http://systemdesign.altera.co.jp/can-you-see-using-convolutional-neura... [altera.co.jp]

            親コメント
            • by Anonymous Coward

              Alpha Goのアルゴリズムの詳細を人間が人間に説明できるわけがないと思うんですけど。
              説明できなきゃ気がすまないならAIは絶対に人間を超えられない。

          • by Anonymous Coward

            まあ何が思考停止なんだかよくわからんが、この技術の擁護者は自分の官能性を信じたんだろう?
            もはや誰もとがめることはできないと思うんだが。

            なんつーか、なんでもGoogleだと噛みつくの、やめね?

        • by Anonymous Coward

          画像を見て、息子に評価させるのですね。
          最大角度を100として…。

          え、いかに官能的かを評価するのですよね? ね?

      • by Anonymous Coward
        元ネタのコメントでブロックノイズの評価をしていた点は結構良かったと思いました。
        JPEGの粗悪なエンコーダで圧縮するとブロックノイズが出てしまって見るに堪えないです。
        • by Anonymous Coward

          しかしそのブロックのイズの言及はアップミスにより
          Qiitaが再エンコードをしてしまった結果という……
          再エンコードされて無いやつには同様の言及は今のところ無いね。

          結局100倍時間をかけた効果は
          オレオレ評価プログラムの中にしか無いという感じ。

          炎上したというQiitaの記事の「現時点では使い物にならん」というのは事実だろう。
          技術的なデモンストレーションで実用化には時間を要するみたいな感じで。

  • by Anonymous Coward on 2017年03月22日 20時54分 (#3180702)

    生産(圧縮)効率上げるには、おばあちゃんが有能なのです。
    鉱山(金脈)?。当ててみたいものですねぇ。

  • by Anonymous Coward on 2017年03月22日 21時19分 (#3180722)

    このやる気のない本文は何なの?

  • by Anonymous Coward on 2017年03月22日 21時59分 (#3180744)

    mozillaの圧縮はどうなった

typodupeerror

目玉の数さえ十分あれば、どんなバグも深刻ではない -- Eric Raymond

読み込み中...