パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

Google発のJPEGエンコーダー「Guetzli 1.0」リリース」記事へのコメント

  • by Anonymous Coward on 2017年03月22日 19時51分 (#3180669)

    雑なピクセル比較で品質を評価してGuetzliをディスってたせい、かつ投稿者もスルースキル無くて半炎上状態にあるな。

    • by Anonymous Coward on 2017年03月22日 20時30分 (#3180687)

      とはいえ擁護派もあんまり説得的じゃない感じ。
      「Google様の考えたButteraugliアルゴリズムでよいスコアになるようなエンコーダーなんだから、
      それで評価しないのは筋違いだー」って批判してるんだけど、そのButteraugliアルゴリズムがどういうものかは
      擁護派も理解していないという。

      この論評 [qiita.com]によると、

      ソースコードをのぞくと結構な数のマジックナンバー(定数値)が散りばめられており、それらの値をどうやって決めたのか/なぜその値が妥当なのかという説明を見つけられませんでした。

      「俺が考えた最強のアルゴリズム実装してみた」感が拭えず、もう少し情報がほしいなと思う次第です。

      だそうで。

      親コメント
      • by Anonymous Coward

        機械学習ってマジックナンバーの塊だよ

        定量評価したいなら PSNR くらいしかないが(ほかにあるなら教えて)、
        結局は画像コーデックはNを稼いだ官能評価しかないんじゃないかと思うんだが。

        • by Anonymous Coward

          まあ思考停止するのは自由だけど、このGuetzliはその官能評価とやらをどれだけやってるのかね。

          擁護している人たちの根拠は何? と考えると、結局Googleブランドにころっとまいってるだけじゃないかと思える。

          • by Anonymous Coward on 2017年03月23日 1時41分 (#3180867)

            「ニューラルネットワークは気味が悪い」というのは共通認識ではあるらしい。

            要するに、適切かどうかわからないネットワークを構築し、十分に代表的であることを祈るしかない画像でトレーニングし、うまく機能する理由または重大な間違いが生じる理由は正確にはわからない、ということです。優秀なエンジニアがどうしてこんなことができるでしょうか。

            研究者やますます多くのエンベデッド・システム開発者がわざわざこんな苦労をする理由は簡単です。それは CNN がうまく機能することにほかなりません。トレーニング結果は、概して実際の結果を予測しています。また、CNN は標準的な物体認識および分類問題において、その他のアルゴリズムを上回る性能を一貫して示しており、物体のサイズ、位置、および照明の変化に比較的反応しにくいという特長もあります。さらに、Google とスタンフォード大学の研究者らが最近発表した論文によれば、異なる CNN のクラスタは、画像内の物体の分類だけでなく、画像内の状況を説明するキャプションの記述にも高度な正確性を示すことが明らかになっています。現在、そこまで到達している既知のアルゴリズムは他にありません。

            http://systemdesign.altera.co.jp/can-you-see-using-convolutional-neura... [altera.co.jp]

            親コメント
            • by Anonymous Coward

              Alpha Goのアルゴリズムの詳細を人間が人間に説明できるわけがないと思うんですけど。
              説明できなきゃ気がすまないならAIは絶対に人間を超えられない。

          • by Anonymous Coward

            まあ何が思考停止なんだかよくわからんが、この技術の擁護者は自分の官能性を信じたんだろう?
            もはや誰もとがめることはできないと思うんだが。

            なんつーか、なんでもGoogleだと噛みつくの、やめね?

        • by Anonymous Coward

          画像を見て、息子に評価させるのですね。
          最大角度を100として…。

          え、いかに官能的かを評価するのですよね? ね?

      • by Anonymous Coward
        元ネタのコメントでブロックノイズの評価をしていた点は結構良かったと思いました。
        JPEGの粗悪なエンコーダで圧縮するとブロックノイズが出てしまって見るに堪えないです。
        • by Anonymous Coward

          しかしそのブロックのイズの言及はアップミスにより
          Qiitaが再エンコードをしてしまった結果という……
          再エンコードされて無いやつには同様の言及は今のところ無いね。

          結局100倍時間をかけた効果は
          オレオレ評価プログラムの中にしか無いという感じ。

          炎上したというQiitaの記事の「現時点では使い物にならん」というのは事実だろう。
          技術的なデモンストレーションで実用化には時間を要するみたいな感じで。

普通のやつらの下を行け -- バッドノウハウ専門家

処理中...