風景写真を入力、その中を飛行する動画をAIで生成する技術をGoogleが開発 3
ストーリー by nagazou
処理重そう 部門より
処理重そう 部門より
Googleは、静止画写真をAIを使用して3Dモデル化し、視聴者がその写真の中に「飛び込む」ことができるプログラムを開発したという。しかし、写真を3D化する場合、写真の見えない領域など、静止写真では提供されない情報を入力する必要がある。今回の技術では、DALL-E 2 AIを用いた「Inpainting」という手法を用いることでそこにあると思われるものをシミュレートしているという(PetaPixel)。
同様に写真の中に飛び込んだときの飛行効果を得るため、AIは写真の外側にある物体を生成する必要がある。この生成には「Outpainting」と呼ばれる手法で対処しているという。これはAIが元の写真に基づいて元の画像を拡張して、任意の縦横比でより大きな画像を作成するというものとなっている。また奥行きを出すために写真を拡大すると画像がぼけてしまうが、その対策としてはAIがノイズの多いピクセル化された画像を鮮明な画像に合成する超解像技術を用いて対策しているという。
同様に写真の中に飛び込んだときの飛行効果を得るため、AIは写真の外側にある物体を生成する必要がある。この生成には「Outpainting」と呼ばれる手法で対処しているという。これはAIが元の写真に基づいて元の画像を拡張して、任意の縦横比でより大きな画像を作成するというものとなっている。また奥行きを出すために写真を拡大すると画像がぼけてしまうが、その対策としてはAIがノイズの多いピクセル化された画像を鮮明な画像に合成する超解像技術を用いて対策しているという。
時間軸の連続性がない (スコア:0)
ように見える。
動画のフレーム単位で見るとそこまで不自然ではないのだが、動画で見ると山のアウトラインがもこもこ動いて気持ち悪い。
まあいずれ解決される問題だとは思う。
入れ替わったり恋(主にツンデレ)がはじまったり (スコア:0)
パンをくわえて走ってる写真
見えない曲がり角の先にAIは何を見る?
グリッチして遠景の空歩けるテレビゲームありましたね (スコア:0)
サガフロンティアのヨークランドで