Google Brain 開發了一個新軟件「zoom, enhance!」,能夠把像素極不清晰的畫面或馬賽克變成實在的影像,不知道到底應該說是對執法有好處(例如從模糊影像中分析犯人的臉),還是一件可怕的發明了。

如下圖所示,左邊是 8 x 8 的測試影像,中間是軟件運算出 32 x 32 清晰版,最右是 Ground truth 真實標準,即 AI 學習時的標準影像。那麼這個軟件到底是如何「無中生有」呢?其實他是通過人工神經網絡技術來進行運算,他們利用兩套人工神經網絡 Conditioning network 與 Prior network 分別對圖片進行處理。一個會將網絡上的高解像度圖片縮成 8×8 像素進行比對;另一個就負責分析輸入的影像。

因此在運算時只是基於參考大量圖像後,想像在額外細節、然後生成最終影像,因此並不代表運算影像就是真實的照片。

運算過程:

根據報導,Google Brain 的新技術在實際測試中相當成功。當把計算出來的圖像和真實的照片拿出來時時,有一成人會猜錯前者才是真實影像。而臥室圖像方面就有 28% 的人被運算圖像欺騙。(如果分數達 50% 側表示影像無法分真假)

其他運數照片:

而實際上,要運算出人臉是相當困難的,因為他們比起靜物風景等有更多細微特徵,因此像上圖那樣,會出現很多運算失敗的例子。有網民就指,雖然這個軟件的概念有趣,但卻真的想用來執法,以目前技術來看絕對會抓錯人。不過對於攝影師來說,或者是一個可以拯救誤縮照片的程式?

完整的論文可見:Pixel Recursive Super Resolution

via arstechnica