最近,Google Brain 开发出一款新软件“zoom,enhance!”,能够将像素较低的粗糙画面或马赛克变成实际影像,据称这一软件将服务于执法(如在模糊影像中分析犯罪嫌疑人的面部)。
如下图所示,左边为 ※※※ 测试影像,中间是软件运算后输出的 32x32 清晰版,最右是 Ground truth 真实标准,即 AI 学习时的标准影像。那么这个软件到底是如何“无中生有”的呢?其实它是通过人工神经网络技术来进行对比运算,利用两套人工神经网络 Conditioning network 与 Prior network 分别对图片进行处理。一个将网络中的大尺寸图片缩小至 ※※※ 像素进行对比,另一个则负责分析输入的影像。
因此在运算时只是基于参考大量图片后,扩展额外的细节,最后输出,因此并不代表运算影像就是最终的真实照片。
运算过程:
据报道,Google Brain 的新技术在实际测试中相当成功。当把计算出的图像和真实照片比对时,有 10% 的测试者猜错了,而卧室照片有 28% 的人被运算图像欺骗(如达到 50% 则表示影像无法区分真假)。
其他运算照片:
但实际上,要运算出人脸是相对困难的。相比于静物,人脸的细微特征更难以“估算”,因此正如上图所示,容易出现较多运算失败的例子。也正因如此,尽管这一软件的概念十分有趣,但如果真的想用于执法,以目前技术来看绝对会抓错人。但对于摄影师而言,或许可以拯救一张小尺寸照片。
完整论文的地址为:Pixel Recursive Super Resolution