首页器材频道动态 > 智能选图生成描述 Google推出caption技术

智能选图生成描述 Google推出caption技术

Google

编译

kiwi

2014-11-20

　　摄影师除了要苦恼如何把作品拍好，还要为如何管理大量照片而烦恼。每次拍完一大堆照片，回去要后期之外，还要在相片管理软件内，把照片分类、存档。如果要进一步方便以后搜寻照片，更要为每张照片加上关键字和照片描述，这些整理的工作都大大加重了摄影师的工作负荷。Google Research之前已经发布了一项新技术，可以侦测相片中的物件和所在场所，加强图片搜寻的功能，将来或者也可以减轻摄影师为照片加上关键字的工作负担。最近，Google Research再度发布正在开发的新技术，声称能侦察图片，再为图片作出文字描述。

　　类似“A person riding a motorcycle on a dirt road”、“A herd of elephants walking across a dry grass field”的相片描述，正是由Google Research开发的技术自动生成出来的。新技术结合了计算机视觉技术（computer vision）和自然语言处理（natural language processing），先以卷积神经网络（Convolutional Neural Network，CNN）技术对影像进行分析，提取影像中的信息，再由递归神经网络（Recurrent Neural Network，RNN）产生文字。这技术不单可以辨认相片中的物件，更可侦察相片的场景，再产生合乎语境的文宇描述。