| | | 2017年01月14日 星期六
5
经济观察

告别“关键词”,搜索2.0时代来了

有图有线索


    无论是图片、物体,还是地理位置,对可视化搜索来说,都不再依赖于键盘来输入文字,而是将真实的物理世界信息转化为互联网信息,而转化的媒介———摄像头将是移动互联网时代的又一个入口。

    ■尤歆飞

    李靖至今还记得第一次使用搜索引擎的震撼感觉。

    那是在2002年,当时还在复旦读研的她,在谷歌上输入自己的名字之后,竟然能找到自己以前在报社实习时写的所有署名稿件;输入自己研究生导师的名字,屏幕上跳出的是他历年发表的各种文章,以及别人引用到他论文、观点的文章列表……

    十多年后,李靖带着儿子在旧金山旅游。在朋友帮助下安装、使用“Alice Who”之后的那几分钟里,这款搜索软件让她有了当年刚刚开始用谷歌的感受。“Alice Who”是一家美国创业公司开发图像搜索App,只要使用者将手机摄像头对准某一栋建筑或某一家餐厅,它就会告诉你这是什么地方,或是这家餐厅叫什么名字。如果你需要,它还能让你一键转入Yelp ( 美 国 版 的 大 众 点 评 )、FourSquare (基于地理位置的社交软件),让人们了解餐厅的详细信息和食客的评价……

    以谷歌为代表的搜索引擎技术已经推出十多年,期间这项技术尽管不断升级完善,但至今尚未出现革命性的变化,包括“Alice Who”在内的“可视化搜索”技术的发展和应用探索,被认为有机会成为搜索领域的下一 个引爆点。谷歌、微软必应(Bing)、Pinterest等互联网大鳄已经将“可视化搜索”作为重点战略去开拓,搜索的“2.0时代”已经到来。

    巨头布局“可视化搜索”

    “可视化搜索”不是新鲜名词。早在2008年,TinEye第一次推出基于图像定位技术的图片搜索引擎;在2010年,谷 歌 推 出 一 款 名 为“Goggles”的App,能够让用户以手机拍照的方式,不用输入关键词就可以进行搜索。

    打开“Goggles”应用,就会开启拍照模式,取景之后按拍摄键,相机自动对焦并且拍摄照片,之后程序就会分析照片里面的成分,并且在谷歌上面搜寻。如果拍的是景点照片,搜寻出来的就是这个景点的名称与地点:搜寻书本的话,可以告诉人们什么书;不过它也有些限制,例如拍摄动物、家具、服饰之类的东西,就不能搜到了。

    近两年,可视化搜索有了进一步的突破。2012年,图片社交网站Pinterest以黑马姿态红遍全球后,顺势推出了可视化搜索引擎Guided Search,只要点一下图片中的搜索工具,在任何想要买的东西周围画一个框,比如一盏灯、一双鞋或者一件上衣,然后Pinterest运用深度学习图像技术,搜索出与这个图片相似的产品,找到那些相关电商的链接。这一“搜索+推荐”功能更贴近网络消费的需求,也引领了一阵新的消费潮流。

    当然,谷歌和微软两大互联网巨头,似乎不甘让后生抢尽风头。在微软必应 (Bing) 搜索将可视化搜索技术植入智能手机App之后,谷歌也宣布,收购机器学习技术开发商Moodstocks。Moodstocks 是一家图像识别技术公司,推出了智能手机 图像识别应用程序 Moodstocks Notes,它可通过照片识别书籍、CD、海报、传单和酒标等对象。下载该应用程序后,对准照片扫描,用户就可以浏览其他人对该商品的说明及评论。

    可以预见的是,随着技术的发展,未来基于“可视化搜索”的功能将会越来越强大,衍生的服务和应用也会越来越精彩纷呈。

    趣味功能背后的“黑科技”

    “可视化搜索”这项有趣而实用的功能,背后的技术可不简单。

    博云视觉是国内一家专注于视觉搜索与分析技术研究和应用的科技创新公司。其副总裁冯栋介绍说,可视化搜索在原理上和人们之间确认图片是一样的,核心技术是基于人类底层生物视觉特征,借助计算机从包括像素矩阵、颜色、纹理、梯度、形状、光照等多个维度对图片提取出近千乃至上万个特征点;然后,对关键特征点进行筛选过滤、编码压缩及高性能索引;如果两张图片中的“特征点”大多匹配成功,即可高概率地认为两张图片是一样的。

    对于相对复杂的实景或实物视觉搜索,则需要涉及到“计算机识图”的功能,随着计算机视觉技术的发展,人们开发了不同的手段来帮助机器“认识”物体。大部分技术是基于同一基础的,那就是点状云 ( Point Cloud)。它们通过3D扫描物体,构建点状云,然后用点状云训练机器的算法,让机器能够辨识出这个物体。然而,这种标准的技术,在室内识别物体、人脸较为准确,却不擅长识别户外建筑;在户外,随着光线的变化,不但建筑反光的颜色和强度会变化,阴影会变化,建筑物周围的行人、停靠的车辆,也会影响机器对其的识别。如文章开始提到的“Alice Who”这款应用,在识别精度上仍处于不断发展和完善的过程中。

    可视化搜索应用前景广阔

    可视化搜索不仅可以用来寻找相似图片,了解图片中物品的名称和功能,一旦这种搜索能力和社交网络、电子商务以及数以万计的App结合起来,就会产生强大的化学作用。

    可视化搜索和电商的融合,可以帮助用户快速找到他们所需要的商品。对于商家而言,这是莫大的福音;而用户也可以获得便利,快速找到“明星同款”产品。譬如,如果有人对某位明星的外衣或手袋感兴趣,只需用手机扫一扫明星的照片,就能获得该商品的品牌、价格及相关销售方的信息。最近,eBay以3000万美元收购视觉搜索引擎Corrigon,旨在抢占可视化搜索的风口。eBay表示,Corrigon的技术可以帮助消费者找到与图片上物品最相似的商品,以此使他们相信自己所购买的商品就是看到的那个。

    在社交领域,可视化搜索也会有突出表现。在我们拍摄自己的照片上传后,可以看见社交网络中其他用户的相似图片。通过这种相似的图片建立起话题式讨论也是不错的尝试。

    如果能将基于拍摄功能的可视化搜索和近来较火的语音搜索相结合,又会碰撞出新的火花。谷歌最新展示的“语音助手”服务,就非常类似所描述的这种功能,软件通过调用系统内更多的权限可实现更加智能化的信息展示,它读取用户社交网络的信息,可以为用户提供导航、社交网络评价等内容信息,所有的内容都更加立体并贴近真实的用户体验。

    此外,可视化搜索在国防安全领域和时尚领域也大有可为。通过“以图搜图”或实物视觉搜索,可以帮助有关部门在海量的监控素材中,快速寻找到目标 (嫌疑人) 的踪迹;在时尚领域,当计算机能够“认识”图片之后,就能在很短时间内浏览海量的图片,引导并帮助人们的时尚消费决策,让普通人摇身变成“时尚大咖”。这将大幅改变时尚产业格局。

    无论是图片、物体,还是地理位置,对可视化搜索来说,都不再依赖于键盘来输入文字,而是将真实的物理世界信息转化为互联网信息,而转化的媒介———摄像头将是移动互联网时代的又一个入口,就像PC时代的搜索框一样。现在,视觉搜索的入口已成为将产品与用户关联起来的更加便捷的一条通道,占据着这条通道,也将意味着巨大的广告和商业价值。插图:宗怡婷

    “以声搜声”应用刚起步

    如今,我们已经习惯于用声音来搜索各类信息,譬如说苹果手机中的Siri功能,不仅可以用来搜索资料、操控智能家电、还能实现对话式的问答。然而,用声音来搜索声音的应用却刚刚起步。

    Midomi是一个搜索音乐的网站。只要将外部的 乐 曲 录下播放给Midomi听,或者直接在它面前哼唱几句,它就能“读懂”这段音乐,并且告诉你歌曲的名字,专辑名称和作者。

    用声音来搜索信息已不具备太大难度,然而只以“声音”作为搜索的目标,范围却相对狭隘。这也是“以声搜声”应用和服务较少的原因之一。

    四款当红搜图App

    在超市里选食品

    PhooDi是一款在超市里帮助你选择食品的手机应用。打开PhooDi,对准商品进行扫描,就能了解到这款食品的营养成分、出厂信息、更多食用方法等信息,甚至得到这个商品的促销券。

    百科助手

    Junaio也是一款实景增强现实移动浏览器。用户可以扫描:图片、条形码等,然后通过Junaio获得自己需要的信息,大到一本畅销书的作者背景,小到一瓶红酒的产地和生产者的个人资料。

    买对家具

    BaIlard Designs是一家古典风范的家居生活用品网站,该品牌推出了家居用品目录,还与技术公司合作,推出图像搜索手机应用软件。下载这个应用,选择购物图片上的商品,就能呈现这个商品的全景效果。

    找到你要的图片

    TinEye是一家加拿大技术公司研发的相似图片搜索引擎,输入本地硬盘上的图片或者输入图片网址,即可自动帮你搜索相似图片。TinEye主要用途包括:发现图片的来源与相关信息、追踪图片信息在互联网的传播、找到高分辨率版本的图片、找到有你照片的网页等。

上海报业集团 版权所有