日期选择 logo

2020-08-02 第26,579号

上海报业集团主管主办·文汇报社出版

newspaper
第4版:圆桌论坛

解码人工智能新趋势

       ■本报首席记者 张懿
      
       人工智能(AI)是当下最具颠覆性和革命性意义的新技术新方向,将对经济社会发展带来广泛而深刻的影响,特别是赋能传统行业,助力经济高质量发展和转型提升。当下,人工智能正在与以脑科学为代表的生命科学,以5G、物联网(IOT)等为代表的新一代信息技术交叉融合,催生出一系列新风口。本期“文汇—复旦管理学家圆桌谈”特别邀请相关领域专家与企业家,就人工智能发展的新趋势进行解读。
      
       从生物脑到人工脑
      
       脑科学和类脑科学能真正给我们带来下一代人工智能,进而为产业带来巨大的革命性变化。
      
       冯建峰
      
       上海数学中心首席教授,复旦大学类脑智能科学与技术研究院院长
      
       学界将大脑称为科学最后的堡垒。人类能够上天入地,潜下深海,但对于大脑还知之甚少。从2013年开始,欧盟、美国投入巨资研究大脑,中国脑计划预计今年能启动,核心问题就是想弄清楚大脑到底是怎么工作的。实际上人工智能研究所有的原创性想法,都来自于对大脑的研究。我们希望,脑科学和类脑科学能真正给我们带来下一代人工智能,进而为产业带来巨大的革命性变化。
      
       上海目前参与脑与类脑研究中心的包括本市各所高校、中国科学院上海分院,以及长三角地区的一些高校。复旦大学一直有个信念,想推进“ABC脑”的研究,A就是Artificial Brain(人工脑),B脑就是Biological Brain(生物脑),另外,要有智能,只靠个体的大脑也不行,所以还有C脑Collective Brain(群体脑)。我们希望通过类脑智能的研究引领人工智能研究。为了发展下一代人工智能,人脑是最好的老师。
      
       生物脑
      
       我们先从生物脑说起。人的大脑平均有864亿个的神经元,每个神经元还和另外超过一千个单元有连接。为了研究如此复杂的大脑,我们使用了很多数学方法,来研究大脑到底是如何工作的。
      
       复旦大学在张江拥有亚洲最先进的国际脑影像中心,其中有几台先进的核磁共振仪器,可以观察大脑到底是怎么活动的。我们可以观察受试者的梦境,看见他的梦境中出现的是男是女,是讲英语还是中文,还能知道他在想什么。
      
       除了“读心”,通过这样的仪器,我们还想理解大脑是怎么工作的。前些年,通过核磁研究了一些受抑郁症困扰的人。发现普通人脑里有一个网络,它负责憎恨,但抑郁症病人这个区域的连接却变弱甚至消失了,这表明,人需要有正向的情绪,但同时也需要负向情绪,只有两者达到平衡人才能保持健康。在这之后,我们针对正向和负向情绪之间的平衡展开了进一步的研究,从而找到了抑郁症的病根。一个加拿大团队选择了我们找到的靶点,不用药物干扰,就能降低抑郁症病人50%的症状,难治型病人可以降低30%的病症。我们很高兴,通过看到大脑到底是怎么工作的,发现大脑治疗的一些方法。
      
       我们还针对烟酒、寿命、运动、语言、睡眠等对大脑的影响,开展了一系列研究,形成了一些有趣的发现。总体上,对生物脑的研究现在非常热门。
      
       人工脑
      
       再来看看生物脑跟人工脑怎么连接?事实上,今天的深度学习,主要是模拟人脑视觉系统的识别过程,但人的高级智能,很多并没有包含在今天的人工智能模型和深度学习算法中。由此,包括谷歌的DeepMind在内,世界上很多公司希望像拼积木一样,继视觉系统之后,再将大脑中的情感、听觉、触觉等网络,慢慢拼出来并组装成大脑,从而形成比今天的人工智能更智能化的系统。
      
       人脑最大的两块“积木”是左右半脑。我们知道右脑主要是处理一些低频的信号,左脑是处理高频的信号。我们复旦大学的团队就利用人工神经网络和深度学习方法打造了左右脑的深度学习网络,可以根据人的步态来进行身份识别。去年,它的步态识别精确度已经达到了95%;在步态的基础上,加入语音、表情等信息,就可以用来识别抑郁症患者。
      
       现在还有另外一种思路,就是我们能不能不要一步步地拼积木,而是用计算机和数学方法,把大脑一下子搭出来?这是欧盟脑计划的主要目标,也是我们团队的工作计划。我们想通过数学方法,利用世界上最大的计算机集群,搭一个1000亿个神经元的脑网络。有了这个人工脑,下一步就可以给它接上眼睛、耳朵、双手,使得它能跟环境互动。我们目前正在搭建这个全脑计算的软硬件平台。
      
       今天的人工智能的确给我们带来了很多变化,但目前深度学习只是学了人脑信息处理机制中非常初级的一步,我们才刚刚开始,距离真正的通用智能还有非常长的路要走。人工智能之父——艾伦·图灵的梦想是让机器也能和人一样思考。计算机之父、数学家冯·诺依曼的设计,构成了当今计算机的主流架构,将信息处理与存储分开,但人脑并非如此。冯·诺依曼去世后留下了一本没有写完的书——《计算机与人脑》。我们的类脑人工智能研究,就是希望借鉴人脑处理信息的方式,通过硬件、软件或算法等方法去再现这种处理信息的方式,我们希望能够把冯·诺依曼的这本书再续一章。
      
       视觉互联网,破晓时分
      
       如果以断代史的方式来看互联网,上一代是图文的互联网,到了5G时代,视频将迎来大发展。
      
       田丰
      
       商汤智能产业研究院院长、阿里云研究院创始院长
      
       疫情期间,大家无论是工作还是生活,大量时间都是在消费视频,用钉钉开会、看网络新闻、玩电子游戏,包括在线问诊、在线教育、停课不停学等,都是视频。未来我们将迎来视觉互联网时代,除了to C,还有大量to B的应用。
      
       如果以断代史的方式来看互联网,上一代是图文的互联网,到了5G时代,视频将迎来大发展。思科预测,到2022年,全球移动互联网总流量的80%是视频,这就像宇宙爆发来到的奇点,会涌现出大量新物种,届时会发生颠覆式变化。
      
       在今天这个视觉互联网黎明前的破晓时分,我给大家带来十大趋势展望。
      
       趋势一:营销即视频
      
       以前,企业都要开公众号,现在每个企业都在用视频进行营销,要么是把公众号变成了视频号,要么在抖音上直接开企业级的视频营销。新商业就是“视觉+”所有的商业模式。
      
       趋势二:5G视觉新基建
      
       视觉互联网的新基建正在孕育下一代千亿美元的商业模式。我国目前已有71亿个物联网连接,形成了一个巨大的视觉互联网生态圈,其中需要新基建平台提供AI超算、视觉解析等服务,商汤科技就把自己定位为视觉新基建供应商。
      
       趋势三:视频物种大爆发
      
       视觉互联网时代,你不会被某个App死死拴住,用户是跟着IP走,而不是跟着App走的。
      
       5G催生的新物种会有哪些?首先是4K、8K超清分辨率的视频交互界面;二是云游戏,它的计算不依托于手机端,而取决于网络带宽和云端计算力;三是5G+4K+VR(虚拟现实)的新直播。
      
       趋势四:视频交互为王
      
       对于“00后”来说,不能交互的视频就不叫好视频。观众可以根据视频的剧情进行角色扮演,选择不同的结局,游戏和影视的边界正在消失。
      
       趋势五:头部IP直播和短视频长尾社区
      
       社区具有黏性,长尾社区会逐渐细分。B站上不同的IP和动漫会吸引不同粉丝,进而影响周边产品的销售。小红书的互动直播孕育出很多新的电商互动玩法。
      
       趋势六:虚拟网红,企业AR(增强现实)代言人
      
       未来,每一个明星都会有一个二次元代言人,可以帮你回答粉丝的问题。每家企业都将拥有自己的虚拟网红和新品代言人。
      
       趋势七:硬件皆视觉
      
       2025年,物联网终端会达到750亿台,2030年预计会有1000亿台。海量终端都会装上视觉感知能力,AI最重要的就是Vision+IoT,即视觉物联网(VIoT)。
      
       趋势八:AR眼镜取代手机
      
       最快今年底或明年上半年,苹果公司会发布苹果眼镜,也就是一款AR眼镜。未来,AR将成为视觉互联网的主体,不管AR游戏还是AR社交,都可能做出大量的应用创新。
      
       趋势九:视觉芯片
      
       这是一个非常重要的视觉物联网基础设施。在芯片层面上,苹果(ARM)、英伟达的边缘侧芯片都拥有强大的生态爆发力。
      
       趋势十:万物皆可AR
      
       商汤科技目前占有亚洲视频应用60%的市场,一旦AR眼镜普及,将会形成许许多多非常有趣新颖的视觉应用。
      
       人工智能和颠覆式创新
      
       物联网时代正在到来,人机交互将会引领产业的变革。目前,以语音交互为主、触屏交互为辅的第三代交互时代已经来临。
      
       李传刚
      
       科大讯飞副总裁兼消费者事业群副总裁
      
       2019年,科大讯飞年度发布会上,我们发布了科大讯飞智能录音笔,这是世界上首款带屏的人工智能录音笔。作为这款录音笔的创始人,我今天将着重以智能录音笔为例,介绍科大讯飞在人工智能方面的应用。
      
       人工智能这个概念首次被提出来是在1956年,但因为种种原因,60多年来,人工智能经历了两次高潮和两次低谷,自从2006年杰弗里·辛顿提出深度学习以来,人工智能借助在语音和图像识别上的成功,由实验室走向了市场。人工智能基本上是从运算智能、感知智能、运动智能向认知智能进化,最终要实现具备思考能力,能像人一样通畅地自由交流。
      
       我们现在仍然处于人工智能的早期。在国内,人工智能技术已经受到政府和企业的高度重视。经过多年持续积累,我国在人工智能领域取得了重要进展,核心关键技术已经实现重要突破。科大讯飞是我国语音识别领域的代表公司,2018年和2019年分别获得12项及9项人工智能领域的世界冠军。
      
       科大讯飞在人工智能领域有三种创新,共同助力产业落地。一是源头技术创新,二是产品应用创新,三是商业模式创新。
      
       物联网时代正在到来,人机交互将会引领产业的变革。目前,以语音交互为主、触屏交互为辅的第三代交互时代已经来临。我们认为,人工智能产业有两大发展方向:一是自然交互改变生活,让机器拥有人类的交互能力,在各个场景中为用户提供更好的服务和体验;二是智能学习赋能传统产业。让机器来学习专家的知识,达到顶级专家的水平,提升效率。
      
       每一次的技术变革与消费升级的双轮驱动,都将会产生巨大的颠覆式创新机会,有技术基因的品牌会成为领导者。传统录音笔拾音距离不够,无法转写,无法检索,不能翻译,外观缺少科技感。我们通过调研发现了机会,重新定义了录音笔,用人工智能赋能、颠覆和替代传统录音笔,识别准确率高达98%,录音一小时,5分钟出稿,拾音距离达到15米,声音非常清晰,还加入了角色分离、智能摘要、智能分段、语气词过滤等人工智能功能。
      
       人工智能技术虽然目前还处于发展和应用的初期,但依然有机会改变世界。我们只要秉持颠覆式创新的理念,合理使用人工智能技术,赋能传统产业或产品,就一定会为消费者带来价值。