机器正在认知智能上不断突破刚才大家看到的是我们的信息输入,从多模态的感知到多语种的感知。那么机器的认知水平现在理解到什么水平了?我想告诉大家,在国际最权威的机器阅读理解比赛中,斯坦福大学牵头的一项比赛中,比赛机制是,针对大约10万篇来自维基百科的英文文章,人看了以后提问题,机器看了以后回答人的问题。我们已在全球首次超过人类平均水平。今年7月,在非常权威的全球认知智能比赛中,艾伦人工智能研究院组织的open book QA比赛就是对知识推理的挑战赛,只要是跟科学知识相关的内容,你随便向机器提问。机器的回答已经超过人类平均水平。也就是说,它在不需要给定内容训练的情况下,已经在很多领域开始挑战人类平均水平。正是因为这些技术的进展,科大讯飞的人工智能技术首次通过了国家执业医师资格考试——都是医学专业毕业的学生,工作几年后才会去考,只有一半人能过。考试满分600分,分数线360,我们机器考了456分,超过了96.3%的医生。因为它自动学习了53本医学博士教科书,200多万份电子病历和最新医学论文。一般很难让人理解的是,机器改主观题高考语文作文的能力,已经超过我们人类专家,现在已经在12个省的高考中得到使用。雅思英语在全球寻找人工智能批改英语口语和英语作文的技术供应商。我们的技术也超过了人力。所以我们可以看到,机器现在在认知智能上不断突破,只要有逻辑规律可循,有相关知识可供它进行数据学习和训练,它就可以达到原来博士毕业才能掌控的水平。当然,机器的自我觉醒,那还不是现在技术所涵盖的范畴,也不是我们追求的目标,我们追求的是机器能够帮助人类,而不是代替人类。AI可助力在虚拟世界中生产更丰富的虚拟内容有了理解以后怎么表达?它最重要的就是像人一样地表达,不光可以形成文字,还可以呈现各种语音的表达。我们的语音合成技术已经超过了普通人的水平,播音员最好的水平是5分,普通人讲话是4分。机器现在已经在中文领域达到了4.5~4.8分,在英文中也超过了4.2分。那么在这个基础上,我们进一步把语音合成跟人物形象相结合,形成了虚拟主播。虚拟主播已经出现在冬奥会上。它可以跟全世界运动员和工作人员进行交流。刚刚二十大期间,中央电视台、人民日报、新华社跟讯飞都有很多合作,包括大家最关注,很多重点媒体关于二十大的报道都是用虚拟主播来播报的,比如学习强国。甚至说在抖音直播上,我们的虚拟主播形象可以跟它原生的主人一道来直播,也可以用虚拟形象跟其他的主播一起来直播,这已经得到真实使用了。昨天双11结束,科大讯飞的学习机跟去年同期相比翻番增长,我们的虚拟主播发挥了很重要的作用。现在我们每一个人还可以订阅自己喜欢的主播,寻找任何一个形象,你可以把他的眉毛、眼睛、鼻子、嘴巴改成你要的样子,把他的衣服改成你喜欢的颜色。它就成为你个人订阅的形象。然后你可以寻找你喜欢的声音来做你自己喜欢的虚拟主播。现在在网上已经有50多万的声音和形象供我们的用户挑选。在这些基础上,其实更进一步的,人工智能可以助力我们在虚拟世界中生产更丰富的虚拟内容。今天我们讯飞的虚拟主播已经可以根据你提示的关键内容来作词作曲和写诗,而且可以自动生成背景的画面,这个画面是机器自动化的卡通画或者意象派画作。最近讯飞的一位虚拟歌手叫路亚,完成了自己的首个唱跳体验,自己作曲的单曲叫《铠甲》。上线很短的时间,用户数就超过了300万,现在已经达到1500万人次。所以以后在人工智能时代生产新的内容,只需要提供一段文字,你根本不用去录各种视频,机器会自动帮你配音,自动帮你找到虚拟形象,自动帮你找到背景画面,然后形成一个视频。从原来的专业视频制作到用户个人视频制作,再到人工智能的自动视频和内容制作,到现在人机协同的内容制作,我相信它们一定会为我们虚拟经济和VR产业的发展带来非常生动丰富的用户体验和全新的文化发展。