中国科学院外籍院士樊文飞:把大数据变小,从理论到系统的突破

紧随着先行示范区落地,由粤港澳大湾区和中国特色社会主义先行示范区组成的“双区驱动”给深圳带来了改革开放之后又一重大且崭新的历史机遇。基于此,“2019前海世界数字论坛”于12月6日如期举办。

中国科学院外籍院士樊文飞:把大数据变小,从理论到系统的突破

在本次论坛上,物联传媒有幸采访到了数据库专家、中国科学院外籍院士的樊文飞。熟悉樊院士的人都知道,他给人印象最深的可能就是那纯粹的笑容,让人感觉亲切而踏实。

而樊院士纯粹的笑容背后,我们看到的是让人肃然起敬的成就。2019年11月,樊文飞当选中国科学院外籍院士,这是他继英国皇家学会院士(FRS),欧洲科学院院士(MAE),英国爱丁堡皇家学会院士(FRSE),国际计算机学会会士(ACM Fellow)之后获得的第5个院士称号。作为享誉国内外的知名院士,樊文飞在接受采访中谈到,“我是搞技术的”,将自己定位为技术从业人员。或许,这就是真正潜心研究技术、深挖理论潜力的科学家该有的淳朴。

中国科学院外籍院士樊文飞:把大数据变小,从理论到系统的突破

樊院士对于数据库科学最卓著的贡献是从理论突破到系统的落地,英国皇家学会提名词上写道,樊文飞是世界上极少数同时在数据库理论与系统两个领域做出突破性贡献的学者之一。同时,樊院士也是国际数据库领域历史上仅有的两个“大满贯”得主之一,囊括了数据库四大顶级理论和系统会议的最佳论文奖和时间检验奖(SIGMOD 2017, PODS 2010 和2015,VLDB 2010, ICDE 2007)。

在大数据的研究上,樊院士奠定了大数据计算复杂性的基础,重塑了数据质量研究领域。“大数据具有四个主要特征:规模大(量)、类型多、变化速度快以及真实性(质量)。国内外目前在数据规模方面做的功课比较多,但在其他三个方面的研发相对比较少,还有很多未解问题”。樊院士认为,针对数据类型多样性的异源异构数据共享模型与方法,针对数据变化速度的自动增量计算理论,以及针对数据真实性的数据质量模型与方法等都有很多痛点,有待发展。

解决痛点既是挑战,更是创新的机遇。樊院士在接受采访的时候表示:“做科研,我一直坚持创新,创新的关键不在于你的论文数量、引用率、发表平台,而重在提出的基础、原创理论和系统能否领跑国际学术界并且在工业界落地。”

在樊院士的创新基础理论当中,最让笔者印象深刻的是有界计算理论。通俗来讲,有界计算理论就是把大数据变小,用聪明的方法找到大数据中满足需要的那一部分小数据集,并且满足查询结果的精确解要求。

“这项研究的攻克,我们花了五年时间,如何找到小数据集成为关键,其中涉及逻辑性和计算的复杂性,而这个问题从当时的理论上来看是不可计算的,所以我们要从理论出发实现创新”。据樊院士日前透露,一家国际领先公司在数十亿条数据的实时查询场景下,91%的查询可以用有界计算来解决,并且查询效率提升25倍到10万倍。从企业的角度来看,这项理论的落地能够解决大多数企业因资源受限无力从事真正的大数据计算的现实问题,做到企业无论大小都能享受大数据分析的利益。

本次来到前海,樊院士正式受聘进入前海科技创新专家咨询委员会。在聊到深圳在大数据这一领域发展潜力时,樊院士认为,深圳的政策相对较为宽松,本地优秀企业的工程人才也比较集中,有与硅谷媲美的创新环境,因此我们在深圳市政府和龙华区的支持下,组建了深圳计算科学研究院。希望通过这个平台,做出中国自己的大数据基础理论和计算引擎,并和深圳的本地企业合作,打造属于中国的大数据基础软件国际品牌。

“要实现创新才能不让别人牵着鼻子走。此前,我们和国际领先的国内企业在异构数据处理和开源社区方面有着良好的合作”。樊院士表示,“在做好自己的同时,也要与国际接轨,吸纳国外的优秀技术和人才”。

可见,樊院士对于深圳以及前海的大数据发展持有非常乐观的态度。从行业发展的角度来看,樊院士表示大数据行业的研究者更需要沉下心来,解决目前理论研究和实际应用中存在的问题,从理论到系统,做出对社会有价值的原创研究和突破。

原文始发于:中国科学院外籍院士樊文飞:把大数据变小,从理论到系统的突破


微信扫码加入本站知识星球下载6000+最新精选行业报告

发表评论