为什么数据专家很难去做大数据?

实际上,未来大数据的核心叫“社会化大数据”,就是把各种数据和人关联在一起,然后再把人和人的关系搞清楚。就是因为这个理论,美国就有好多人觉得Google的价值不如Facebook。

大数据是相当的热。有关大数据的故事也非常精彩和神奇,比如说它既能告诉你超市里婴儿尿布和啤酒之间的关系,也能帮美国政府抓住本?拉登。着名投资人王煜全从投资和创业的角度给大家展现了大数据的另一面。

他认为只看大数据是不够的,实际上,未来大数据的核心叫“社会化大数据”,就是把各种数据和人关联在一起,然后再把人和人的关系搞清楚。就是因为这个理论,美国就有好多人觉得Google的价值不如Facebook。你想啊,Google掌握的只是每个散开的点,每个人都搜索了什么,但是却不知道电脑后面那个人是谁,也不知道这些人互相之间的关系,但Facebook就牛了,它上面积累的所有数据,关系都是很清晰的。虽然数据量未必比Google大,但它的数据都是和人之间的关系,反映的也是人的互动。

美国有个专家,是大数据预测领域最前沿的科学家。他利用社会化数据预测电影票房啊、歌星前途啊、哪首歌会大卖啊等等这些事。最牛的是,他能对社会化数据进行分析,然后预测股市的走向。做过股市预测的都知道,股市预测最难的其实不是个股,最难的是对趋势的分析,对未来整个股市大趋势和方向的判断。通过分析,他就发现,股市的趋势变化和一个词在社交网络上出现的热度是高度相关的,什么词呢?就是CALM,C-A-L-M,冷静的意思。这也就是说,股市的变动其实和经济形势好坏什么的关系不大,而是和民意有很大关系。如果投资者情绪稳定,那股市就会越来越好;如果老百姓紧张了、恐慌了,股市就容易下滑。CALM这个词就反映了民意,它出现的频率高,就代表老百姓的心情比较平静,这个时候股市就会升。出现频率下降,就说明老百姓比较焦虑,股市就会跌。所以你看,大数据的特点不在数据本身,而是数据的洞察力。

未来大数据这么有用,你说我的数学和计算机都还不错,那我是不是可以找个和大数据相关的项目开始创业了呢?遗憾的是,王煜全说了,大数据领域并不是有了洞察力就能解决问题的,因为大数据,尤其是社会化数据有天然的壁垒,这就会导致一个问题,那就是巧妇难为无米之炊啊。

比如说好几年以前有个经典案例,就是腾讯提供过这么一个服务,它帮你把你的QQ好友分组。这个分组的准确程度会让你觉得可怕,你会突然发现,腾讯帮我分出来的这一组人,就全都是我的小学同学嘛,而那一组人就都是我的初中同学嘛。为啥腾讯知道的这么详细、这么精准呢?它开了天眼吗?当然不是,腾讯其实只是利用了一个参数,就是看你加好友的时间,通过这个判断出来的。因为QQ是伴着我们一起成长的,十年前你在上小学的时候,好友就是那些人;到七八年前你上初中了,就新加了一批好友;到上高中了,又新加了一批。以此类推,腾讯就知道你在某一个时间段里集中新加的好友是有特殊意义的。所以这就看出来了,腾讯的社交网络分析和数据分析能力称不上有多强,但是只要能掌握数据,也能做出让人觉得匪夷所思的事。

整个社会化数据分两类,一类是开放的,比如Facebook,你可以自由地访问一个你不认识的人。另一类像微信,是封闭数据,就是说你不认识的人,他的主页也好,信息也好,你是访问不了的,连你和另一个人的互动聊天,对第三方来说都是加密的,别人看不到。这就意味着,除了腾讯以外,没人能掌握这些互动数据和积累的信息。因此,大数据的门槛是非常非常高的,尤其是到了今天,十个人都已经知道数据有很大的价值了,就相当于说每个人都知道数据里有金子。那这时候,大多数公司就会采取相对封闭的办法,虽然我的掘金能力还不够强,但是这金矿我得先占着,而且还不让别人来采。比如说当初中国移动,它的用户价值巨大,它就不让别人来给这些用户提供服务,哪怕说我现在的服务不好,但是我也不能允许别人随便来抢我的金矿,就是这种心态。

但恰恰就是这种心态,正阻碍着行业的发展。那些最优秀的专家就没有机会获得他们需要的数据。而拥有这些数据的人和机构,就会拥兵自重。尤其最近这几年,人工智能也发展起来了,我们要用数据训练人工智能,就需要行业的大数据来做训练集。这就又进一步提升了数据的价值,在垄断问题没解决的时候,价值又增加了,所以未来数据垄断这个问题反而会更严重,更凸显。

最典型的例子就是《奇点临近》这本书的作者库兹韦尔,他本身在美国就是个非常成功的企业家和发明家,而且特别有钱。但是他前一段加入了Google公司,头衔很低。他都这么有钱了,何必非得为了这么个头衔加入一家公司呢?

实际上,他并不想加入Google,也不是为了那个头衔或者那份薪水,他就是想利用Google的数据。他发现,要研究人工智能,要取得突破,必须得有强大的数据做支持,那全世界最好的数据在哪呢?在Google那。所以他就去找Google的创始人去谈,说我能不能利用你的数据去做人工智能啊?Google的创始人也是一个比较有情怀的人,但是情怀归情怀,商业归商业。Google创始人就说,我们非常愿意支持你的研发,也愿意把数据提供给你。但是数据呢是我们公司的核心资产,不能交给外人。所以你要是想利用Google的数据,就必须得加盟Google。

类似的情况还有很多,美国有几个很着名的研究社交网络的大数据专家,都纷纷加入了Google,加入了Facebook。在人工智能领域和深度学习领域,大学教授不需要加入什么公司,就能做出很深刻的研究。但在大数据领域,你只是一个大学教授,根本没机会拿到数据,那还做啥研究。只有加盟Facebook,加盟Google这些掌握着大数据的企业,你才有机会拿到数据,才能去做更深入的研究。所以王煜全很无奈的说,这其实是一个很悲哀的现状。

本文来自信息化观察者网,转载请注明出处。

 

注:本站文章除标明原创外,均来自网友投稿及分享,如有侵权请联系dongxizhiku@163.com删除。

         

发表评论