当前位置:首页 > 聚才北京

[ 返回首页 ]

贾西贝:大数据里找商机童心带我走进数据时代

来源:  时间:2014-10-16 16:08:13

贾西贝是世界上首个自动化、智能化的第三代数据质量管理系统的开发者。这些辉煌的背后,都是一颗童心引发的进取之路。
 
 
1987年,当时读小学4年级的贾西贝第一次看到电脑,这是他们厂矿小学培养出全国竞赛大奖得主的奖励,一共8台。这些代表着荣誉和骄傲,而且长相奇特的小东西在他心中激起了涟漪。好奇心和兴趣不但促使他在后来的学习中获得了全国物理联赛的大奖,也在他内心深处埋下了一颗种子。这颗种子的力量强大到让他放弃了保送吉林大学本硕博连读的机会,从而走出自己别样的人生……
 
1999年,贾西贝本科毕业于大连理工大学计算机科学与工程专业,2002年硕士毕业于北京大学计算机科学与技术专业,随后任职于Sun中国工程研究院,2004年获英国政府ORS奖学金资助,赴爱丁堡大学留学并成为樊文飞教授的博士生,4年后获得博士学位。毕业后他从事数据质量相关的博士后研究工作。
 
从大连理工到北京大学,从Sun中国工程研究院到英国爱丁堡大学,他通过多年的坚持与不懈的努力终于成为数据质量管理领域的专家,并以此为事业,回到中国。他的经历,是一部求学的励志片;而他的愿望,则是让数据创造价值。
 
“满城”尽读《大数据》
 
大数据是最近几年才被引起重视的,但人们对大数据的认知和实践发展很快,现在基本已经被公认为将是世界争夺的创新和竞争高地,毫无疑问,未来的数据将成为一种核心资源,可以和自然资源并列的宝贵财富。
 
 
两年前,贾西贝采购了一批图书,叫做《大数据:正在到来的数据革命》(以下简称《大数据》),他曾经跟该书的作者涂子沛一起做过演讲,很多观点和他不谋而合。
 
很长时间里,这本书是作为礼品送给客户的,得到的反馈并不好,因为怎么看都感觉像一本专业书,没人愿意看。但是过了国庆节没几天,贾西贝突然接到了很多电话,点名要看这本书。原来是时任广东省委书记汪洋视察广东省财政厅时说:“这几天,我看了两本书,其中有一本是广西师范大学出版社出版的,一个美籍的华人涂子沛写的《大数据》,看以后非常有启发。我推荐你们全厅干部都看一下这本书,研究一下大数据时代。”
 
这次推荐使《大数据》一夜之间红遍广东全省,书店脱销,网上售罄,很多客户一时着急买不到,忽然想起以前贾西贝送出过,结果,不到一天的时间,公司采购的书也被一抢而空。
 
“这其实是一件好事,说明大家都在重视数据的功能和作用了,对我们公司也是一个很大的利好消息,”贾西贝笑着说:“数据是与自然资源一样重要的战略资源,大数据技术就是从数量巨大、结构复杂、类型众多的数据中,快速获得有价值信息的能力,它已成为学术界、企业界甚至各国政府关注的热点。”
 
做行业终端的耕耘者
 
大数据时代近在咫尺。这些数据如果无法管理,臃肿的信息可能真的要爆炸。英特尔万亿级计算研究项目总监吉姆·海德曾表示,全球数据的海量增长已经达到当前的存储极限。当前,全球数据存储每年以60%的速度递增。海德称:“大量数据快速的增长,已经使我们无法处理。”
 
 
说到大数据,可能还是有人会觉得陌生,但是看完下面这些数字,你就会明白大数据的威力有多大。我国个人医疗影像和电子病历的数据量每24个月就会增长一倍,这些不断增长的数据量要保证日后任何时间都可访问;新浪微博一秒钟至少产生32312条微博;一家普通的社交网络公司每天要收集至少600亿个数据点,用于分析用户行为以寻找提高用户粘度的方法……
 
数据量正在几何级增长,如果用DVD记录这些数据的话,一张张光盘叠加起来的长度可以往返地球与月球之间30多个来回……
 
大数据的快速增长已经引起众多商业巨头的关注,像甲骨文、IBM、谷歌,甚至微软都陆续推出了自己的数据解决产品和方案。但是在中国,还是一个刚刚兴起的产业。贾西贝说:“北京有得天独厚的大学资源,我们的市场拓展和基础研究主要放在北京,产品及系统开发则放在深圳,南北呼应,也是增强竞争力的一种努力吧。”
 
我们让数据创造价值
 
贾西贝认为,传统意义上,大家都能够看到的数据总量大得惊人,但实际上数据并不可怕,因为数量庞大的数据经过优化和处理,完全可以避免“爆炸”的可能。
 
“在一些保险公司的数据中,一个银行账户居然对应不同的参保人员,这些数据可能是由于不同代理制度造成的,但是一旦发生事故,后果不堪设想。在商业运作的过程中,这些数据如果不处理,会导致医生用错药,保费赔错人,这都是很危险的事情。而我们所要做的,就是处理这些数据的偏差和错误。”贾西贝介绍说。
 
如果说,不知名企业会在数据上出现纰漏还可以理解,但是像戴尔这样的公司,也同样无法避免数据管理出现的漏洞给公司带来的损失。
 
贾西贝讲了一个数据失误的经典案例:戴尔公司在台湾的销售系统曾经出现过一次事故,有些时间里,台湾的消费者发现只要换一个笔记本的颜色,价格就会相应下降,这样换来换去,价格几乎变成了一个鼠标的价钱,但是依然能够下单购买。人们欢呼雀跃,通过社交网络传播了这个“好消息”,结果数万台笔记本电脑被一抢而空。不过这已经不是第一出现这样的失误,因此狡猾的戴尔早已制定出类似情况下的免责条款。结果消费者不买账,把戴尔告上了法庭,法院第一件是要做的,就是冻结戴尔在台湾的账户,虽然戴尔在台湾销量不是很大,但是它的生产基地在台湾,一下子就要受到严重的影响。这就是数据管理过程中的经典失误。如果我们留心,其实当当、迅雷,甚至支付宝早先都出现过类似的小失误,最终的结果通常是企业买单。
 
在当今数据量越来越大的前提下,要在保障管理数据“量”不出问题,同时还要提升数据“质”的优化,解决数据的同一性、一致性,做到数据不打架,不重复,这才是数据管理的难度所在。
 
看来在大数据时代,数量与质量的结合才是数据管理的精髓所在,好在贾西贝带领他的团队,深入研发“量质合一”的数据管理系统,期待他们能够创造出更大的奇迹!(供稿/北京海外学人中心)
 

相关文章

本期导读

more