大数据与小应用--不可逆转的新浪潮
2013-06-26 15:32:00 来源: 人民网  暂无网友评论

原标题: 大数据与小应用--不可逆转的新浪潮

  2013年6月19日,笔者微信上关注的一个共用帐号“油价早知道”推送了这样一条信息:“油价早知道友情提示:根据油价舆情跟踪分析,6月22日凌晨油价或上调(概率超过70%),上调幅度约在100元/吨。”第二天,油价早知道继续提示油价上调消息,并且给出上调幅度0.1元/升,6月21日,油价早知道发布的消息就已经是发改委发布的油价提升通知。

  油价早知道又一次提前三天预报了油价调整的信息,从上线以来,他们的预测准确率已经超过95%!这是一个典型的大数据应用的例子,这也是笔者看到的,在中国落地比较好的一个大数据应用的例子。

  关于大数据,从去年开始,在全世界范围内与云计算、物联网、3D打印等一起,已经成为炙手可热的话题。但到底什么是大数据?大数据究竟有些什么特性?我们应该怎样应用大数据?它将给我们的生活带来什么样的变化?这些问题的探讨一直在进行,很多企业都在思考,如何在企业的IT建设中应用大数据,实现企业运营的创新。

  大数据(big data),百度上的定义是:指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。

  Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

  IBM对于大数据特性的4V描述目前普遍为业界所接受:(1)Volume,数据体量巨大。从TB级别,跃升到PB级别;(2)Variety,数据类型繁多。不止包括传统的格式化数据,还包括来自互联网的网络日志、视频、图片、地理位置信息等等。(3)Value,价值密度低,商业价值高。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。(4)Velocity,处理速度快。1秒定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。

  如果单纯按这四个特征去理解大数据,也许会把大数据理解成为全量数据或者叫做全息数据。而这样的数据应用,似乎只有在超大型或者大型项目里才能建设起来,而这些与传统的数据仓库又有什么差别?

  最早洞见大数据时代发展趋势的数据科学家之一舍恩伯格给出的三条大数据特征或许能够让我们更好地理解大数据。舍恩伯格的大数据特征可以用三个词语来描述:更多、更乱、相关性。

  在这里的更多,是针对研究对象本身,要考虑与对象相关的更多维度的信息,而不是传统的企业内部信息,例如运营商在研究客户离网率预测的时候,不仅仅只研究客户的计费数据,也可以将客户的位置信息,甚至是在SNS网上的言论信息等增加进来。所以,大数据不一定能做到全量(而谁能够定义到底全量是什么呢?)而只是逐渐增加的“更多”。

作者:人民网

1   2   下一页  

分享到:
更多相关内容
南方时尚荟二维码
大众健康
举报虚假新闻:如果您在本页面发现虚假新闻和其他错误,请先用鼠标选择出错的内容片断,然后同时按下"CTRL""ENTER"键,填写举报邮件。
举报电话:020-87373397。谢谢您的支持。