人生第一次写书评。一直也有在网上买书,但是从来没写过书评,我最近才发现这样很不好,一本书看完之后,我可能只是大概了解这本书确实是大家口中说的是本好书,但是它为什么好、好在哪儿我确说不出一二。所以从现在开始,我也要尽可能的写书评,或者不能叫做书评,算是读后感,不为给别人看,算是给自己读完一本书后的奖励。 “大数据”这个词近年才被人们熟知,但是在好多年前很多公司就已经开始了数据的收集和挖掘,在我们身边的例子也有很多,比如书中所说谷歌运用搜索结果预知流感传播一样,我发现医院的医生也一直在这么做,只是在数据挖掘方面做的可能没有这么深,儿科医生会记录每位感冒患儿的住址信息,然后来对这个区域的流感传染程度来做评估。在非典时期,每天公布的感染地区感染人数,其实也可以看作是在做大数据的收集。 本书给我最深的一个观点是“样品=总体”。确实是颠覆了我们以前认知世界的方式。以前我们进行研究,都是进行取样,然后保证样品的准确性、随机性,消除一切不必要的外部变量。现在在大数据时代,我们要做的是尽可能的多收集数据,哪怕数据与之没有直接的联系,并且允许错误。这个观点理解起来很简单,但是真正要做起来可能还需要时间。 本书一直在告诉我们什么是大数据、大数据的用处以及大数据可能给我们带来的麻烦。任何事物都有两面性,大家常举的例子就是核能的使用,大数据也一样。它可以给我们带来便利,同样的也可能让我们裸奔在大街上。不管怎样,时代的车轮是滚滚向前的,存在即合理,矛与盾同时存在!![](http://imgsrc.baidu.com/forum/w%3D580/sign=ea23a702e61190ef01fb92d7fe1a9df7/f31bd418367adab425fb6cac8ad4b31c8701e43c.jpg)
![](http://imgsrc.baidu.com/forum/w%3D580/sign=ea23a702e61190ef01fb92d7fe1a9df7/f31bd418367adab425fb6cac8ad4b31c8701e43c.jpg)