图书板块图书分类品牌系列获奖图书图书专题新书上架编辑推荐作者团队
大数据——正在到来的数据革命,以及它如何改变政府、商业与我们的生活 涂子沛 著
从0到1,领跑大数据时代最好的书
ISBN: 9787549564101

出版时间:2015-04-01

定  价:69.00

责  编:曹凌志 王家胜
所属板块: 社科学术出版

图书分类: 经济学理论

读者对象: 大众读者

上架建议: 经济管理 畅销读物
装帧: 精装

开本: 16

字数: 260 (千字)

页数: 400
图书简介

《大数据》3.0升级精装版,增加作者自序,以及归国以来的演讲、专题——数据是我们新经济的土壤,是我们未来智能社会的土壤,数据可以治国,还可以强国。

美国第一,中国第几?公布官员财产美国是怎么做的,美国能让少数人腐败起来吗?美国式上访是怎么回事?凭什么美国矿难那么少?全民医改美国做得到吗?美国总统大选有什么利器才能赢?下一轮全球洗牌我们世界工厂会被淘汰吗?……

除了上帝,任何人都必须用数据来说话。

大数据浪潮,汹涌来袭,与互联网的发明一样,这绝不仅仅是信息技术领域的革命,更是在全球范围启动透明政府、加速企业创新、引领社会变革的利器。现代管理学之父德鲁克有言,预测未来最好的方法,就是去创造未来。而“大数据战略”,则是当下领航全球的先机。

大数据,这一世界大潮的来龙去脉如何?数据技术变革,何以能推动政府信息公开、透明和社会公正?何以促发行政管理和商业管理革新,并创造无限商机?又何以既便利又危及我们每个人的生活?Google、百度之类搜索服务,何以会不再有立足之地?引领世界的数据帝国——美国和西欧,正在如何应对大数据时代?我们中国,又当如何作为?

本书通过讲述美国半个多世纪信息开放、技术创新的历史,以别开生面的经典案例——奥巴马建设“前所未有的开放政府”的雄心、公共财政透明的曲折、《数据质量法》背后的隐情、全民医改法案的波澜、统一身份证的百年纠结、隐私危机、街头警察的创新传奇、美国矿难的悲情历史、商务智能的前世今生、数据开放运动的全球兴起,以及云计算、Facebook和推特等社交媒体、Web3.0与下一代互联网的未来图景等等,为您一一细解,数据创新给公民、政府、社会带来的种种挑战和变革。

美国是全书主体,但又处处反观中国当下的现实。回望中国,胡适批评“差不多先生”,黄仁宇求索“数目字管理”,作者从太平洋对面看到中美两国的差距,深知中国缺少什么、需要什么,故将十多年观察、思索所得,又新增微学校、微学位等教育领域正在发生的革命,以及建言中国“大数据战略”的重要文章和访谈,淘洗成这本开创性的“大数据之书”——《大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活》。

作者简介

涂子沛,著名信息管理专家,江西吉安人,曾在美国学习、工作多年,2014年12月从美国硅谷回国,出任阿里巴巴集团副总裁。

本科毕业于华中科技大学计算机系,研究生就读于卡内基梅隆大学,获公共管理硕士和信息技术科学硕士学位。赴美留学前,曾在武警部队和公共部门磨砺10年,深刻洞悉中美两国的科技动态和文化理念。作者还先后担任上海真爱梦想基金会理事、中国旅美科技协会副主席等职务,并在国内多所大学有客座教职。

《大数据》这本书在中国社会开大数据之先河,引发了对大数据战略、数据治国和开放数据的讨论,被盛赞“为华文世界开创了一个重要话题”。 作者的另一本著作《数据之巅》,提出当前信息技术的发展,已经让中国获得了后发优势,中国要在大数据时代的全球竞争中胜出,需要把大数据从科技符号提升成为文化符号,在全社会倡导数据文化。

图书目录

第三版自序 数据可以治国,还可以强国

序言一 大数据:为华文世界提出一个重要话题/许倬云

序言二 中国的雄心应该拓展到大数据领域/达文波特

【序幕】新总统的第一天

一人一票:把“黑”人送进“白”宫

大国新政:阳光是最好的防腐剂

【上篇】帝国风云:得数据者得天下——美国的成功经验

第一章 历史争战《信息自由法》

1-1.第四股力量:知情权的起点

1-2.国会议员:孤独的战争

1-3.白宫当家人:一个妥协者和机动者

1-4.政府VS. 社会:旧剧情重现新时代

第二章 数据帝国的兴起

2-1.摩尔定律:全世界半个世纪的发展规律

2-2.最小数据集:上升到立法高度的开路先锋

2-3.民意几时有:选票催生的创新

2-4.普适计算:计算机本身将从人们的视线中消失

2-5. “大数据”战略:争夺全世界的下一个前沿

第三章 数据治国

3-1.循“数”管理:平安大道怎样铺

3-2.数据“验”平权:民权史上的碑石

3-3.数据“打”假:最大的争议就是福利滥用

3-4.CompStat :街头警察的创新传奇

第四章 商务智能的前世今生

4-1.起源:从数据到知识的挑战和跨越

4-2.结蛹:数据仓库之厚积薄发

4-3.蚕动:联机分析之惊艳

4-4.破茧:数据挖掘之智能生命的产生

4-5.化蝶:数据可视化的华丽上演

【中篇】法则博弈:大数据时代的发展与危机

第五章 帝国的法则

5-1.收集法则:减负,为人民减负

5-2.使用法则:隐私,文明社会的共识

5-3.发布法则:免费,人民已经交税

5-4.管理法则:质量,互联网时代的根本

第六章 《数据质量法》的困局

6-1.产业界“俘虏”政府:数据背后的政经战争

6-2.美式“旋转门”:权、名、利大串场

6-3. “掺沙子”法案:国会对付总统的独门秘器

6-4.环保“风险门”:公共利益常常无人代表

6-5.集体行动的逻辑:人人都想“搭便车”

6-6.三权之歧:什么是真正的“和谐”

第七章 全国隐私风波

7-1.《一九八四》:零隐私的恐惧

7-2.大数据就是“老大哥”:中央数据银行之争

7-3.百年纠结:统一身份证

7-4.“9•11”大拐点:以反恐的名义向左转

7-5.万维信息触角计划:追踪恐怖分子的“数据脚印”

7-6.6种改变政府的力量:山姆大叔大退让

【下篇】公民故事:公民社会与数据互动之双赢时代

第八章 数据开放运动

8-1.一个新的世界:从软件开源到数据开放

8-2.总统的雄心:公共财政支出透明

8-3.数据民主:印裔首席信息官的崛起

8-4.Data.Gov:从旗舰初航到保“数”运动

8-5.大众创新:航班延误之候机经济学

第九章 试金石:白宫访客记录

9-1.总统在见谁:大医改中的“小”插曲

9-2.全体美国人的房子:白宫

9-3.步步妥协:总统与草根的对决

9-4.从白宫安保到政治监督:执著的公民改变世界

第十章 矿难中的歌声和数据

10-1.集体行动的号角:你站在哪一边

10-2.可以避免的悲剧:数据揭示的全景式真相

10-3.默认公开推定:和矿难赛跑的原则

10-4.唯一的道路:民主时时都要“争”

【外篇】天下趋势:大数据社会未来之世界走向

第十一章 大趋势

11-1.数据权:大不列颠的硕果

11-2.大合流: 国际开放联盟

11-3.云计算:新的航向

11-4.再造互联网:从网页相连到数据相“联”

第十二章 大挑战

12-1.逐鹿政坛:得数据者得天下

12-2.数据竞争:企业赢之道

12-3.下一波浪潮:从大数据到大社会

第十三章 大变革(2.0升级版新增)

13-1.微学位:教育领域正在发生的革命

13-2.大数据:再谈教育领域正在发生的革命

13-3.微学校:三谈教育领域正在发生的革命

尾声 挑战中国:摘下“差不多先生”的文化标签

大事记 20世纪大萧条后美国信息开放、技术创新之路

后记 搭建“大数据”的世界

建言 中国如何应对大数据时代的挑战(升级增补)

访谈 大数据时代的“中国梦”(升级增补)

演讲 大数据、大计算:新经济的土壤(升级增补)

专题 什么是“数据的外部性”?(升级增补)

索引 (升级增补)

序言/前言/后记

【新版自序】数据可以治国,还可以强国

今年春节期间,出版社告诉我,作为中国大数据领域的开山之作,《大数据》很受欢迎,他们希望满足市场的需求,推出第三个版本,嘱咐我写点东西。

之所以受到欢迎,可能是因为独树一帜。一提到大数据,很多人的第一反应,是数据在商业领域中的作用,所津津乐道的,也是精准营销,即通过数据分析增强对用户的洞察、扩大营销收入。但本书所强调的,却是“数据不仅可以治国,还可以强国”。

数据治国,是指要凭借对数据的有效收集、处理和分析来治理国家,决定国家的大政方针和具体政策。

从定义看,数据是对客观世界进行量化和记录的结果。量化,是人类进行科学研究最根本的手段,就此而言,数据治国也可以理解为“用定量分析、实证研究的科学方法来治理国家”。此外,数据表示的是过去,关注、表达的却是未来。数据之中蕴藏着社会发展的规律,“数据治国”的提法,也暗含着“人类可以更好地把握未来”之意。

回顾人类的历史,任何一个国家的治理,都需要参照数据,但由于信息技术的进步、记录手段的普及,物理世界的状态、个人的社会行为得到了前所未有的记录,这种记录的粒度越来越细、维度越来越多、频度越来越密,形成了“大数据”。今天的数据治国,含义远远超出了“参照数据”。

例如,当前国人关心的头号问题,莫过于空气质量。要解决好这个问题,从环境的监测、传感器的安装,到空气标准的设立、污染原因的分析,再到高污染、高能耗、低产值传统产业的转型,和智能电网、智能电表的使用和普及,整个治理链条都贯穿了数据。又例如交通拥堵,如今很多城市,立交桥高达三四层、地铁线也在快速扩张,却赶不上车辆增加的速度,在资源增长、空间有限的情况下,唯一的出路,是用好大数据,对城市的状态进行实时的分析和预测,不断优化现有资源的使用情况。还有当下智慧城市的建设,大数据的作用可谓重中之重。

今天的政府,无论是东方、西方,都有人在不断尝试,试图把“凭借数据来治理社会”的模式推到极致。本书第七章“全国隐私风波”重点阐述了十几年前美国各方力量围绕“万维信息触角计划”(TIA)产生的纠结和较量。2002年,在国防部长拉姆斯菲尔德、海军中将波因德克斯特的主导下,美国国防部高级项目研究所(DARPA)试图建立一个超级数据库,把全社会每一个人的基本资料、信用卡交易信息、医疗保险记录、出入境记录、航空和酒店信息、电子邮件、电话记录、网络搜索记录等等数据都整合到一起,然后通过数据挖掘和监控,在大量的信息当中发现“信号”,实现有效的社会治理和管控。这个计划,因为可能侵犯公民的隐私,在美国国会不断受阻,但美国国防部却屡次变换名目、暗中推动项目进展。这段历史,堪称2013年“斯诺登事件”的前传,因为后来大面积曝光,最终震惊世界。

西方不亮东方亮。这期间,新加坡的国防部长Peter Ho在美国访问,他获知万维信息触角计划之后,大为赞赏。不久后,该计划在美国触礁流产,波因德克斯特被迫辞职,新加坡却重金引进了这个项目组的一批人员,并聘波因德克斯特为国防部顾问,视为上宾。在波因德克斯特的指导下,新加坡快速建立了一套万维信息触角,命名为“风险评估和全景扫描”(RAHS)。

RAHS最初的目的,是通过全社会的数据联通和挖掘,在错综复杂的社会现象中发现恐怖袭击、流行病疫情等突发事件的“信号”,达到未雨绸缪、有效治理的目的。之后,由于行之有效,新加坡政府将系统不断扩大,推广到经济、文化、社会管理的种种领域。房屋管理局用它来了解人们对于住房体系的批评和期待,人口部门通过它掌握大众的生育态度变化,旅游部门用它来预测各地游客数量的周期,食品部门通过它决策是否应该减少对进口食品的依赖等等。从这个角度说,新加坡是数据治国的一个实验室,它不仅将大数据用于情报和反恐,还用于构建和谐社会。

在中国,特别要强调的是,数据治国不是“数字治国”。一些官员一谈起辖区人口面积、GDP增长幅度、项目投资多少、惠及领域若干、利税增加几何都有“数”在胸,还特别喜欢用“三项原则”、“五个重点”、“八项规定”等等数字范式对工作进行总结,各项工作的考核也都与数据挂钩,大有唯“数据”盛行之势。这不是不好,但这些都是孤立的、静态的数字,并不是“数据治国”的真义。大数据时代,数据治国更关注的是动态的数据、系统化的数据,以不间断“流”的形式存在的、成片的、活的数据,它们应该成为公共决策的资源为政府和社会所广泛使用。归根结底,公共决策最重要的依据将是系统的、成片的、动态的数据流,而不是个人经验或长官意志,过去深入群众、实地考察的工作方法虽仍然有效,但对社会治理而言,系统采集的数据、科学分析的结果更为重要。

我认为,数据不仅可以治国,还可以强国。其中的原因,是因为数据正在成为各行各业最重要的创新资源。

以农业为例,来自天气、土壤和农作物的数据,可以实现自动化的灌溉、防治虫灾、决定如何种植和收割、节省水利资源、提高单位产量;在教育领域,以大数据为基础的在线智能学习平台(MOOC),可以突破教室的限制,让成千上万的学生同时得到个性化的教学和辅导;再以医疗领域为例,IBM公司的Watson系统可以快速地检索几百万名患者的病例、最新的医疗研究报告和成果,做出更快、更准确的诊断;工业领域更不待言,汽车、飞机正在被大数据改造,成为无人驾驶汽车、无人驾驶飞机;还有金融领域,利用电商平台的交易数据,“阿里小贷”可以在几分钟之内判断企业的信用,为近百万小微企业发放贷款。今年年初,阿里巴巴又推出了基于个体消费者的“芝麻信用”,用的创新资源还是数据。一百年前的美国,用了几十年的时间才建立全民信用体系。因为拥有无处不在的充沛数据,今天中国的全民信用体系可能在更短的时间内、以更低的成本就可以建立起来。

毫不夸张地说,基于数据的创新将带动人类社会的各个领域都实现巨大的飞跃,这种飞跃是前人难以想象的。今天的年轻人面临的创新机会要远远多于前几代人,因为他们拥有人类有史以来最伟大的创新资源:数据。

和其他的创新资源相比,数据之所以伟大,是因为它不会被它所激发的思想和创新所消耗,它可以重复使用,可以同时被无数人使用,此数据和彼数据整合,还可以产生新的价值和效用。在空间的拓展中和时间的延伸中,数据的能量将在人类社会层层放大,数据的不断积累是资源和知识的持续增加。

但要成就数据的“伟大”,还有个前提,这就是数据的开放。正是出于这个原因,本书用了相当的篇幅来讨论“开放数据”。

对于“开放数据”,中国社会目前还存在不少误解。一是将开放等同于公开,其实开放和公开是两个完全不同的概念。公开是信息层面的,是一条一条的;开放是数据库资源层面的,是一片一片的。开放数据,指的是将原始的数据及其相关的元数据以可以下载的电子格式让第三方自由使用。开放也不一定代表免费,因为开放是有成本的,企业可以以收费的形式开放数据。开放也可以有层次、有范围,针对某个特定的组织和群体开放,不一定面对全体社会大众。

开放数据之于当下中国社会的意义,在于推动知识经济和网络经济的发展,在于促进中国经济由粗放向精细、从“制造”向“创造”的转型升级,在于释放社会生产力、催生创新。通过开放更多的数据,让创新的资源自由地流动,李克强总理提出的“大众创业,万众创新”才能更快、更好地在中国大地形成燎原之势。

大众创新、创业的趋势,也可以在美国社会的发展过程中观察到。根据美国科学基金会(NSF)的数据,1981年,大公司(超过25000人)的研发投入占全美研发投入的70%,可谓主导了美国的创新;到2007年,大公司的研发投入仍然在上升,但格局却发生了改变,尽管绝对数量增长了4倍,其占全美研发投入的比例却下降到35%。同期,1000人以下小公司的研发投入增长了50倍,其占全美的比例从1981年的4%上升到2007年的24%。这些数据表明,研发和创新呈现分散化,在向小公司和个人转移,其中最根本的原因,就是知识、信息特别是数据资源的深度开放,不再受大公司、大组织的垄断,不再是精英阶层的专利。

文化靠沉淀,文明靠创新。创新,才是一个国家持续发展、不断迈向强大的真正动力。今天的中国,创新已经成为共识。就此而言,数据强国我们正在路上。

记得《大数据》首版上市,是2012年7月。当时我在美国,半年多之后,美国才出版了第一本有影响力的专著《大数据时代》,比中国晚了整整半年。抚今追昔,我感叹不已,新的思想和观念在全球自由地流动,在奔涌的浪潮之中,我也从美国硅谷回到了中国的杭州。

除了增补自序、重要的专栏文章以及我在第一届世界互联网大会上的演讲等,本版还增加了索引。一本好书不能没有索引,这是我一直的观点。几经曲折,《大数据》第三版终于加上了索引,除了出版社的支持,还要感谢冯启娜、赵瀚林、陈竞芬等志愿者,因为他们的协助,这个心愿得以达成。

涂子沛

2015年3月22日于杭州

媒体评论

★《亚洲周刊》“年度十大好书”,持续畅销;从0到1,开中国先河,领跑大数据时代最好的书, 经典之作——第一次详尽讲述“大数据浪潮”的来龙去脉;第一次深入解读“大数据时代”如何改变政府、商业和我们每个人的生活;第一次犀利阐明“数据”怎样推动民主进程……

★ 各界要人盛赞推荐——汪洋【中央高层人物】、柳传志【联想集团名誉主席】、任志强【中国房地产风云人物】、达文波特【全球顶尖的管理咨询大师】、许倬云【史学大家】、谢文【著名IT评论人】、薛海培【奥巴马总统大选亚裔事务顾问、美国华人全国委员会会长】、杨叙【英特尔全球副总裁、中国区总裁】、【中美10大高校著名学者】……各界要人盛赞推荐!

★《大数据》,这里有“中国对手”——

大数据浪潮,汹涌来袭。20世纪大萧条以来,美国作为世界强国的开放历史,数据技术浪潮的兴起过程,气势磅礴,波澜壮阔。真正读懂中国趋势,一定要先读懂美国。美国政府为什么能,中国到底缺什么?

★《大数据》,这里有“中国建言”——

哈佛大学商学院访问教授、全球顶尖的管理咨询大师达文波特,把脉经济,数据治国,专门为中国政经两界提示智库建言:“在很多领域,中国政府和中国的企业都有雄心勃勃的计划,这引起了全世界的关注,这些雄心和计划,现在应该拓展到大数据的领域。”

★《大数据》,这里有“中国财富”——

现代管理学之父德鲁克有言,预测未来最好的方法,就是去创造未来。商务智能、云计算、Facebook、推特、Web3.0、语义网……数据战争,就是未来之争!数据兴则企业兴,数据强则企业强!叫醒中国,超越中国模式的粗放式增长,迈向精细化的管理革命,大数据将是下一个社会发展阶段的“石油”和“金矿”。

★《大数据》,这里有“中国致敬”——

活着就为改变世界,只有偏执狂才能生存,不要以为乔布斯、盖茨、扎克伯格才这样。美国之为美国,还有坚持信息自由的新闻记者、发现摩尔定律的工程师、定义数据仓库的实业家、首倡普适计算的业余鼓手、鼓吹财政公开的民间活动家、倡导数据开放运动的青年学生,以及活跃在无数公民自治组织的普通个人。

★《大数据》,这里有“中国问题”——

回望中国,胡适批评“差不多先生”,黄仁宇求索“数目字管理”,我们的世界看起来雷打不动。大数据时代,挑战中国,摘不下“差不多先生”的文化标签,我们世界工厂还将是一个落后的100年!

★《大数据》,这里有“中国乡愁”——

大数据战略,重新洗牌全球格局:美国,再一次领跑世界;中国,却很可能再失良机而浑然不知!中国迷局如何解开?最具海归视野、近20年中美职业生涯的作者,从太平洋对面看到中美两国的差距,披露大量美国真实案例,最先为华文世界开启大数据重要话题,写成这本意在兴邦治国的战略之书,图文并茂,老百姓也看得懂。

名家推荐

这几天,我看了两本书,其中有一本是广西师范大学出版社出版的,一个在美国的华人涂子沛写的《大数据》,看以后非常有启发。/中国人数据意识的淡薄由来已久,甚至可以称之为国民性的一部分。/我希望大家能认真读一读这本书,带着问题读,带着想法读。

——汪洋 [中国高层人物]

涂子沛先生能为大数据推动社会进步作出贡献,功莫大焉。

——柳传志 [联想集团有限公司董事局名誉主席]

在很多领域,中国政府和中国的企业都有雄心勃勃的计划,这引起了全世界的关注,这些雄心和计划,现在应该拓展到大数据的领域。涂子沛先生的《大数据》这本书,将在这个重要的领域,为中国政府和企业的努力提供引导和帮助。

无论是对中国政府,还是就中国的商业组织而言,《大数据》都是一本重要的书。

——托马斯•H. 达文波特 [全球顶尖的管理咨询大师、哈佛大学商学院访问教授、巴布森学院总统杰出奖教授]

在极权的国家,他们手上拥有足够的资讯,足以利用这资讯,掌握每一个人的日常生活;“老大哥”的影子,可以无所不在……涂子沛先生《大数据》这部书,清楚地叙述了资讯时代对我们生活的影响与社会的控御力。他讨论的范围方方面面、极为广泛。我们要对涂子沛先生致敬与致谢,因为他为华文世界提出一个重要的话题。

——许倬云 [史学大家、匹兹堡大学历史系荣誉讲座教授]

《大数据》从奥巴马建设“前所未有的开放政府”出发,描写了半个多世纪以来数据对美国社会政治、商业、文化等方方面面的影响,谈及了1930年以来历任美国总统,可谓波澜壮阔。涂子沛作为科技业的精英,并没有将自己眼光和生活局限于技术之上,他对美国社会的独到观察和理解、对华人社区工作的积极参与和贡献,都是促成本书成为一本佳作的重要原因。

——薛海培 [奥巴马总统大选亚裔事务顾问、美国华人全国委员会会长、凤凰卫视时事评论员]

《大数据》这本书讲述了数据技术浪潮的兴起过程,回顾了近一个世纪以来美国作为一个世界强国的开放历史,气势磅礴。从书中可以看到,美国的发展动力,正是开放和创新。我们正在向个性化的智能互联网时代迈进,计算力的扩展正在不断加速,数据将成为我们最强大的创新动力。

——杨叙 [英特尔全球副总裁、中国区总裁]

《大数据》是一本视角独特、取材新颖、别开生面的好书。它以数据为轴线,描绘了美国走过的开放创新历程。从该历程中我们看到,数据挖掘是一种知识生产过程,从中产生创新,产生管理,产生推动社会变革的理论与实践。更有意思的是,美国政治的发展,公民权利的实现,以及各种自由与福利的保障,都和对数据的创造性应用密切相关。这对已经步入信息时代的中国,尤其有借鉴意义。趋势所在,数据乃大。涂子沛先生的专业性分析和介绍,是一项创造性的工作。

——郭巍青 [中山大学政治与公共事务管理学院教授]

大数据具有催生社会变革的能量。但释放这种能量,需要严谨的数据治理、富有洞见的数据分析,以及一个激发管理创新的环境。涂子沛的《大数据》这本书总结了美国的经验和实践,并为中国提出了一个路线图。我为他的成就感到骄傲。这本书完整地融合了技术、政治、商业三个角度,体现了我们学院师资教学的独特优势。我相信本书会在中国激发新的思想和讨论,帮助中国迎接大数据的挑战。

——Ramayya Krishnan [卡内基梅隆大学海因兹学院及信息管理学院院长、终身教授]

通过历史故事的讲述,用近似新闻评论的笔法,《大数据》这本书以美国为例介绍了由经验管理到数据管理这场正在发生的革命性变革,通俗形象地讲清楚了科学的道理,实属难得。这对学者们扩大视野,对管理干部深化科学发展观的认识,都有十分重要的价值。

——薛华成 [中国管理信息系统的主要开创者、澳门科技大学行政与管理学院名誉院长]

《大数据》这本书揭示了数据在未来社会中的革命性作用。大数据将是下一个社会发展阶段的“石油”和“金矿”。无论是个人、企业还是国家,谁能更好地抓住数据、理解数据、分析数据,谁就能在下一波的社会竞争中脱颖而出。关于数据的知识,将成为个人知识结构中的必备要素和基础。

——施伯乐 [复旦大学计算机研究所所长、上海(国际)数据库研究中心主任]

18世纪启动的工业革命为人类创造了巨大的财富,也极大地推动了社会变革。20世纪中启动的信息革命对人类社会也将产生巨大的冲击,而这个进程刚刚开始。涂子沛先生所著的《大数据》一书,用有趣的故事带我们回顾信息时代的里程碑,使我们透过未来的变幻不清的迷雾,展望和畅想信息革命的大趋势。

——董洁林 [苏州大学企业创新和发展研究中心主任、教授]

《大数据》值得仔细阅读与思考。要让数据更好地说话,既依赖于数据科学与技术的发展,更需要政府、机构和公民的数据意识的不断提高。

——汪小帆 [上海交大电子信息与电气工程学院教授]

数据科学正在成为一个新兴的学科和领域。涂子沛先生的《大数据》这本书,为我们揭示了大数据浪潮发生的前因后果,以及这种技术进步对政治、经济、文化的种种影响。希望读者从本书中获益,以积极的态势应对中国的大数据挑战。

——张晖 [卡内基梅隆大学计算机系终身教授]

编辑推荐

★《大数据》,这里有“中国对手”——

大数据浪潮,汹涌来袭。20世纪大萧条以来,美国作为世界强国的开放历史,数据技术浪潮的兴起过程,气势磅礴,波澜壮阔。真正读懂中国趋势,一定要先读懂美国。美国政府为什么能,中国到底缺什么?

★《大数据》,这里有“中国建言”——

哈佛大学商学院访问教授、全球顶尖的管理咨询大师达文波特,把脉经济,数据治国,专门为中国政经两界提示智库建言:“在很多领域,中国政府和中国的企业都有雄心勃勃的计划,这引起了全世界的关注,这些雄心和计划,现在应该拓展到大数据的领域。”

★《大数据》,这里有“中国财富”——

现代管理学之父德鲁克有言,预测未来最好的方法,就是去创造未来。商务智能、云计算、Facebook、推特、Web3.0、语义网……数据战争,就是未来之争!数据兴则企业兴,数据强则企业强!叫醒中国,超越中国模式的粗放式增长,迈向精细化的管理革命,大数据将是下一个社会发展阶段的“石油”和“金矿”。

★《大数据》,这里有“中国致敬”——

活着就为改变世界,只有偏执狂才能生存,不要以为乔布斯、盖茨、扎克伯格才这样。美国之为美国,还有坚持信息自由的新闻记者、发现摩尔定律的工程师、定义数据仓库的实业家、首倡普适计算的业余鼓手、鼓吹财政公开的民间活动家、倡导数据开放运动的青年学生,以及活跃在无数公民自治组织的普通个人。

★《大数据》,这里有“中国问题”——

回望中国,胡适批评“差不多先生”,黄仁宇求索“数目字管理”,我们的世界看起来雷打不动。大数据时代,挑战中国,摘不下“差不多先生”的文化标签,我们世界工厂还将是一个落后的100年!

★《大数据》,这里有“中国乡愁”——

大数据战略,重新洗牌全球格局:美国,再一次领跑世界;中国,却很可能再失良机而浑然不知!中国迷局如何解开?最具海归视野、近20年中美职业生涯的作者,从太平洋对面看到中美两国的差距,披露大量美国真实案例,最先为华文世界开启大数据重要话题,写成这本意在兴邦治国的战略之书,图文并茂,老百姓也看得懂。

精彩预览

【“大数据”战略:争夺全世界的下一个前沿】

联邦政府的每一个机构和部门,都需要制定一个应对“大数据”的战略。

——《规划数字化的未来:美国总统科学技术顾问委员会给总统和国会的报告》2010年

业务工作的管理数据,民意社情的调查数据,以及对大自然、动植物的特点和变化进行监控而产生的环境数据,是联邦政府的三大数据来源。这三种数据,其发展各有先后,收集方式各不相同,数据量也大小不一。它们之间,存在着一些交叉和重叠,有一些民意调查的数据,是业务数据,而一些因环境监控产生的数据,也可以是业务工作的数据。

由于无线传感器的快速普及,环境数据增长得最快,成为联邦政府数据量最大的来源。

虽然环境数据增长得最快,但这三种数据,其实都在爆炸。这种爆炸,并不仅仅是数量一个维度的。2001年,著名的高德纳咨询公司(Gartner)在一份研究报告21中指出,数据的爆炸是“三维的”、是立体的,这三个维度,主要表现在以下三个方面:

一是同一类型的数据量在快速增大;

二是数据增长的速度在加快;

三是数据的多样性,即新的数据来源和新的数据种类在不断增加。

数据的爆炸性增长,也不仅仅限于联邦政府。如前文所述,2011年麦肯锡公司在其研究报告《大数据:下一个创新、竞争和生产率的前沿》中指出,在美国,仅仅制造行业就拥有比美国政府还多一倍的数据,此外,新闻业、银行业、医疗业、投资业、零售业都拥有可以和美国政府相提并论的海量数据。

哈尔•范里安(Hal Varian)是谷歌的首席经济学家,也是美国研究信息经济学的著名学者。2000年,他对数据和信息产生的速度进行了研究,他认为,人类社会每年产生的信息量,实在太大了,已经没办法用准确的方法来计算现有的数字信息总量,只能估算。他估计2000年新产生的数据量为1000拍到2000拍。但到2010年,仅仅全球企业一年新存储的数据量就超过了7000拍,而全球消费者新存储的数据量约为6000拍。

这种数据量的增长,已经大大超出了人类的预期和想象。时至今日,数据已经像“洪流”一样,在全球的政治、经济生活当中奔腾。而且,随着信息技术的普及和进步,新的支流还在不断产生,各个支流流动、交汇和整合的速度,还在继续加快。

作为美国社会的信息枢纽,联邦政府当然要正面迎对这个挑战。

2010年12月,总统行政办公室下属的科学技术顾问委员会(PCAST)、信息技术顾问委员会(PITAC)向奥巴马和国会提交了《规划数字化未来》的专门报告,该报告把数据收集和使用的工作,提到了战略的高度。

这个报告列举了5个贯穿各个科技领域的共同挑战,报告指出“每一个挑战都至关重要”,而第一个挑战就是“数据”问题。报告说:

“如何收集、保存、维护、管理、分析、共享正在呈指数级增长的数据是我们必须面对的一个重要挑战。从网络摄像头、博客、天文望远镜到超级计算机的仿真,来自于不同渠道的数据以不同的形式如潮水一般向我们涌来。这些数据以不同的格式存储在不同的环境中,有的在计算机的硬盘里,有的在数据仓库之内。

如何保证这些数据现在、将来的完整性和可用性,我们面临着很多的问题和挑战。如何使用这些数据,则是另外一个挑战……应对好这些挑战,将引导我们在科研、医疗、商业和国家安全方面开创新的成功。”

在报告中,两个委员会还例举了美国癌症研究所以及中央情报局如何通过收集海量数据、建立数据仓库、实施以数据挖掘为核心的自动分析技术,获得了出人意料的创新和成功。

委员会一致认为,如何有效地利用数据将贯穿所有科技领域的挑战。最后,两个委员会向奥巴马建议:联邦政府的每一个机构和部门,都需要制定一个“大数据”的战略。

其实,“大数据”这个名词并不新鲜,早在1980年代,美国就有人提出了“大数据”的概念。20多年来,各个领域的数据量都在迅猛增长,美国的企业界、学术界也不断地对这个现象及其意义进行探讨,“大数据”这个名词变得越来越流行、越来越重要,最后成为了国家和政府层面的发展战略。

之所以要称之为战略,是因为“大数据”之“大”,并不仅仅在于其“容量之大”。当然,由于数据容量的爆炸,数据的收集、保存、维护以及共享等等任务,都成为具有研究意义的现象和挑战。但“大数据”之“大”,更多的意义在于:人类可以“分析和使用”的数据在大量增加,通过这些数据的交换、整合和分析,人类可以发现新的知识,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”。

如前文所述,数据,是记录信息的载体,是知识的来源。数据的激增,意味着人类的记录范围、测量范围和分析范围在不断扩大,知识的边界在不断延伸。

2007年,雅虎的首席科学家沃茨博士在《自然》上发表了一篇文章《21世纪的科学》22,他发现,得益于计算机技术和海量数据库的发展,个人在真实世界的活动得到了前所未有的记录,这种记录的粒度23很高,频度在不断增加,为社会科学的定量分析提供了极为丰富的数据。由于能测得更准、计算得更加精确,他认为,社会科学将脱下“准科学”的外衣,在21世纪全面迈进科学的殿堂。例如,新闻的跟帖、网站的下载记录、社交平台的互动记录等等都为政治行为的研究提供了大量的数据,政治学这门古老的学科,将登堂入室,成为地道的“科学”。

麻省理工学院的教授布伦乔尔森(Erik Brynjolfsson)则比喻说,大数据的影响,就像4个世纪之前人类发明的显微镜一样。显微镜把人类对自然界的观察和测量水平推进到了“细胞”的级别,给人类社会带来了历史性的进步和革命。24 而大数据,将成为我们下一个观察人类自身社会行为的“显微镜”和监测大自然的“仪表盘”。

这个新的显微镜,将再一次扩大人类科学的范围,推动人类知识的增长,引领新的经济繁荣。麦肯锡全球研究所在其2011年的报告中最后概括说:大数据,将成为全世界下一个创新、竞争和生产率提高的前沿。

抢占这个前沿,无异于抢占下一个时代的“石油”和“金矿”。

2012年3月29日,奥巴马政府又进一步推进了其“大数据”战略。奥巴马的高级顾问、总统科学技术顾问委员会(PCAST)的主席霍尔德伦(John Holdren)代表国防部、能源部等6个联邦政府部门宣布,将投入2亿多美元立即启动“大数据发展研究计划”(Big Data Research and Development Initiative),以推动大数据的提取、存储、分析、共享和可视化。霍尔德伦也是哈佛大学肯尼迪政府学院的知名教授,他在讲话中表示:像美国历史上对超级计算和互联网的投资一样,这个大数据发展研究计划将对美国的创新、科研、教育和国防产生深远的影响。

奥巴马则强调联邦政府必须和公司、大学结盟,全民动员(All Hands on Deck),来应对“大数据”时代的挑战。

【大挑战——逐鹿政坛:得数据者得天下】

“政治技术决定政治成败。“——莫顿•布莱克韦尔,美国政治活动家

2011年4月4日,奥巴马以电子邮件和视频的方式,正式宣布自己将参加2012年的总统竞选、争取连任。

4年多以前,2007年2月,他在广场上的人潮中宣布了自己将参选总统的决定。作为代表伊利诺伊州的联邦参议员,他选择了位于该州首府的议会广场作为集会地点,这里曾经是林肯总统发表演讲的地方。奥巴马在凛冽的寒风中,面对沸腾的人群和高声喝彩,发表了近一个小时的演讲,随后开始了他长达一年多的大选征程。

但这一次,没有簇拥的集会、鼓动的口号和大幅的标牌,一切都由网上的点击,在瞬间平静地完成。

另外几位热门人选,如前麻省州长罗姆尼(Mitt Romney)、前众议院议长金里奇(Newt Gingrich)也先后用推特(Twitter)和脸谱(Facebook)正式宣布了他们的参选意愿。

而通过集会拉开竞选的序幕,原本是美国上百年的政治传统。

有评论说,这表明,脸谱、推特和视频分享网站的发展已经深刻地改变了美国的政治生态,新的传统正在形成。还有评论指出,这次总统大选,是民主、共和两党都充分认识到社交网站重要性之后的第一次大选,技术对政治的作用将前所未有地凸显。

回顾历史,从上个世纪30年代的广播,到60年代的电视,再到本世纪初的互联网,技术一直在美国的政治生活中扮演重要的角色,甚至决定选举的成败。

互联网出现之后,就交流和互动而言,广播和电视无疑相形见绌。和它们相比,网络能提供一种没有强权的、多中心的、双向的甚至多向的信息交流方式,这一改广播、电视单向交流的不足,使候选人和选民之间的互动方式发生了深刻的改变。

如果说2008年的大选,是一场关于网络技术“用多”还是“用少”的较量,那么2012年的竞争,工具本身已经不再是竞争的优势。因为,近4年来,民主、共和两党都鼓励本党的政治家把网络作为必争之地,网络的重要作用已经得到了政治家的一致重视。共和党曾经发起“新媒体挑战”(New Media Challenge)的竞赛活动,以网络上粉丝的增长速度为衡量标准,鼓励党员集聚网络人气。比赛进行了一个半月,最后来自路易斯安那州的众议员佛兰芒(John Fleming)夺得了第一名。民主党当然不甘落后,也举办了类似的“在线政治明星”评比活动。

也就是说,两党的主要竞争者都在大规模地使用网络。竞争的重点已经不是“用不用”的问题,而是“如何用”、“用得好不好、巧不巧”。

互联网在政治竞选中的主要功能有两个,一是交流,候选人通过它和选民展开个性化的实时对话、收集采纳民意,并为自己的政治主张寻找支持;二是动员,通过它发动草根力量,完成召集志愿者、募款、造势等关键的选举活动。

当前,谁能把网络交流和动员这两个功能发挥得更好、运用到极致,其竞争的核心和重点,就是数据。

可以说,这是一场数据竞争。数据收集、分析和整合的能力已经成为技术和网络竞争的关键所在。

2008年,奥巴马通过他的个人竞选网站收集了1300万人的个人信息和邮件地址,这曾经是他在交流规模上无可比拟的优势。但和2008年相比,如今的脸谱等社交网站已经不仅仅是个交流平台,还是一个记录了8亿人资料的开放“信息港”,第三方可以在上面开发新的应用并与其现有的数据直接相联,这为其他候选人提供了超越奥巴马的可能性。

奥巴马在宣布再参选以后,立即重新改版了他的个人网站。支持者一登录,便被要求提交其社交网站的账号,并询问是否能够读取其在社交网站上的档案信息,甚至索要在用户社交网页上发布消息的授权。这些举措,招招式式都是为了获取更多、更翔实完备的选民数据。

其他候选人当然也不甘落后,几乎每个候选人都先后推出了自己的网站,个别候选人甚至不惜重金,用送出纪念品的形式来鼓励选民把自己的账号和社交网站的账号挂钩相连,其目的都是为了扩展自己的数据容量,扩大未来与选民交流的规模。

与交流规模相比,交流的质量更为重要。大规模发送信息并不难,但只有挠到接收方痒处和痛处的信息才可能引起真正的关注。这就要求发送方必须了解信息受众,而不是简单地“群发”。这个方面,奥巴马已经有教训和体会。2011年7月29日,美国国会在为是否提高国家债务的上限进行激辩。奥巴马一天内连接发出十多个推特(微博),要求他的粉丝采取行动、给议员施压,催促他们通过提高债务上限的提案。但当天晚上,奥巴马的推特就流失了33000多名粉丝。奥巴马的技术团队随后对此进行了调查,发现其中的原因,正是很多人对这个话题不感兴趣,认为“总统在给他们发送信息垃圾”。

奥巴马的团队正在全力提高数据细分的能力。例如,堕胎问题一直是两党辩论的热点,奥巴马如果能在辩论之时,锁定35岁以下的女性进行信息交流,就可能形成稳定的观点联盟,造成声势。又比如,一谈到养老金问题,50岁以上的老人将成为第一目标群体。

除了性别、年龄之外,选民还可以按地域、种族、教育程度、宗教信仰等其他维度来划分,这些维度,还可以交叉,交叉分析的维度越多,信息受众就能分得越细、瞄得越准,信息交流的效率也就越高。此外,除了数据的细分,还可以通过数据模型预测不同选民的不同需要和行为模式,最终把个性化的短信和视频通过互联网或手机送达特定的群体。

除了交流,成功的动员也离不开有效的数据支持。研究表明,选举动员的重点是争取“墙头草”或“中间派”,最有效的方式是派出志愿者上门游说,这可能将选票拉升几个百分点,在势均力敌的情况下,成为胜出的关键。如果能掌握这类“中间派”人士的基本信息甚至个人喜好,志愿者的登门游说就能有的放矢、事半功倍。所以如何在网上确定这个群体、获取他们的数据,是决定动员效率的一个关键。

此外,通过不同数据库之间的分析和整合,为毕业于同一个学校、居住在同一个地区甚至拥有同一个爱好或观点的志愿者建立新的网络联系体,让支持者感觉同声同气、彼此相连,也能极大提高动员的效率和士气。

围绕数据细分的这些精细化的应用,可谓多不胜数。这种基于数据的选民细分方法,也被称为“纳米定位”(Nanotargeting) 。

当然,奥巴马能否最终当选,还取决于政治、经济、社会等等诸多方面的因素,但如果仅仅从技术层面来考虑,这一仗争的是数据,比的是数据收集、分析以及整合的能力。从这个意义上来说,得数据者得天下。这种基于数据的竞争,当然不仅仅局限在政治选举的领域。其实,早在2008年奥巴马当选总统之前,商业领域的数据竞争现象就引起了学界的研究和关注。

线上商城
会员家.png 书天堂.png 天猫旗舰店.png
会员家 书天堂 天猫旗舰店
关注我们
微信公众号.png   微博二维码.png
微信公众号官方微博

微信号:bbtplus2018(工作时间)
电话:0773-2282512(工作时间)

我要投稿

批发采购

加入我们

版权所有:广西师范大学出版社集团 GUANGXI NORMAL UNIVERSITY PRESS(GROUP) |  纪委举/报投诉邮箱 :cbsjw@bbtpress.com    纪委举报电话:0773-2288699
网络出版服务许可证: (署) | 网出证 (桂) 字第008号 | 备案号:桂ICP备12003475号-1 | 新出网证(桂)字002号 | 公安机关备案号:45030202000033号