[内容简介]
l 在大数据概念如此流行的今天,为什么要读这本书?中国大数据领军人、大数据创新与实践一线专家、百万级畅销书《大数据时代》中文版译者周涛,耗时三年,将海量真实案例披沙拣金呈现给广大读者。在本书中,您将看到大数据在智慧交通系统、个性化医疗、智慧学校以及金融和商业等领域的中国式创新实践,并为未来大数据的发展提供有可行性的路径指南。
l 什么样的人才能在下一个时代生存和发展?大数据3.0时代我们究竟要做些什么?数据交易如何让数据资源成为汇聚之地?每个企业又该如何成为大数据企业?周涛教授通过真实案例告诉读者:拥有大数据的理念,能够掌握数据和运用数据的人和企业,才能在“一切都被记录,一切都被分析”的数据化时代得以生存。无论现在从事什么行业,即便不能掌握一项特定的数据技术,了解大数据的理念、培养大数据的思维模式是非常重要的。学会用数据说话,用数据分析的结果来证明“哪个更好,哪个更坏”并指导我们作出正确决策。
l 这不是坚硬的学术专著,而是一部柔软的情怀之书!没有晦涩的文辞,枯燥的说教,字里行间洋溢着浓浓的数据情怀和拳拳的责任之心。周涛教授讲述了很多在大数据领域努力拼搏,希望有所创新的中国人的故事,相信这些故事背后的理念、技术和精神能够唤起更多年轻的创新者,为我们民族的复兴作出自己的贡献。
l 领跑大数据3.0时代,大数据创新实践的扛鼎之作!大数据1.0,是将自身业务上产生的大量数据,利用深入的分析使其不断优化,优化之后的业务产生更多数据的正向循环。大数据2.0,是如何把自身业务的数据用来解决业务以外的其它问题,或者如何用业务以外的数据解决自身业务的问题。大数据3.0,是如何在资本和文化的催化作用下,让数据、技术、需求和人才等大数据创新要素融为一体。三个版本强调的不是时间上的先后顺序或逻辑上的依存关系,而是就其与传统数据应用在理念上的差异程度进行的划分。
[编辑推荐]
l 2015年度十大科技创新人物、百万级畅销书《大数据时代》中文版译者、中国大数据领军人周涛耗时三年首部个人专著横空出世!
l 领跑大数据3.0时代,大数据创新实践的扛鼎之作!
l 没有晦涩的文辞,枯燥的说教,字里行间洋溢着浓浓的数据情怀与拳拳的责任之心。睿智潇洒的文风背后是对大数据的一腔朴素浓厚的感情。
l 这是一部大数据在智慧城市、医疗、教育、金融、商业等领域的实践笔记;更是一部为未来大数据的发展提供有可行性的路径指南!
l 宽带资本董事长田溯宁、阿里巴巴集团执行副总裁曾鸣、香港科技大学教授杨强重磅推荐!
l 湛庐文化出品。
[“2015年度十大科技创新人物”颁奖词]
l 周涛用大数据分析的新视角,重新审视我们所面对的这个世界,他带领一群年轻人,在“大众创业,万众创新”的道路上,迈出了自己坚实的脚步。
l 在大数据挖掘与分析,特别是网络数据的挖掘与分析方面做出了系统性的贡献,其创新成果解决了重大科学问题,突破了关键核心技术,产生了重大社会经济效益,显著改善了百姓生活。
[作者介绍]
周涛
l 天才神童。1岁说话,1岁半识字,2岁学象棋,3岁打麻将,4岁看武侠小说……26岁获得教育部自然科学一等奖,27岁获聘电子科技大学正教授,29岁获得中国青年科技奖。
l 学术达人。在《物理报道》(Physics Reports)、《美国科学院院刊》(PNAS)、《自然通讯》(Nature Communication)等国际SCI期刊和SIGKDD、ICDM等国际学术会议发表论文300余篇,引用13000余次,H指数为55。入选Elsevier全球最具影响力中国学者名单(物理天文类)。
l 数据少帅。电子科技大学大数据研究中心主任,百万畅销书《大数据时代》中文译者,全国最大的数据挖掘竞赛平台Data Castle的创始人,“2015年度十大科技创新人物”获得者。
l 商业玩家。白手起家,先后创立了数之联、数联铭品、国信优易等知名大数据企业,创立和投资的大数据企业总市值过百亿。
[各方赞誉]
周涛是中国最年轻有为的大数据专家,他不仅做大数据研究,而且将产、学、研融为一体,在大数据创新实践上一直卓有成效。在大数据渡过普及期的今天,更需要像周涛这样的一线专家与实践者为下一步大数据的创新指出方向:大数据3.0时代我们究竟要做些什么?数据交易如何让数据资源成为汇聚之地?每个企业又该如何成为大数据企业?
在他这本洋溢着浓浓的数据情怀与拳拳的责任之心的著作中,我们可以看到系统而清晰的路径指南!
田溯宁
宽带资本董事长
当大数据的概念如此流行的時候,难得有本好书可以把实操、理论和理念都讲明白的,值得认真一读!
曾鸣
阿里巴巴集团执行副总裁
文笔优雅,深入浅出,思维缜密,思想深远!
杨强
香港科技大学教授
周涛用大数据分析的新视角,重新审视我们所面对的这个世界,他带领一群年轻人,在“大众创业,万众创新”的道路上,迈出了自己坚实的脚步。在大数据挖掘与分析,特别是网络数据的挖掘与分析方面做出了系统性的贡献,其创新成果解决了重大科学问题,突破了关键核心技术,产生了重大社会经济效益,显著改善了百姓生活。
“2015年度十大科技创新人物”颁奖词
[目录]
自序:在麻瓜和魔法师之间做出选择
Part.1 大数据时代,用数据说话
01 从万物皆数到万事皆数 / 005
主动或被动,我们都是数据贡献者
一切都被记录,一切都被分析
四大方面,让数据指数级增长
02 从十数九表到数态万千 / 017
结构化数据
非结构化数据
03 从隔水相望到阡陌交通 / 029
地点数据
个人数据
数据与数据,1+1远大于2
大数据创新实践:
用购买记录给用户画像
04 大数据和云计算驱动新工业革命 / 039
计算:第三次工业革命中的新能源
数据:第三次工业革命中的新材料
证析:第三次工业革命中的先进工艺技术
个性化:大数据时代最显著的商业特征
大数据创新实践:
一张失败的公交卡
个性化医疗,安吉丽娜·朱莉和史蒂夫·乔布斯
Part.2 大数据1.0:分析
05 统计呈现洞见 / 055
抓出非法的MCC套用
打击“电老鼠”
“抓获”过度医疗和骗保行为
识别社交网络中的垃圾用户
新浪微博面临的三大问题
快递员的通话记录蕴藏哪些商机
付费节目点播最多的是什么
06 关联蕴含价值 / 075
关联规则挖掘
协同过滤
关联分析是寻找因果关系的利器
大数据创新实践:
谁最关注超声波洁面产品
发现“一月三电号”僵尸用户
07 预测指导决策 / 089
点击购买类预测
基于移动轨迹的位置预测
链路预测
大数据预测的主流方法是什么
大数据创新实践:
一张信用卡逾期不还款的概率有多大
签到记录预测用户的土著化指数
Part.3 大数据2.0:外化
08 寻求外部数据的帮助 / 109
从行为数据预测学生考试成绩
从食堂打卡记录中“定位”孤独人群
从社会计量标牌洞察人力资源管理
预测离职率和升职率
行为数据让非法集资无所遁行
09 自身数据的外部价值 / 129
45个关键词实时预测流感趋势
阿里巴巴的“淘CPI”指数
10 机器学习,数据外化最神奇的利器 / 139
机器学习三板斧1:特征
机器学习三板斧2:模型
机器学习三板斧3:融合
Part.4 大数据3.0:集成
11 交易市场:数据资源的汇聚地 /155
科研数据共享
政府数据开放
全国可流通数据的目录体系
12 数据城堡:数据人才的竞技场 / 175
Kaggle,数据科学之家
数据城堡,Kaggle模式的中国尝试者
13 创新工厂:数据技术的嘉年华 / 185
大数据创业公司困境
大型传统企业信息化的难题
构建大数据挖掘平台
建设大数据创新工厂
结束语 成为大数据企业 / 201
致谢 / 211