为数据而生:大数据创新实践
2015年度十大科技创新人物周涛首部个人专著横空出世
图书简介
在大数据概念如此流行的今天,为什么要读这本书?中国大数据领军人、大数据创新与实践一线专家、百万级畅销书《大数据时代》中文版译者周涛,耗时三年,将海量真实案例披沙拣金呈现给广大读者。在本书中,您将看到大数据在智慧交通系统、个性化医疗、智慧学校以及金融和商业等领域的中国式创新实践,并为未来大数据的发展提供有可行性的路径指南。什么样的人才能在下一个时代生存和发展?大数据3.0时代我们究竟要做些什么?数据交易如何让数据资源成为汇聚之地?每个企业又该如何成为大数据企业?周涛教授通过真实案例告诉读者:拥有大数据的理念,能够掌握数据和运用数据的人和企业,才能在“一切都被记录,一切都被分析”的数据化时代得以生存。无论现在从事什么行业,即便不能掌握一项特定的数据技术,了解大数据的理念、培养大数据的思维模式是非常重要的。学会用数据说话,用数据分析的结果来证明“哪个更好,哪个更坏”并指导我们作出正确决策。
这不是坚硬的学术专著,而是一部柔软的情怀之书!没有晦涩的文辞,枯燥的说教,字里行间洋溢着浓浓的数据情怀和拳拳的责任之心。周涛教授讲述了很多在大数据领域努力拼搏,希望有所创新的中国人的故事,相信这些故事背后的理念、技术和精神能够唤起更多年轻的创新者,为我们民族的复兴作出自己的贡献。
领跑大数据3.0时代,大数据创新实践的扛鼎之作!大数据1.0,是将自身业务上产生的大量数据,利用深入的分析使其不断优化,优化之后的业务产生更多数据的正向循环。大数据2.0,是如何把自身业务的数据用来解决业务以外的其它问题,或者如何用业务以外的数据解决自身业务的问题。大数据3.0,是如何在资本和文化的催化作用下,让数据、技术、需求和人才等大数据创新要素融为一体。三个版本强调的不是时间上的先后顺序或逻辑上的依存关系,而是就其与传统数据应用在理念上的差异程度进行的划分。
目录
自序:在麻瓜和魔法师之间做出选择Part.1大数据时代,用数据说话
01从万物皆数到万事皆数
主动或被动,我们都是数据贡献者
一切都被记录,一切都被分析
四大方面,让数据指数级增长
02从十数九表到数态万千
结构化数据
非结构化数据
03从隔水相望到阡陌交通
地点数据
个人数据
数据与数据,1+1远大于2
大数据创新实践:
用购买记录给用户画像
04大数据和云计算驱动新工业革命
计算:第三次工业革命中的新能源
数据:第三次工业革命中的新材料
证析:第三次工业革命中的先进工艺技术
个性化:大数据时代最显著的商业特征
大数据创新实践:
一张失败的公交卡
个性化医疗,安吉丽娜·朱莉和史蒂夫·乔布斯
Part.2大数据1.0:分析
05统计呈现洞见
抓出非法的MCC套用
打击“电老鼠”
“抓获”过度医疗和骗保行为
识别社交网络中的垃圾用户
新浪微博面临的三大问题
快递员的通话记录蕴藏哪些商机
付费节目点播最多的是什么
06关联蕴含价值
关联规则挖掘
协同过滤
关联分析是寻找因果关系的利器
大数据创新实践:
谁最关注超声波洁面产品
发现“一月三电号”僵尸用户
07预测指导决策
点击购买类预测
基于移动轨迹的位置预测
链路预测
大数据预测的主流方法是什么
大数据创新实践:
一张信用卡逾期不还款的概率有多大
签到记录预测用户的土著化指数
Part.3大数据2.0:外化
08寻求外部数据的帮助
从行为数据预测学生考试成绩
从食堂打卡记录中“定位”孤独人群
从社会计量标牌洞察人力资源管理
预测离职率和升职率
行为数据让非法集资无所遁行
09自身数据的外部价值
45个关键词实时预测流感趋势
阿里巴巴的“淘CPI”指数
10机器学习,数据外化最神奇的利器
机器学习三板斧1:特征
机器学习三板斧2:模型
机器学习三板斧3:融合
Part.4大数据3.0:集成
11交易市场:数据资源的汇聚地
科研数据共享
政府数据开放
全国可流通数据的目录体系
12数据城堡:数据人才的竞技场
Kaggle,数据科学之家
数据城堡,Kaggle模式的中国尝试者
13创新工厂:数据技术的嘉年华
大数据创业公司困境
大型传统企业信息化的难题
构建大数据挖掘平台
建设大数据创新工厂
结束语成为大数据企业
致谢