ISBN/价格: | 978-7-111-53216-3:CNY79.00 |
---|---|
作品语种: | chi eng |
出版国别: | CN 110000 |
题名责任者项: | 实时分析/.(美) 拜伦·埃利斯著/.Byron Ellis/.王晓伟译 |
出版发行项: | 北京:,机械工业出版社:,2016 |
载体形态项: | xiii, 299页:;+图:;+26cm |
丛编项: | 数据科学与工程技术丛书 |
提要文摘: | 本书共11章。第1章介绍常见的流数据的来源、应用以及三个重要特性:持续交付、结构松散和高基数,并阐释对流数据使用基础架构和算法的重要性。第2~6章介绍实时流架构的各组件涉及的软件、框架和方法。第2章概述实时流架构设计涉及的组件、特性、编程语言等。第3章介绍实时流架构的服务配置和协调,重点介绍协调服务器ZooKeeper。第4章阐述实时流架构中数据流程的管理,涉及用来管理数据流程的两个软件包Kafka和Flume。第5章分析流数据的处理,涉及如何用Storm或Samza来处理数据。第6章介绍流数据的存储问题。第7~11章重点关注流数据架构的应用构建问题。第7章讨论从流环境向最终用户的数据交付问题。这是构建仪表板以及其他监控应用所使用的核心机制。第8章涵盖流环境下的聚集计算问题,特别是对多分辨率时间序列数据的聚集计算问题。第9章简要介绍统计学和概率论的基础知识。第10章讨论略图,略图通常具有更快的更新速度和更小的内存占用空间,特别适合流环境。第11章讨论聚集计算之外能够应用于流数据的一些更深入的话题。 |
题名主题: | 数据处理 |
中图分类: | TP274 |
个人名称等同: | 埃利斯 著 |
个人名称次要: | 王晓伟 译 |
记录来源: | CN 江苏新华 20150511 |
电子图书: | 阅读地址 |