悟空视频

    在线播放云盘网盘BT下载影视图书

    企业大数据处理:Spark、Druid、Flume与Kafka应用实践 - 图书

    2017计算机·数据库
    导演:肖冠宇
    本书分三部分展开介绍:第一部分(第1章)主要介绍了企业大数据系统的前期准备工作,包括如何构建企业大数据处理系统的软件环境和集群环境。第二部分(第2~7章)首先介绍了Spark的基本原理,Spark 2.0版本的Spark SQL、Structured Streaming原理和使用方法,以及Spark的多种优化方式;然后,介绍了Druid的基本原理、集群的搭建过程、数据摄入过程,以及在查询过程中如何实现Druid查询API;接着介绍了日志收集系统Flume的基本架构和关键组件,以及分层日志收集架构的设计与实践;最后介绍了分布式消息队列Kafka的基本架构和集群搭建过程,以及使用Java语言实现客户端API的详细过程。第三部分(第8~9章)主要介绍了企业大数据处理的两个实际应用案例,分别是基于Druid构建多维数据分析平台和基于JMX指标的监控系统。
    图书

    Spark大数据处理与分析 - 图书

    2020计算机·数据库
    导演:雷擎编著
    本书是Spark技术入门的基础类书籍,通过本书的学习实验可以牢固掌握Spark编程技术的基本概念、原理和编程方法,能够进行应用程序的实际开发。
    搜索《Spark大数据处理与分析》
    图书

    Spark大数据处理:技术、应用与性能优化 - 图书

    2014计算机·数据库
    导演:高彦杰
    这是一本依据最新技术版本,系统、全面、详细讲解Spark的著作,作者结合自己在微软和IBM的实践经验和对Spark源代码的研究撰写而成。首先从技术层面讲解了Spark的体系结构、工作机制、安装与部署、开发环境搭建、计算模型、Benchmark、BDAS等内容;然后从应用角度讲解了一些简单的、有代表性的案例;最后对Spark的性能优化进行了探讨。
    搜索《Spark大数据处理:技术、应用与性能优化》
    图书

    深入理解大数据:大数据处理与编程实践 - 图书

    2014计算机·数据库
    导演:黄宜华
    本书从HadoopMapReduce并行计算技术与系统的基本原理剖析着手,在系统介绍基本工作原理、编程模型、编程框架和接口的基础上,着重系统化地介绍MapReduce并行算法设计与编程技术,较为全面地介绍了基本MapReduce算法设计、高级MapReduce编程技术、以及一系列较为复杂的机器学习和数据挖掘并行化算法,并引入来自IntelHadoop系统产品的一系列增强功能以及深度技术剖析;最后,为了提高读者的算法设计与编程实战能力,本书较为详细地介绍了一系列综合性和实战性大数据处理和算法设计问题,这些问题来自课程同学参加的全国性大数据大赛中的获奖算法、课程中的优秀课程设计、以及来自本团队的科研课题及业界实际的大数据应用实战案例。
    搜索《深入理解大数据:大数据处理与编程实践》
    图书

    大数据处理之道 - 图书

    2016计算机·数据库
    导演:何金池
    本书覆盖了当前大数据处理领域的热门技术,包括Hadoop、Spark、Storm、Dremel、Drill等,详细分析了各种技术的应用场景和优缺点;同时阐述了大数据下的日志分析系统,重点讲解了ELK日志处理方案;最后分析了大数据处理技术的发展趋势。 本书采用幽默的表述风格,使读者容易理解、轻松掌握;重点从各种技术的起源、设计思想、架构等方面阐述,以帮助读者从根源上悟出大数据处理之道。
    搜索《大数据处理之道》
    图书

    大数据处理框架Apache Spark设计与实现 - 图书

    2020计算机·数据库
    导演:许利杰 方亚芬
    近年来,以Apache Spark为代表的大数据处理框架在学术界和工业界得到了广泛的使用。本书以Apache Spark框架为核心,总结了大数据处理框架的基础知识、核心理论、典型的Spark应用,以及相关的性能和可靠性问题。本书分9章,主要包含四部分内容。第一部分 大数据处理框架的基础知识(第1~2章):介绍大数据处理框架的基本概念、系统架构、编程模型、相关的研究工作,并以一个典型的Spark应用为例概述Spark应用的执行流程。第二部分 Spark大数据处理框架的核心理论(第3~4章):介绍Spark框架将应用程序转化为逻辑处理流程,进而转化为可并行执行的物理执行计划的一般过程及方法。第三部分 典型的Spark应用(第5章):介绍迭代型的Spark机器学习应用和图计算应用。第四部分 大数据处理框架性能和可靠性保障机制(第6~9章):介绍Spark框架的Shuffle机制、数据缓存机制、错误容忍机制、内存管理机制等。
    搜索《大数据处理框架Apache Spark设计与实现》
    图书

    深入理解Flink:实时大数据处理实践 - 图书

    2019计算机·数据库
    导演:余海峰
    《深入理解Flink:实时大数据处理实践》介绍了实时数据处理引擎Flink,讲解了流处理API、批处理API、机器学习引擎FlinkML、关系型API、复杂事件处理,以及指标度量与部署模式,分析了流式数据处理理论中时间、窗口、水印、触发器、迟到生存期之间的关联和关系,深入分析了多项式曲线拟合、分类算法、推荐算法的理论和FlinkML实现。 《深入理解Flink:实时大数据处理实践》适合希望快速上手Flink 以开展实时大数据处理与在线机器学习应用的从业者阅读。
    搜索《深入理解Flink:实时大数据处理实践》
    图书

    智能数据时代:企业大数据战略与实战 - 图书

    2017计算机·数据库
    导演:TalkingData
    本书将从一个管理者的视角,从大数据的基本概念开始,循序渐进地介绍相关工具、企业数据工程的主要活动、数据团队建设以及相关的管理支持。TalkingData的十余位一线员工根据自己所在岗位的经验知识,参与了全书的编写工作,他们是(排名不分先后):何香萍,马斋,李正伟,杨慧,王俊,何坤,孔元明,姜伟,王福胜,潘松柏,卢健,张学敏,曾晓春,张宁,徐岷峰,周海鹏,吕博卿。他们不仅贡献了专业的要点知识,也融入了工作中的实战经验,知识点与案例反复穿插,增加了本书的实践价值。希望通过此书,管理者能够建立起智能企业的定位,业内专业人士能够有更清晰的战略全景和逻辑脉络。
    搜索《智能数据时代:企业大数据战略与实战》
    图书

    MongoDB大数据处理权威指南 - 图书

    导演:David Hows
    《MongoDB大数据处理权威指南(第3版)》针对MongoDB 3做了精细更新,呈现MongoDB的所有最新特性,涵盖2.2版引入的聚集框架、2.4版引入的哈希索引以及3.2版本的WiredTiger,还新纳入Node.js和Python。 MongoDB是最流行的“大数据”NoSQL数据库技术,目前仍在蓬勃发展。来自10gen的David Hows以及经验丰富的Peter Membrey和Eelco Plugge等MongoDB专家联袂撰写本书,在书中分享他们的宝贵专业知识和经验,向读者呈现成长为一名MongoDB专家需要了解的所有知识。 主要内容 ● 在所有主流服务器平台上搭建MongoDB,包括Windows、Linux、OS X和云平台(如Rackspace、Azure和Amazon EC2) ● 使用GirdFS和新的聚集框架 ● 使用非...(展开全部)
    搜索《MongoDB大数据处理权威指南》
    图书

    Druid实时大数据分析原理与实践 - 图书

    导演:欧阳辰
    Druid 作为一款开源的实时大数据分析软件,最近几年快速风靡全球互联网公司,特别是对于海量数据和实时性要求高的场景,包括广告数据分析、用户行为分析、数据统计分析、运维监控分析等,在腾讯、阿里、优酷、小米等公司都有大量成功应用的案例。《Druid实时大数据分析原理与实践》的目的就是帮助技术人员更好地深入理解Druid 技术、大数据分析技术选型、Druid 的安装和使用、高级特性的使用,也包括一些源代码的解析,以及一些常见问题的快速回答。 Druid 的生态系统正在不断扩大和成熟,Druid 也正在解决越来越多的业务场景。希望本书能帮助技术人员做出更好的技术选型,深度了解Druid 的功能和原理,更好地解决大数据分析问题。《Druid实时大数据分析原理与实践》适合大数据分析的从业人员、IT 人员、互联网从业者阅读。
    搜索《Druid实时大数据分析原理与实践》
    图书
    加载中...