网站首页 小常识 美食 教育 生活 数码 经验
  • 什么是Spark
    发表于:2020-05-28
    Spark是云计算大数据的集大成者,是Hadoop的取代者,是第二代云计算大数据技术。它作为一个基于内存计算的云计算大数据平台,在实时流处理、交互式查询、机器学习、图处理、数据统计分析等...
  • 大数据为什么要选择Spark
    发表于:2019-07-01
    Spark是一个基于内存计算的开源集群计算系统,目的是更快速的进行数据分析。Spark由加州伯克利大学AMP实验室Matei为主的小团队使用Scala开发,其核心部分的代码只有63个Scala文件,非常轻量...
  • flink和spark对比
    发表于:2017-04-17
    1、技术理念不同:Spark的技术理念是使用微批来模拟流的计算,基于Micro-batch,数据流以时间为单位被切分为一个个批次,通过分布式数据集RDD进行批量处理,是一种伪实时。而Flink是基于事件驱...