关注 spark技术分享,
撸spark源码 玩spark最佳实践

spark streaming structured streaming区别

前言

       引用Spark commiter(gatorsmile)的话:“从Spark-2.X版本后,Spark streaming就进入维护模式,Spark streaming是低阶API,给码农用的,各种坑;Structured streaming是给人设计的API,简单易用。由于太忙,所以一直没有在官方文档上 更新说明信息”

        这个坑,我想大部分朋友和我一样–>也已经被坑了很久。既然被坑了,那就看看怎么个坑法,然后探讨一下下他们之间的区别,希望对正在被坑的人有一定的帮助。

区别

1、Structured streaming详细介绍

Databricks的博文:https://databricks.com/blog/2016/07/28/structured-streaming-in-apache-spark.html

说明文档:https://docs.databricks.com/spark/latest/structured-streaming/index.html

2、Spark streaming详细介绍

Databricks的博文:https://databricks.com/blog/2014/09/16/spark-1-1-the-state-of-spark-streaming.html

3、区别

参考:

https://www.quora.com/What-are-the-differences-between-Spark-streaming-and-Spark-structured-streaming-Is-Spark-structured-streaming-the-future-of-Spark-streaming

结合Kafka使用举例

1、Spark streaming +Kafka(Spark-2.X以后就没有用例了,推测已经进入维护状态,不再维护)

Spark-1.6.0版本:http://spark.apache.org/docs/1.6.0/streaming-kafka-integration.html

2、Structured streaming+Kafka

Spark-2.1.0版本:http://spark.apache.org/docs/2.1.0/structured-streaming-kafka-integration.html

赞(1) 打赏
未经允许不得转载:spark技术分享 » spark streaming structured streaming区别
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

关注公众号:spark技术分享

联系我们联系我们

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏