Micro-Batch Stream Processing-spark技术分享

Micro-Batch Stream Processing (Structured Streaming V1)

Micro-Batch Stream Processing is a stream processing model in Spark Structured Streaming (often referred as Structured Streaming V1) that is used for Trigger.Once and Trigger.ProcessingTime triggers.

Micro-batch stream processing uses MicroBatchExecution as the stream execution engine.



import org.apache.spark.sql.streaming.Trigger
import scala.concurrent.duration._
val sq = spark
  .readStream
  .format("rate")
  .load
  .writeStream
  .format("console")
  .option("truncate", false)
  .trigger(Trigger.ProcessingTime(1.minute)) // <-- Uses MicroBatchExecution for execution
  .queryName("rate2console")
  .start

assert(sq.isActive)

scala> sq.explain
== Physical Plan ==
WriteToDataSourceV2 org.apache.spark.sql.execution.streaming.sources.MicroBatchWriter@678e6267
+- *(1) Project [timestamp#54, value#55L]
   +- *(1) ScanV2 rate[timestamp#54, value#55L]

// sq.stop

import org.apache.spark.sql.streaming.Trigger

import scala.concurrent.duration._

val sq = spark

.readStream

.format("rate")

.load

.writeStream

.format("console")

.option("truncate", false)

.trigger(Trigger.ProcessingTime(1.minute)) // <-- Uses MicroBatchExecution for execution

.queryName("rate2console")

.start

assert(sq.isActive)

scala> sq.explain

== Physical Plan ==

WriteToDataSourceV2 org.apache.spark.sql.execution.streaming.sources.MicroBatchWriter@678e6267

+- *(1) Project [timestamp#54, value#55L]

+- *(1) ScanV2 rate[timestamp#54, value#55L]

// sq.stop

Micro-Batch Stream Processing

Micro-Batch Stream Processing (Structured Streaming V1)

相关推荐

欢迎关注：spark技术分享

热门标签

近期文章

分类目录

关注公众号：spark技术分享

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

QQ咨询

回顶部