BlockRDD-spark技术分享

BlockRDD

BlockRDD is an RDD that is created when Spark Streaming’s ReceiverInputDStream is requested to compute and createBlockRDD.

Spark Streaming calls BlockRDD.removeBlocks() while clearing metadata.

Note	It appears that `BlockRDD` is used in Spark Streaming exclusively.

Computing Partition (in TaskContext) — `compute` Method



compute(split: Partition, context: TaskContext): Iterator[T]

compute(split: Partition, context: TaskContext): Iterator[T]

Note	`compute` is part of RDD Contract to compute a partition (in a TaskContext).

compute…FIXME

`getPartitions` Method



getPartitions: Array[Partition]

getPartitions: Array[Partition]

Note	`getPartitions` is part of RDD Contract to…FIXME.

getPartitions…FIXME

`getPreferredLocations` Method



getPreferredLocations(split: Partition): Seq[String]

getPreferredLocations(split: Partition): Seq[String]

Note	`getPreferredLocations` is part of RDD Contract to…FIXME.

getPreferredLocations…FIXME

Creating BlockRDD Instance

BlockRDD takes the following when created:

SparkContext
Collection of BlockIds

BlockRDD initializes the internal registries and counters.

BlockRDD

BlockRDD

Computing Partition (in TaskContext) — `compute` Method

`getPartitions` Method

`getPreferredLocations` Method

Creating BlockRDD Instance

相关推荐

欢迎关注：spark技术分享

热门标签

近期文章

分类目录

关注公众号：spark技术分享

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

QQ咨询

回顶部

BlockRDD

Computing Partition (in TaskContext) — compute Method

getPartitions Method

getPreferredLocations Method

Creating BlockRDD Instance

相关推荐

欢迎关注：spark技术分享

热门标签

近期文章

分类目录

关注公众号：spark技术分享

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

QQ咨询

回顶部

Computing Partition (in TaskContext) — `compute` Method

`getPartitions` Method

`getPreferredLocations` Method