写在阿里Blink正式开源之际
阿里最近要正式将内部Blink开源,搞Blink 的大牛也在 AI 前线公众号上推了文章,介绍Blink的优势重磅!阿里Blink正式开源, ...
阿里最近要正式将内部Blink开源,搞Blink 的大牛也在 AI 前线公众号上推了文章,介绍Blink的优势重磅!阿里Blink正式开源, ...
我们都知道,之前的 CBO,都是基于静态信息来对 执行计划进行优化,静态统计信息大家都懂的,不一定准确,比如hive中的catal ...
1、前言近些年来,在对Spark SQL优化上,CBO是最成功的一个特性之一。CBO会计算一些和业务数据相关的统计数据,来优化查询, ...
目录:一、数据倾斜介绍与定位二、解决方法一:聚合数据源三、解决方法二:提高shuffle操作reduce并行度四、解决方法之三: ...
Delta 原本是在 Databricks Runtime 里面的一个增值功能,在 spark + AI Summit 2019 大会上,官方以 Apache License 2.0 协 ...
spark 君前面已经分享了好几篇关于kafka的文章,从基本概念和使用到高可用机制解析到最佳实践。今天分享几个kafka的面试题, ...
什么是 Delta Delta Lake 是一个计算层和一个一种存储格式,完全兼容 Spark APIs, 提供了高稳定性的数据和查询性能来支 ...
When you port existing workloads to Delta Lake, you should be aware of the following simplifications and differences ...
Delta Lake 对读写请求提供了 ACID 的事务保证。
Delta 的一大优势就是和 Spark Structured Streaming 深度整合,使用 readStream and writeStream. 就可以对Delata 进行流式 ...
一周热门排行