正文

火山引擎：强大的数据分析平台如何构建基于clickhouse的查询优化器

过往记忆  过往记忆  2022-12-08  379

关键词：

相信大家都对大名鼎鼎的ClickHouse有一定的了解了，它强大的数据分析性能让人印象深刻。但在字节大量生产使用中，发现了ClickHouse依然存在了一定的限制。例如：

缺少完整的upsert和delete操作
多表关联查询能力弱
集群规模较大时可用性下降（对字节尤其如此）
没有资源隔离能力

因此，我们决定将ClickHouse能力进行全方位加强，打造一款更强大的数据分析平台。后面我们将从五个方面来和大家分享，此前两篇内容分别为大家介绍了“更新删除”和“多表关联查询”，本篇将详细介绍我们是如何构建ClickHouse的查询优化器。

查询优化器有多重要？

在传统的关系型数据库中，如Oracle、DB2、MySQL，查询优化器都是作为几个最重要的核心组件之一。可以说，没有查询优化器的数据库是不完整的。相对 OLTP 而言在OLAP领域中更是如此；对于分析类场景，查询更为复杂，计划好坏的差异更大。一个优秀的查询优化器可以防止用户写出不好的SQL导致执行速度慢，能够准确的选择出一条效率最高的执行路径，大幅度降低查询时间。相应的，一个不好的查询优化器，甚至会让查询变慢。

常见的优化器逻辑分为两类，一类叫“基于规则的优化（RBO）”，另一类称为“基于代价的优化（CBO）”，实际应用过程中应当两类兼顾才能取得最佳效果。

基于规则的优化

根据优化规则对关系表达式进行转换，这里的转换是说一个关系表达式经过优化规则后会变成另外一个关系表达式，同时原有表达式会被裁剪掉，经过一系列转换后生成最终的执行计划。RBO中包含了一套有着严格顺序的优化规则，同样一条SQL，无论读取的表中数据是怎么样的，最后生成的执行计划都是一样的。同时，在RBO中SQL写法的不同很有可能影响最终的执行计划，从而影响脚本性能。

基于代价的优化

根据优化规则对关系表达式进行转换，这里的转换是说一个关系表达式经过优化规则后会生成另外一个关系表达式，同时原有表达式也会保留，经过一系列转换后会生成多个执行计划，然后CBO会根据统计信息和代价模型(Cost Model)计算每个执行计划的Cost，从中挑选Cost最小的执行计划。

ByteHouse的查询优化器

目前主流的OLAP的引擎在查询优化器方面做的并不够好，尤其是ClickHouse。众所周知ClickHouse以快著称，但是它的快是采用了力大飞砖的方式，需要用户将数据预先生成大宽表，以避免过于复杂的多表查询从而获得高性能。而代价是，每次维度变化或新需求都需要大量操作，以及在必须使用多表关联进行分析的场景中显得十分无力。

作为一个企业级的OLAP数据库来说一个完善且强大的优化器是必不可少的，因此，ByteHouse从零开始自研的了查询优化器。

查询优化的完整流程

上图描述了整个查询的执行流程，从 SQL parse 到执行期间所有内容全部进行了重新实现（其中紫色模块），构建了一套完整的且规范的查询优化器。

主要功能模块

Analyzers

Analyzers 目录包括两部分功能：

•一个是 QueryRewriter，一方面是通过 AST 改写的方式实现一些语法特性；我们同时支持 Clickhouse SQL 和标准 SQL，所以另一方面是确保在 Clickhouse SQL 模式下 SQL 语义能和原生 Interpreter 执行模式一致。

•另一个是 QueryAnalyzer，用于对改写完的 AST 进行语义的分析和验证。Analyzer 区分 ANSI SQL 和 Clickhouse SQL 两种模式。

QueryRewriter 针对 ANSI SQL 的改写主要有：

•With CTE/view 展开；

•UDF 展开；

•特定函数的改写，比如将 count(*) 改写为 count()，将 countDistinct(...) 改写为 uniqExact(...)；

QueryRewriter 针对 Clickhouse SQL 的改写主要有：

•With CTE/view 展开；

•UDF 展开；

•特定函数的改写；

•JoinToSubquery 展开，对应于 Interpreter 链路下的 JoinToSubqueryTransformVisitor；

•Qualified name 归一化，对应于 Interpreter 链路下的 TranslateQualifiedNamesVisitor；

•Alias 改写，对应于 Interpreter 链路下的 QueryNormalizer；

QueryAnalyzer 查询语义进行分析和校验，将 AST 抽象成出结构化的数据结构，为下一步构建 plan 提供数据。在该模块中标准 SQL 和 Clickhouse SQL 进行了区分，一套代码同时兼容两种语义。

QueryPlan

在 Analyze 之后则是利用 Analyze 出的数据结构构建初始的查询计划。QueryPlan 是在社区的 QueryPlanStep 基础上改进而来，一方面增加了序列化/反序列化方法，为了计划下发执行基于 QueryPlan 并非 AST 或者 SQL 文本。另一方面是对社区中不合理的 Step 进行更改，让每个 Step 仅仅表达关系代数的语义而非很多执行相关的内容和参数，而这些执行相关的信息则是在每个执行的 server 上构建执行 pipeline 时才真正进行获得。

Optimizer

构建完执行计划后则是最为关键最后为核心的优化器模块。PlanOptimizer 类是查询优化的入口类，首先会基于 PlanPattern 对 SQL的查询做一次粗粒度的分类，不同复杂度的查询使用不同的规则集合，提升效率。

优化器不管是 RBO 还是 CBO 本质上都是对查询做改写，只是改写的思路以及改写框架有不同的取舍。我们实现了三种改写框架，用于处理不同的场景：

•基于 visitor 的改写框架：可以 Top-Down，也可以 Botton-Up 的方式对一个 QueryPlan 做改写，它比较适合于带有上下文依赖的优化规则，例如 PredicatePushDown，需要把 Predicate 一层层的往下推。

•基于 pattern-match 的改写框架：这种适合简单、通用的改写规则，例如对于两个连续的 Filter 做合并的动作，只要 QueryPlan 里面的 Sub Plan 符合 Filter-Filter 这样的 pattern，就可以 match 对应的优化规则，进行改写。

•基于 Cascade 的改写框架：通过遍历等价计划，并将所有的等价计划存储在一个内存空间中，然后评估每种等价计划的代价，进而选择一种最优解。

查询优化器带来了什么

在性能方面，原生Clickhouse受限于缺少查询优化器，对于 TPC-DS测试集的99个SQL用例仅能正常运行很少一部分查询，即使通过手动改写 SQL 也仅能成功运行 80%的查询。在实现了完善的优化器之后可以直接运行全部 TPC-DS 原始 SQL，改进后的 Clickhouse 才这正可以算是可用的 OLAP 数据库。不仅仅是可以正常执行这些复杂查询，而且效率也得到了很大的提升，相对在没优化器的情况下手动改写的 SQL ，性能提升 6 倍以上。在内部的一些业务场景中性能也有近10倍的提升。

优化器的能力方面：

•RBO：支持：列裁剪、分区裁剪、表达式简化、子查询解关联、谓词下推、冗余算子消除、Outer-JOIN 转 INNER-JOIN、算子下推存储、分布式算子拆分等常见的启发式优化能力。

•CBO：基于 Cascade 搜索框架，实现了高效的 Join 枚举算法，以及基于 Histogram 的代价估算，对 10 表全连接级别规模的 Join Reorder 问题，能够全量枚举并寻求最优解，同时针对大于10表规模的 Join Reorder 支持启发式枚举并寻求最优解。CBO 支持基于规则扩展搜索空间，除了常见的 Join Reorder 问题以外，还支持 Outer-Join/Join Reorder，Magic Set Placement 等相关优化能力。

•分布式计划优化：面向分布式MPP数据库，生成分布式查询计划，并且和 CBO 结合在一起。相对业界主流实现：分为两个阶段，首先寻求最优的单机版计划，然后将其分布式化。我们的方案则是将这两个阶段融合在一起，在整个 CBO 寻求最优解的过程中，会结合分布式计划的诉求，从代价的角度选择最优的分布式计划。对于 Join/Aggregate 的还支持 Partition 属性展开。

•高阶优化能力：实现了 Dynamic Filter pushdown、单表物化视图改写、基于代价的 CTE （公共表达式共享）。

下面我们用TPC-DS标准测试集，来为大家展现一下添加优化器前后的差别：

在没有优化器时，仅能完成26个SQL的查询。而添加了优化器后，能够完整跑完TPC-DS的全部99个SQL，并且在此前能完成的查询中，性能也得到了极大的提升。

ByteHouse已经全面对外服务，并且提供各种版本以满足不同类型用户的需求。在ByteHouse官网上提交试用信息即可免费试用！欢迎大家试用。

扫码即可免费试用

另外，也欢迎大家扫描下方二维码加入ByteHouse & ClickHouse交流群，交流关于ByteHouse和ClickHouse的使用经验，有问题也可以咨询群中技术专家。

点击阅读原文，跳转ByteHouse官网试用产品

火山引擎：构建面向异构算力的边缘计算云平台

导读1月6日，“火山引擎产品技术大讲堂”2022年首期直播在线开讲，围绕"算力"主题，探讨多样化的算力应用与实践。边缘计算产品负责人沈建发分享了火山引擎边缘计算如何解决万物互联时代异构算力行业发... 查看详情

火山引擎datatester：5个优化思路，构建高性能a/b实验平台

导读：DataTester是由火山引擎推出的A/B测试平台，覆盖推荐、广告、搜索、UI、产品功能等业务应用场景，提供从A/B实验设计、实验创建、指标计算、统计分析到最终评估上线等贯穿整个A/B实验生命周期的服务。DataTeste... 查看详情

火山引擎datatester：5个优化思路，构建高性能a/b实验平台

火山引擎dataleap推出全链路智能监控报警平台

...SLA）任务的基线监控覆盖率超过80%。当前，该能力已通过火山引擎DataLeap向企业开放。企业可以通过火山引擎DataLeap的基线监控功能，有效降低监控配置成本、避免无效报警及报警泛滥。图：火山引擎DataLeap监控范围火查看详情

火山引擎datatester：构建增长闭环，3-5人即可搭建企业增长团队

...然有很多的疑问，比如指标体系应该怎么搭建？如何通过数据分析找到关键瓶颈？找到之后下一步应该怎么做等。近日，火山引擎数智平台专家鲍文霞在DataFunTalk做了演讲分享，介绍了字节跳动在企业增长方面的经验。企业的增... 查看详情

火山引擎dataleap：揭秘字节跳动数据血缘架构演进之路

...数据平台微信公众号，回复【1】进入官方交流群DataLeap是火山引擎数智平台VeDI旗下的大数据研发治理套件产品，帮助用户快速完成数据集成、开发、运维、治理、资产、安全等全套数据中台建设，降低工作成本和数据维护成本... 查看详情

apachepulsar在火山引擎emr的集成与场景(代码片段)

...用，其应用场景和客户案例也在不断地丰富与扩充。火山引擎是字节跳动的企业服务品牌，主要面向ToB业务场景。火山引擎中Stateless云原生开源大数据平台E-MapReduce（简称EMR）为用户提供了云上的端到端的大数据解决方案。... 查看详情

直播预告|企业如何轻松完成数据治理？火山引擎dataleap给你一份实战攻略！

...选型、平台能力、数据部署方式等“软”技能。DataLeap是火山引擎数智平台VeDI旗下的大数据研发治理套件产品，可帮助用户快速完成数据集成、开发、运维、治理、资产、安全等全套数据中台建设，降低工作成本和数据维护成本... 查看详情

数据丢失不用怕，火山引擎dataleap提供排查解决方案

...dump的稳定性和准确定带来极大的挑战。针对这一问题，火山引擎数智平台推出的大数据研发治理套件DataLeap，可以为企业提供完整解决方案，帮助解决MQdump在极端场景中遇到的数据丢失问题。例如，当HDFS（一种分布式文件系统... 查看详情

火山引擎项亮揭秘字节跳动基于hpc的大规模机器学习技术｜直播分享报名

...，当前机器学习也是一个非常时髦的话题。2021年12月火山引擎云产品发布会上正式发布了 AI全系产品，其中的AI开发平台就是全流程、高效率、高性能的机器学习平台。该平台提供从数据准备到模型训练、再到推理整个... 查看详情

火山引擎发布数智平台vedi，全面开放字节跳动数据技术能力

...taIntelligence），包括数据引擎、数据建设和管理、数据分析应用及解决方案的全链路数据能力，在安全合规的前提下充分发挥查看详情

火山引擎datatester推出可视化数据集成方案

...快速将A/B测试平台嵌入业务成为很多企业的痛点。近期，火山引擎DataTester 推出可视化数据集成能力，可以帮助企业实现对历史数据资产的直接复用。为了更低成本支持数据集成的需求，DataTester 还采用了可视化数据集成... 查看详情

火山引擎发布新一代数智平台vedi，以数据驱动企业数字化增长

...taIntelligence），包括数据引擎、数据建设和管理、数据分析应用及解决方案的全链路数据能力，在安全合规的前提下充分发挥查看详情

火山引擎vedi零售行业解决方案聚焦精准营销场景提升品牌转化

...，进行公域数据洞察，从达人直播间受众分析、历史带货数据分析、直播场均表现等多个维度，还原更直观的达人情况。在这之后，火山引擎数智平台达人直播优选方案还将帮品查看详情

如何在clickhouse中实现资源隔离？火山引擎实践经验分享

...家都对大名鼎鼎的ClickHouse有一定的了解了，它强大的数据分析性能让人印象深刻。但在字节大量生产使用中，发现了ClickHouse依然存在了一定的限制。例如：缺少完整的upsert和delete操作多表关联查询能力弱集群规模较... 查看详情

如何在clickhouse中实现资源隔离？火山引擎实践经验分享

一文快速了解火山引擎a/b测试平台

...esting作为因果推断的「黄金标准」，是效果评估的利器。火山引擎A/B测试（DataTester）是一站式大规模的在线A/BTesting和智能调优平台，它基于稳定可靠的分流能力、科学完善的统计引擎、智能的调优算法，提供了从制定优化目标... 查看详情

助力企业数据飞轮转起来！火山引擎云原生数仓bytehouse全面大促中

...的路径。去年，字节跳动正式将自身数据驱动能力，通过火山引擎数智平台VeDI全面向外开放，为企业提供了丰富的数据能力工具；而在今年四月举行的春季FORCE原动力大会上，火山引擎正式对外发布了数据飞轮模式，进一步解析... 查看详情