版本：1.0.x

功能特性

弹性扩缩容

ByConity 存储计算分离架构设计使其完美契合有动态扩缩容需求的场景，根据实际资源需求最大化资源利用率和降低成本。ByConity 的元数据和数据存储在远端，计算节点的无状态化使扩缩容变得十分轻量，只需等计算实例启动完成，即可立即服务，无需额外的数据迁移开销，实现实时扩缩容。

多租户隔离和资源共享

在 ByConity 里，用户可以为查询 SQL 指定计算组，实现物理资源隔离，避免不同租户之间查询互相干扰。当然，为了提高资源利用率，ByConity 也支持计算组之间的资源租借，实现资源共享。

图1 多租户隔离和资源共享

读写分离

ByConity 存储计算分离的架构，使其原生支持存储计算分离，其中 Insert 使用专门用于写入的计算组，Select 使用专门用于读取的计算组，读写作业之间也不会相互影响。

查询优化器

CBO：基于成本的优化能力，通过收集和分析数据库中的统计信息来评估不同执行计划的成本，并选择成本最低的计划作为最佳计划。目前 ByConity 支持：Join Reorder、Outer-Join Reorder、Join/Agg Reorder、CTE、Materialized View、Dynamic Filter Push-Down、Magic Set 等基于成本的优化能力，并为分布式计划集成 Property Enforcement。
RBO：基于规则的优化能力。支持：列裁剪、分区裁剪、表达式简化、子查询解除关联、谓词下推、冗余运算符消除、Outer-Join to Inner-Join、运算符下推存储、分布式运算符拆分等常见的启发式优化能力。
DBO：基于数据依赖的优化能力。支持：唯一键、functional dependency、Order dependency、Inclusion dependency 等基于数据依赖关系的优化能力。

查询调度

ByConity 目前支持两种查询调度策略：Cache-aware 调度和 Resource-aware 调度。其中：

Cache-aware 调度策略针对计算和存储分离的场景，旨在最大化 Cache 的使用避免冷读。Cache-aware 调度策略会尽可能地将任务调度到拥有对应数据缓存的节点上，实现计算命中 Cache，提升读写性能。同时，由于系统进行动态的扩缩容，当计算组的拓扑发生变化时，需要最小化 Cache 失效对查询性能的影响。
Resource-aware 调度通过感知整个集群中计算组不同节点的资源使用情况，并有针对性地进行调度，以最大化资源利用，同时还会进行流量控制，确保合理使用资源，避免过载造成的负面影响，如系统宕机等。

数据湖

在 0.2.0 版本上，ByConity 增加了对数据湖的支持，ByConity 可以通过建立外表的形式访问 Hive 数据。支持存储系统包括 HDFS 和 S3，支持的文件格式包括 Parquet 和 ORC，同样也支持 Disk Cache。

{' '}

图2 ByConity支持Hive外表数据湖另外一个重要支持，是对hudi外表的支持。hudi是在数据湖中用的比较多的方案。hudi提供两种表，一种是copy-on-write，一种是merge-on-write。目前ByConity支持这两种hudi外表。对hudi外表操作，同时支持ddl，也可以通过table function操作hudi外表。 ![](./assets/ef4fdc37-afe5-4e0d-9914-9dd6f0b5bc7b.png)图3 ByConity支持Hudi外表

ELT

ByConity 在 0.2.0 版本上支持了 ELT，目前支持了部分能力，例如异步能力、执行队列、以及 worker 中以 disk 为主的 shuffle 能力。在 0.3.0 版本中，我们采用了新的 BSP（Bulk Synchronous Parallel）模式，并优化了基于硬盘的洗牌，实现了在有限条件下提高吞吐。尽管在语义上仍为一次性全部调度，但 ByConity 系统已能执行阶段性调度。而 ELT 使用时，我们还需进一步实现逐阶段执行。

更多介绍请参考ELT 能力介绍.

{' '}

图4 ByConity支持ELT

倒排索引

ByConity 在 0.3.0 的版本上已支持倒排索引功能。这一新的特性增强了 ByConity 对文本检索的能力，特别是在进行日志数据分析等需要大量查询的场景中，能够提供高性能的查询。

功能特性

弹性扩缩容​

多租户隔离和资源共享​

读写分离​

查询优化器​

查询调度​

数据湖​

ELT​

倒排索引​