2022开源大数据热力报告

ejinxian ejinxian     2022-12-02     409

关键词:

研究遵循如下阶段:

1、公开数据初筛

2、 项目技术分类

3、 专家审议

4、入围公示 & 征集修正

5、 热力值计算和关联分析

6、 数据洞察和课题研究

7、 报告审议

项目初筛 Github 上 Topic Tag 满足如下条件且开源的大数据项目:

Topic Tag:big-data、etl、data-ingestion、data-collection、data-pipeline、data-analysis、data-analytics、analytics、data visualization、business-intelligence、data science、data-engineering

 

技术分类

根据大数据现代技术栈框架,对初筛项目进行技术分类。技术分类包括:

数据集成、流处理、数据存储、数据查询和分析、数据开发、数据调度和编排、数据管理 / 安全 / 中间件、数据可视化。

  • 数据查询和分析分类聚焦大数据分析类型项目,不包括 OLTP 数据库、OLTP 能力为主的 HTAP 数据库和 NoSQL 数据库
  • 数据可视化分类中需具备数据源链接和处理能力,不包括可视化框架工具项目
  • 数据管理 / 安全 / 中间件分类中,项目较少且功能互相交叠,因此归为一类
  • 本次报告聚焦大数据领域,不包含大数据 AI 融合型项目项目公示

项目列表

技术分类

项目名称

数据集成

airbytehq/airbyte

alibaba/DataX

apache/camel

apache/flume

apache/incubator-seatunnel

apache/inlong

apache/sqoop

dbt-labs/dbt-core

debezium/debezium

ververica/flink-cdc-connectors

流处理

apache/beam

apache/flink

apache/incubator-heron

apache/incubator-streampark

apache/kafka

apache/pulsar

apache/samza

apache/storm

数据查询和分析

apache/arrow-datafusion

apache/calcite

apache/cassandra

apache/doris

apache/drill

apache/druid

apache/hawq

apache/hbase

apache/hive

apache/impala

apache/incubator-kyuubi

apache/kylin

apache/lucene

apache/phoenix

apache/pig

apache/pinot

apache/solr

apache/spark

apache/tez

ClickHouse/ClickHouse

duckdb/duckdb

elastic/elasticsearch

eventql/eventql

greenplum-db/gpdb

opensearch-project/OpenSearch

prestodb/presto

StarRocks/starrocks

trinodb/trino

uber/aresdb

数据存储

apache/avro

apache/bookkeeper

apache/carbondata

apache/hadoop-hdfs

apache/hudi

apache/iceberg

apache/incubator-pegasus

apache/kudu

apache/ozone

apache/parquet-format

delta-io/delta

hazelcast/hazelcast

juicedata/juicefs

数据管理 / 安全 / 中间件

apache/ambari

apache/arrow

apache/atlas

apache/bigtop

apache/hadoop

apache/knox

apache/ranger

cube-js/cube.js

datahub-project/datahub

数据开发

apache/incubator-devlake

apache/zeppelin

jupyter/notebook

pachyderm/pachyderm

数据可视化

apache/superset

dataease/dataease

edp963/davinci

elastic/kibana

getredash/redash

grafana/grafana

keplergl/kepler.gl

metabase/metabase

shzlw/poli

数据调度和编排

Alluxio/alluxio

apache/airflow

apache/dolphinscheduler

apache/incubator-linkis

apache/nifi

apache/oozie

apache/zookeeper

dagster-io/dagster

kestra-io/kestra

PrefectHQ/prefect

2022开源大数据热力报告

...题研究7、报告审议项目初筛Github上TopicTag满足如下条件且开源的大数据项目:TopicTag:big-data、etl、data-ingestion、data-collection、data-pipeline、da 查看详情

《开源大数据热力报告2022》入围项目公示

在开源大数据技术飞速发展的十数年,我们见证了多元化技术的兴起和变迁。如何从海量数据中,通过数据处理和可视化的手段,对开源大数据技术的过去、现在和未来,做出深刻洞察?如何为开发者在开源... 查看详情

2022开源大数据热力报告

...题研究7、报告审议项目初筛Github上TopicTag满足如下条件且开源的大数据项目:TopicTag:big-data、etl、data-ingestion、data-collection、data-pipeline、data-analysis、data-analytics、analytics、datavisualization、business-intelligence、datascience、data-e... 查看详情

2022开源大数据热力报告

...题研究7、报告审议项目初筛Github上TopicTag满足如下条件且开源的大数据项目:TopicTag:big-data、etl、data-ingestion、data-collection、data-pipeline、data-analysis、data-analytics、analytics、datavisualization、business-intelligence、datascience、data-e... 查看详情

开源大数据热力榜单top30

...。Pulsar、Doris、StarRocks、DolphinScheduler、SeaTunnel等一众中国开源项目也表现出高热力趋势。把解决用户痛点作为核心竞争力,是这些优秀开源项目的共同特征,这一特征保证它们与时俱进,成为热力趋势中的“常青树”... 查看详情

开源大数据热力榜单top30

...。Pulsar、Doris、StarRocks、DolphinScheduler、SeaTunnel等一众中国开源项目也表现出高热力趋势。把解决用户痛点作为核心竞争力,是这些优秀开源项目的共同特征,这一特征保证它们与时俱进,成为热力趋势中的“常青树”... 查看详情

开源大数据热力榜单top30

本报告从102个入围项目中,评选出了TOP30热力榜单。Kibana以989.40的热力值高居榜首。ClickHouse(数据查询与分析)、Airflow(数据调度与编排)、Flink(流处理)、Airbyte(数据集成)分别摘得各自... 查看详情

用于大数据商业智能报告的开源数据库?

】用于大数据商业智能报告的开源数据库?【英文标题】:OpenSourceDBforbusinessintelligencereportingonbigdata?【发布时间】:2012-08-2105:47:41【问题描述】:我们公司有独特的报告需求。我们每X分钟收集一个文件中的大量数据。这些文件... 查看详情

ffa2022收官总结|活动报告出炉,实时即未来!

作为开源大数据领域的顶级峰会,FlinkForward集结了无数优秀的行业实践和领先的技术动态,始终拥抱未来。2022年11月27日,第五届FlinkForwardAsia大会——FlinkForwardAsia2022完美收官。此次FFA2022由阿里云计算平台事业部主办... 查看详情

《2022中国开源贡献度报告》首次发布!

...事长、极客帮创投创始合伙人蒋涛现场发布了《2022中国开源贡献度报告》。中国拥有占全球30%的最大规模开发者群体,开源增长空间和潜力巨大。而作为科技创新的重要模式,开源得到普遍重视,已经列入我国重大... 查看详情

盘古开源丨大数据产业价值持续释放,有效推动数字化转型升级

...生产和生活。大数据时代的特点和市场规模大数据技术以开源为主,迄今为止,尚未形成绝对的技术垄断,即便是IBM、甲骨文等行业巨擘,也同样是集成了开源技术和该公司已有产品而已。开源技术对任何一个国... 查看详情

中国信通院发布权威数据库发展报告,postgresql已成为国内第一大开源数据库

2021年6月24日,由中国信息通信研究院(以下简称“中国信通院”)主办的“2021大数据产业峰会·成果发布会”在京召开。会上,中国信通院云计算与大数据研究所副所长魏凯发布了《数据库发展研究报告(2021... 查看详情

盘古开源解析:2022年数据存储五大趋势

面对勒索软件攻击激增、人才技能仍然短缺、云计算进一步普及,2022年数据存储路在何方?近日,根据Scality发布的2022年数据存储预测报告,新的一年存储解决方案和数据存储市场将呈现以下五大趋势:AI/MLOps... 查看详情

聚焦四大领域,恒生电子发布2022年金融科技技术与应用趋势

...以下简称“报告”)。报告详细分析2022年金融科技在数据、智能、效率、安全四大领域的核心技术与应用发展趋势,并对VR、量子计算等前沿技术对金融行业的未来影响进行展望。恒生电子执行总裁范径武表示,作为... 查看详情

2022技术趋势:gorust将大放异彩

文 | 白开水不加糖出品|OSC开源社区(ID:oschina2013)在线学习平台O\'Reilly最新发布了一份《TechnologyTrendsfor2022》报告。该报告基于该平台2021年1至9月产生的数据,并与2020年同期进行了比较;就技术行业的趋势进行了一番分... 查看详情

导师男团来袭|开源之夏2022,与alluxio一起探索数据编排的奇妙世界

活动简介开源之夏(英文简称OSPP)是由“开源软件供应链点亮计划”发起并长期支持的一项暑期开源活动,今年是第三届,由中国科学院软件研究所与openEuler社区共同举办,旨在鼓励在校学生积极参与开源软... 查看详情

2022全球程序员薪酬报告:字节在榜,上海薪资近9万美元(代码片段)

...群” ,拉你进程序员交流群👇👇出品 |OSC开源社区(ID:oschina2013)Levels.fyi网站于日前发布了一份2022年度程序员收入报告,基于收集的超过150,000份薪资申请。报告中的薪酬数据反映的是在过去一年中收集... 查看详情

2022全球程序员薪酬报告出炉,看完我表示严重拖后腿了…

...务的最佳姿势!SpringCloud2022正式发布!出品 |OSC开源社区(ID:oschina2013)Levels.fyi网站于日前发布了一份2022年度程序员收入报告,基于收集的超过150,000份薪资申请。报告中的薪酬数据反映的是在过去一年中收集... 查看详情