《开源大数据热力报告2022》入围项目公示

CSDN资讯 CSDN资讯     2022-12-09     749

关键词:

在开源大数据技术飞速发展的十数年,我们见证了多元化技术的兴起和变迁。如何从海量数据中,通过数据处理和可视化的手段,对开源大数据技术的过去、现在和未来,做出深刻洞察?如何为开发者在开源大数据技术领域的学习、选型和技术研发提供有益参考?带着这样的思考,开放原子开源基金会、X-Lab 开放实验室、阿里巴巴开源委员会共同发起了「2022 开源大数据热力报告」项目。

项目简介

「2022 开源大数据热力报告」收集相关公开数据进行关联分析,通过Star、Issue、open PR 等核心指标绘制基于大数据技术栈的热力地图,研究开源大数据进入新阶段后的技术趋势,以及开源社区的运作模式对技术走向的助推作用。项目研究遵循如下7个阶段:公开数据初筛->项目技术分类->专家审议->入围公示&征集修正->热力值计算和关联分析->数据洞察和课题研究->报告审议。

数据来源

2015年1月至2022年9月的Github和Jira公开数据,包括项目id、Star、Issue、open PR,review comment,merge PR等。

数据初筛

项目初筛 Github 上 Topic Tag满足如下条件且开源的大数据项目:Topic Tag:big-data、etl、data-ingestion、data-collection、data-pipeline、data-analysis、data-analytics、analytics、data visualization、business-intelligence、data science、data-engineering

技术分类

根据大数据现代技术栈框架,对初筛项目进行技术分类。技术分类包括:数据集成、流处理、数据存储、数据查询和分析、数据开发、数据调度和编排、数据管理/安全/中间件、数据可视化。

#说明:

  • 数据查询和分析分类聚焦大数据分析类型项目,不包括OLTP数据库、OLTP能力为主的HTAP数据库和NoSQL数据库
  • 数据可视化分类中需具备数据源链接和处理能力,不包括可视化框架工具项目
  • 数据管理/安全/中间件分类中,项目较少且功能互相交叠,因此归为一类
  • 本次报告聚焦大数据领域,不包含大数据AI融合型项目

项目公示

现将本次入围项目(共计92个)予以公布,公示期为2022年10月10日至10月16日。



其他项目补充征集

如果你也是开源项目的爱好者,如果你熟知的项目不在上述列表,但是满足以下标准,可在公示期内扫描下方二维码参与项目提报。

参与标准:

1、开源大数据项目,有明确的开源协议、完善的文档;半年内发布过新版本
2、Github 上带有如下 Topic Tag 之一:big-data、etl、data-ingestion、data-collection、data-pipeline、data-analysis、data-analytics、analytics、data visualization、business-intelligence、data science、data-engineering

参与方式:

扫描上方二维码,参与征集截止日期:2022年10月16日24时

发布预告

「 开源大数据热力报告2022」将于2022年11月云栖大会现场正式发布。

2022开源大数据热力报告

...题研究7、报告审议项目初筛Github上TopicTag满足如下条件且开源的大数据项目:TopicTag:big-data、etl、data-ingestion、data-collection、data-pipeline、data-analysis、data-analytics、analytics、datavisualization、business-intelligence、datascience、data-e... 查看详情

2022开源大数据热力报告

...题研究7、报告审议项目初筛Github上TopicTag满足如下条件且开源的大数据项目:TopicTag:big-data、etl、data-ingestion、data-collection、data-pipeline、data-analysis、data-analytics、analytics、datavisualization、business-intelligence、datascience、data-e... 查看详情

开源大数据热力榜单top30

...。Pulsar、Doris、StarRocks、DolphinScheduler、SeaTunnel等一众中国开源项目也表现出高热力趋势。把解决用户痛点作为核心竞争力,是这些优秀开源项目的共同特征,这一特征保证它们与时俱进,成为热力趋势中的“常青树”... 查看详情

开源大数据热力榜单top30

...。Pulsar、Doris、StarRocks、DolphinScheduler、SeaTunnel等一众中国开源项目也表现出高热力趋势。把解决用户痛点作为核心竞争力,是这些优秀开源项目的共同特征,这一特征保证它们与时俱进,成为热力趋势中的“常青树”... 查看详情

开源“摩尔定律”即将打破,《2022开源大数据热力报告》重磅发布

...在2022云栖大会一体化大数据智能峰会上,由开放原子开源基金会、X-lab开放实验室和阿里巴巴开源委员会联合出品的《2022年开源大数据热力报告》重磅发布。开放原子开源基金会副秘书长刘京娟女士对报告进行了深度解读。... 查看详情

开源“摩尔定律”即将打破,《2022开源大数据热力报告》重磅发布

...在2022云栖大会一体化大数据智能峰会上,由开放原子开源基金会、X-lab开放实验室和阿里巴巴开源委员会联合出品的《2022年开源大数据热力报告》重磅发布。开放原子开源基金会副秘书长刘京娟女士对报告进行了深度解读。... 查看详情

开源大数据热力榜单top30

本报告从102个入围项目中,评选出了TOP30热力榜单。Kibana以989.40的热力值高居榜首。ClickHouse(数据查询与分析)、Airflow(数据调度与编排)、Flink(流处理)、Airbyte(数据集成)分别摘得各自... 查看详情

2016中国app分类排行榜参选入围产品公示

2016中国APP分类排行榜参选入围产品公示  由中国科学院《互联网周刊》、中国社会科学院信息化研究中心、eNet硅谷动力共同主办的2016中国APP分类排行榜发布暨颁奖晚宴即将举行。此次颁奖晚宴主题是:惊喜的构想只需要... 查看详情

剑指serverless,入围forresterwave,6.5lts预览,tidb多元数据生态再升级|pingcapdevcon2022

2022年12月1日-3日,由PingCAP主办的年度数据技术盛会PingCAPDevCon2022在线上成功举行。本届DevCon以"去发现,去挑战"为主题,邀请了多位行业意见领袖、专家学者和70多位来自全球的技术大咖聚焦云原生、HTAP、Serverle... 查看详情

中国ai学会会士今年增选公示:14位大牛入围,孙茂松周明在列

...AI今年中国人工智能学会会士增选迎来公示,共有14人入围,获得学会的最高学术荣誉。其中,清华大学人工智能研究院常务副院长孙茂松、创新工场人工智能工程院首席科学家周明等在列。自2018年以来,每年学... 查看详情

用于大数据商业智能报告的开源数据库?

】用于大数据商业智能报告的开源数据库?【英文标题】:OpenSourceDBforbusinessintelligencereportingonbigdata?【发布时间】:2012-08-2105:47:41【问题描述】:我们公司有独特的报告需求。我们每X分钟收集一个文件中的大量数据。这些文件... 查看详情

openstack管理界面开源啦!

日前,木兰开源社区TOC召开了孵化项目审议会议,其项目分别覆盖数据库、大数据处理、网络、流媒体、云计算等关键领域。其中,浪潮数据纯自研产品Skyline成功入围。自开源至今,OpenStack常被诟病的一点是原生... 查看详情

bsvhackathonbsv编程马拉松决赛入围名单出炉——top3项目大揭秘

...8月24日信息来源:bitcoinassociation.net比特币协会公布了入围第四届BSV编程马拉松决赛(前三名)的项目名单,他们从上周入围的六名半决赛选手中脱颖而出。第四届BSV编程马拉松于6月14日正式启动,参赛者们在... 查看详情

ffa2022收官总结|活动报告出炉,实时即未来!

作为开源大数据领域的顶级峰会,FlinkForward集结了无数优秀的行业实践和领先的技术动态,始终拥抱未来。2022年11月27日,第五届FlinkForwardAsia大会——FlinkForwardAsia2022完美收官。此次FFA2022由阿里云计算平台事业部主办... 查看详情

[转]2017年最具价值的十大开源项目!github年度报告~

...了一些年度的数据,包括其网站中最受欢迎的编程语言、开源项目等。那么今年哪些开源项目最具价值呢?我们一起来看看被Fork最多的开源项目:  具体这些项目是啥呢,接下来我们详细介绍一下: 1tensorflowhttps://gith... 查看详情

《2022中国开源贡献度报告》首次发布!

...事长、极客帮创投创始合伙人蒋涛现场发布了《2022中国开源贡献度报告》。中国拥有占全球30%的最大规模开发者群体,开源增长空间和潜力巨大。而作为科技创新的重要模式,开源得到普遍重视,已经列入我国重大... 查看详情

分布式存储排名前十名都有哪些?

...ge就读博士期间的工作、成果于2004年发表,并随后贡献给开源社区。经过多年的发展之后,已得到众多云计算和存储厂商的支持,成为应用最广泛的开源分布式存储平台。二、GFSGFS是google的分布式文件存储系统,是专为存储海量... 查看详情

2022世界杯开源项目实战使用docker部署world-cup-2022-cli-dashboard数据看板工具(代码片段)

【2022世界杯开源项目实战】使用docker部署world-cup-2022-cli-dashboard数据看板工具一、world-cup-2022-cli-dashboard介绍1.工具介绍2.数据看板的内容二、检查本地docker环境1.检查docker版本2.检查docker状态三、构建world-cup-2022-cli-dashboard的镜像1.... 查看详情