这几个大数据github项目,太强了吧

author author     2023-03-15     208

关键词:

参考技术A

大家好,我是 梦想家 Alex 。我们都知道 github 对于程序员们而言,就是一个巨大的“聚宝盆”,上面不仅有很多优质的开源项目,还有很多热爱开源分享的开发者。但如何从浩如烟海的宝藏中,筛选出适合自己的优质项目呢?本期内容,我就为大家推荐几个我认为还不错的大数据学习必备的 牛 X 项目,希望大家看完有所收获。

首推 heibaiying 的 BigData-Notes,该项目目前已经有高达 10.2K 的star,正如该仓库的介绍上简短几个字:大数据入门指南。这个项目也是我认为目前 最适合初学者学习和参考的项目

为什么说这个项目适合大数据初学者呢,可以通过观察项目的介绍文档,该项目包含了大数据学习必须要掌握的几种组件,包括 Hadoop,Hive,Spark,Flink,Kafka,Zookeeper,Flume,Sqoop,Azkaban,以及 Scala 函数式编程语言的教程 ,可谓是非常的系统全面

我们再借助谷歌插件 Octotree 观察项目的结构,可以看到该项目主要分为 code,notes,pictures,resources 四个目录

其中 code 目录主要用来存放各个组件使用相关的代码,正如统计的结果一样,这个项目中 Java 代码占了 94.8%,Scala 占了 5.2%,所以对于喜欢用 Java 编写代码的小伙伴们来说,这是一个不容错过的宝藏学习机会。

notes 部分主要存放相关组件的介绍和使用文档,其中 installation 子目录主要存放了相关组件编译,以及在Linux环境下各个组件的安装,单机/集群环境搭建的教程,我看过了内容,介绍的非常清晰详细。

另外两个目录 pictures resources 就不做过多介绍了,一个是存放相关的图片教程,另一个是存放编写的代码中所需要用到的文本文件。

这个项目同样给力,是由 BAT 高级大数据架构师 王知无 创建的,该项目目前也已经斩获高达 5.2k star,是为数不多, 集基础学习和进阶实战 于一体的优质项目。

该项目按照大数据不同阶段的学习,所列举不同的文章干货

大数据开发基础篇

大数据框架学习篇

大数据开发实战进阶篇

大数据开发面试篇

从不同的分类足以见 王老师 的用心。同时,王知无前辈也是 51CTO 上的认证讲师,来看看官方的介绍 。

相信很多同学在学习大数据的过程中,不清楚 Java 需要学习哪些内容,掌握到什么程度,这个时候完全可以借鉴王老师的这个仓库内容。

同时,学习这个仓库的内容,可以学习到作者作为架构师本身对于 JVM,分布式理论和基础,大数据框架基石之网路通信Netty,以及各个框架的源码学习,可谓“ 真.宝藏仓库

除了基础的理论学习以外,还有大量实战性的内容可以借鉴参考

以及大量的面试题,还有自己从零到大数据专家一路走来的心路历程,学习路径指南,和自己对于技术学习的一些深入思考,相信大家拜读过后一定能收获满满,

这个项目比较特殊,是一个国外开发者开源的项目,英文翻译过来的意思是“很棒的大数据”,实际上呢~他列举的是很多很棒的大数据框架、资源和其他很棒的精选列表。灵感来自 awesome-php awesome-python awesome-ruby hadoopecosystemtable big-data 。目前也已经斩获 10.2K 的 star,非常强势。

为了方便阅读,我将其全部翻译成中文进行展示。

我们跳转到 分布式编程,可以看到很多我们熟悉的技术,例如 Flink,Spark,Pig,MapReduce 等等 ....

亦或者“分布式文件系统”,我们所熟知的 HDFS,Kudu,GFS ...

点击对应的链接,可以跳转到对应的官方介绍页,方便我们减少搜索成本,快速了解不同领域大数据常用的技术组件,为我们之后做技术调研省了很多的时间。

让我厚颜无耻的夹带一下“私货”。这是我在今年年初的时候,创建的一个仓库,目前也已经有了快 200 的star 。从资历和star的数量显然不能跟前面几个大佬相比,但却是我第一次花费了大量精力,将一个项目像孩子一样进行“培养”。

为了设计一个好看的图标,还花了不少的精力。设置不同媒体平台的徽标设计,还参考了像 JavaGuide 这样的头部项目,也算是在亲力亲为的这个过程中,学到了不少东西。


可以放点内容给大家show一下

另外,我还开设了“福利”专栏,将自己学习过程中收集到的学习干货毫无保留地分享给大家,方便大家获取。


显而易见,这个是专注于 flink 学习的开源项目,其中的内容包含Flink 入门、概念、原理、实战、性能调优、源码解析等等,目前已经斩获了 10.5k 的 star,非常强势。

其维护的开发人员也是非常用心负责,一路跟随 flink 的版本,不停的在维护更新 。

同时,主要维护者 zisheng 还将 flink 的研究做到了极致,不仅有 flink 成体系的博客链接,还有对应的源码系列。

还自己创建了专栏《从1到100深入学习Flink》,并将大家学习过程中有疑惑的地方解决过程统一记录下来,方便有需要的同学查看。虽然是付费的星球专享,但我觉得是真的值!感兴趣的话大家可以自行去了解。

java简历,我这几个项目写哪几个比较好?

一般java简历写几个项目比较合适?能算大项目的就是做过一个电子商务网站,完成基本功能。注册登录列表购物车订单。在就是使一个数据挖掘系统,记录linux主机用户登录信息,登录时长并记录到数据库还模拟过struts1,完成... 查看详情

postgresql正式超越mysql,这家伙也太强了吧!

点击关注公众号,Java干货及时送达推荐阅读:SpringCloudAlibaba终于一统江湖!出品|OSC开源社区(ID:oschina2013)StackOverflow2022开发者调查报告现已出炉。StackOverflow年度开发者调查是面向全球开发者进行的规模... 查看详情

国产api管理神器eolink也太强了吧

一、研发痛点什么是API研发管理API研发管理是包含了API开发管理、开发团队协作、自动化测试、网关以及监控等等API管理全生命周期的一系列管理过程。可以帮助公司实现开发运维一体化,提升开发速度,达到降本增效... 查看详情

国产api管理神器eolink也太强了吧

一、研发痛点什么是API研发管理API研发管理是包含了API开发管理、开发团队协作、自动化测试、网关以及监控等等API管理全生命周期的一系列管理过程。可以帮助公司实现开发运维一体化,提升开发速度,达到降本增效... 查看详情

店群真正赚钱的有几个大揭秘

...是否抓住了这个红利期呢?有人会说店群真正赚钱的没有几个,实际上都是误传,从店群项目中闷声发大财的居多,生怕自己的技术被发现后,被别人抢走利润了。只有遇到问题需要帮助的时候才会出现,而那时会被大家误以为... 查看详情

在python中处理几个大的csv [关闭]

】在python中处理几个大的csv[关闭]【英文标题】:processingseveralbigcsvinpython[closed]【发布时间】:2021-05-2718:15:14【问题描述】:我正在处理两个大数据集(一个有100万条记录和6个特征,另一个是大约7000条记录和9个特征)。我已经... 查看详情

这款国产api工具也太强了吧!让我放弃了postman(代码片段)

为什么弃用postman转用Eolink?程序员在接口开发完成后都通常需要自测,当返回结果根据符合预期时,则表示代表接口可用。自己以前用的是postman来进行接口测试,但postman只能进行接口测试,有局限性、很多场景不... 查看详情

这款国产api工具也太强了吧!让我放弃了postman(代码片段)

为什么弃用postman转用Eolink?程序员在接口开发完成后都通常需要自测,当返回结果根据符合预期时,则表示代表接口可用。自己以前用的是postman来进行接口测试,但postman只能进行接口测试,有局限性、很多场景不... 查看详情

很多小文件还是几个大文件?

】很多小文件还是几个大文件?【英文标题】:Lotsofsmallfilesoracouplehugeones?【发布时间】:2009-06-2621:25:34【问题描述】:就性能和效率而言,使用大量小文件(我的意思是几百万个)还是几个(十个左右)大(几千兆字节)文件... 查看详情

这款国产api神器工具也太强了吧...让我放弃了postman

今天我发现了一款国产化的API工具,去官网看了下它的中文页面,觉得很干净、倍感亲切,我感觉Eolink结合了postman和swagger的优点。摒弃了不足、甚至发生了公开踩踏事件,最近国产API管理工具越来越卷,但最... 查看详情

牛逼!用mysql实现一个分布式锁,这也太强了。。。(代码片段)

...如说,有定时任务域xx.cron,和SystemA域和SystemB域这几个JAVA应用,可能同时修改同一份库存数据。如果不做协调的话,就会有 查看详情

大数据学习必备|推荐几个牛x的github项目,助你事半功倍

...自己的优质项目呢?本期内容,我就为大家推荐几个我认为还不错的大数据学习必备的牛X项目 查看详情

大数据学习必备|推荐几个牛x的github项目,助你事半功倍

...自己的优质项目呢?本期内容,我就为大家推荐几个我认为还不错的大数据学习必备的牛X项目 查看详情

学习建议,大数据组件那么多,可以重点学习这几个。

链接:学习建议,大数据组件那么多,可以重点学习这几个。 查看详情

学习大数据,认准这几个公众号

...数据赋能在企业内越来越被重视。今天给大家精心挑选的这几个牛逼的公众号,他们都是一线的数据人,在各个行业深耕已久,笔耕不辍的分享技术文章,已然成为数据老兵!关注他们是为了更好的进步,一起关注数据领域技术... 查看详情

按列绑定几个大矩阵

】按列绑定几个大矩阵【英文标题】:Bindingseverallargematricesbycolumn【发布时间】:2015-09-2211:19:36【问题描述】:我真的知道“大矩阵问题”是这里经常出现的话题,但我想详细解释一下我关于大矩阵的具体问题。严格来说,我想c... 查看详情

github发现优秀的开源项目

     先上个大logo,哈哈。    github上有非常多的资源,我们可以在github上搜索到非常多的开源项目。那么如何使用github查找资源?   罗列出一下几种方式。1.Explore登录GitHub,在页面中心找到Explore,如图:&... 查看详情

这几个sql语法的坑,你踩过吗(代码片段)

本文已经收录到Github仓库,该仓库包含计算机基础、Java基础、多线程、JVM、数据库、Redis、Spring、Mybatis、SpringMVC、SpringBoot、分布式、微服务、设计模式、架构、校招社招分享等核心知识点,欢迎star~Github地址:https://... 查看详情