flume安装及ganglia使用(代码片段)

liufei-yes liufei-yes     2022-12-10     439

关键词:

一、flume是什么

?????? Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。
flume的架构:
技术图片

flume的组成架构:
技术图片

二、flume的组件介绍

1、Agent

Agent是一个JVM进程,它以事件的形式将数据从源头送至目的。
Agent主要有3个部分组成,Source、Channel、Sink。

2、Source

Source是负责接收数据到Flume Agent的组件。Source组件可以处理各种类型、各种格式的日志数据,包括avro、thrift、exec、jms、spooling directory、netcat、sequence generator、syslog、http、legacy

3、Channel

Channel是位于Source和Sink之间的缓冲区。因此,Channel允许Source和Sink运作在不同的速率上。Channel是线程安全的,可以同时处理几个Source的写入操作和几个Sink的读取操作。

Flume自带两种Channel:Memory Channel和File Channel。
Memory Channel是内存中的队列。Memory Channel在不需要关心数据丢失的情景下适用。如果需要关心数据丢失,那么Memory Channel就不应该使用,因为程序死亡、机器宕机或者重启都会导致数据丢失。
File Channel将所有事件写到磁盘。因此在程序关闭或机器宕机的情况下不会丢失数据。

4、Sink

Sink不断地轮询Channel中的事件且批量地移除它们,并将这些事件批量写入到存储或索引系统、或者被发送到另一个Flume Agent。

Sink是完全事务性的。在从Channel批量删除数据之前,每个Sink用Channel启动一个事务。批量事件一旦成功写出到存储系统或下一个Flume Agent,Sink就利用Channel提交事务。事务一旦被提交,该Channel从自己的内部缓冲区删除事件。

Sink组件目的地包括hdfs、logger、avro、thrift、ipc、file、null、HBase、solr、自定义。

5、Event

传输单元,Flume数据传输的基本单元,以事件的形式将数据从源头送至目的地。??Event由可选的header和载有数据的一个byte array 构成。Header是容纳了key-value字符串对的HashMap。
技术图片

6、Flume Agent内部原理

技术图片

三、flume的安装

flume官网地址:http://flume.apache.org/

1、安装包进行解析
技术图片

2、将flume/conf下的flume-env.sh.template文件修改为flume-env.sh,并配置flume-env.sh文件
技术图片

3、配置/etc/profile
技术图片

四、flume测试

案列:监听本地的一个端口,通过netcat往监听的端口发送消息,然后flume将收集的消息展示在控制台。
1、安装netcat工具
sudo yum install -y nc

2、选择一个端口,看是否被使用
技术图片

3、创建Flume Agent配置文件flume-netcat-logger.conf
技术图片

4、启动agent和nc
技术图片
技术图片
技术图片

5、测试成功

五、安装flume监控Ganglia

1、Ganglia的安装与部署

1.1、安装httpd服务与php
sudo yum -y install httpd php
1.2、安装其他依赖
sudo yum -y install rrdtool perl-rrdtool rrdtool-devel
sudo yum -y install apr-devel
1.3、安装ganglia
sudo rpm -Uvh http://dl.fedoraproject.org/pub/epel/6/x86_64/epel-release-6-8.noarch.rpm
sudo yum -y install ganglia-gmetad
sudo yum -y install ganglia-web
sudo yum install -y ganglia-gmond
1.4、ganglia介绍

Ganglia由gmond、gmetad和gweb三部分组成。

gmond(Ganglia Monitoring Daemon)是一种轻量级服务,安装在每台需要收集指标数据的节点主机上。使用gmond,你可以很容易收集很多系统指标数据,如CPU、内存、磁盘、网络和活跃进程的数据等。

gmetad(Ganglia Meta Daemon)整合所有信息,并将其以RRD格式存储至磁盘的服务。

gweb(Ganglia Web)Ganglia可视化工具,gweb是一种利用浏览器显示gmetad所存储数据的PHP前端。在Web界面中以图表方式展现集群的运行状态下收集的多种不同指标数据。

1.5、修改配置文件/etc/httpd/conf.d/ganglia.conf

技术图片

1.6、修改配置文件/etc/ganglia/gmetad.conf

技术图片

1.7、修改配置文件/etc/ganglia/gmond.conf

技术图片
技术图片
技术图片

1.8、修改配置文件/etc/selinux/config

技术图片
selinux本次生效关闭必须重启,如果此时不想重启,可以临时生效之:

sudo setenforce 0
1.9、启动ganglia
sudo service httpd start

sudo service gmetad start

sudo service gmond start
1.10、打开网页浏览ganglia页面

技术图片

2、测试Ganglia

2.1、修改flume-env.sh配置

技术图片

2.2、启动Flume任务
flume-ng agent --conf conf/ --name a1 --conf-file jobs/flume-netcat-logger.conf -Dflume.root.logger==INFO,console -Dflume.monitoring.type=ganglia -Dflume.monitoring.hosts=192.168.13.137:8649
2.2、发送数据观察ganglia监测图
nc localhost 44444

技术图片

技术图片

成功!





















flume-ganglia监控(代码片段)

一.安装Ganglia1.安装httpd服务与phpsudoyum-yinstallhttpdphp2.安装其他依赖sudoyum-yinstallrrdtoolperl-rrdtoolrrdtool-develsudoyum-yinstallapr-devel3.安装gangliasudorpm-Uvhhttp://dl.fedoraproject.org/pub/epel/6/x86_64/epel-release-6-8.noarch.rpmsudoyum-yinstallganglia-gmetadsudoyum-yins... 查看详情

大数据flume数据流监控(代码片段)

目录1Ganglia的安装与部署1.1安装ganglia2操作Flume测试监控2.1启动Flume任务2.2发送数据观察aganglia监测图1Ganglia的安装与部署Ganglia由gmond、gmetad和gweb三部分组成。gmond(GangliaMonitoringDaemon)是一种轻量级服务,安装在每台需... 查看详情

flume的安装及使用(代码片段)

Flume的安装及使用文章目录Flume的安装及使用Flume的安装1、上传至虚拟机,并解压2、重命名目录,并配置环境变量3、查看flume版本4、测试flume5、flume的使用Flume的安装1、上传至虚拟机,并解压tar-zxvfapache-flume-1.9.0-bin.tar... 查看详情

flume的安装及使用(代码片段)

Flume的安装及使用文章目录Flume的安装及使用Flume的安装1、上传至虚拟机,并解压2、重命名目录,并配置环境变量3、查看flume版本4、测试flume5、flume的使用Flume的安装1、上传至虚拟机,并解压tar-zxvfapache-flume-1.9.0-bin.tar... 查看详情

flume的安装及使用(代码片段)

Flume的安装及使用文章目录Flume的安装及使用Flume的安装1、上传至虚拟机,并解压2、重命名目录,并配置环境变量3、查看flume版本4、测试flume5、flume的使用Flume的安装1、上传至虚拟机,并解压tar-zxvfapache-flume-1.9.0-bin.tar... 查看详情

flume安装(代码片段)

flume安装安装及配置环境变量使用常用的source简单串联ChannelSelectorMultiplexingChannelSelectorSinkProcessor事务自定义组件额外安装及配置环境变量1.保证有JAVA_HOME;2.直接解压即可;将apache-flume-1.7.0-bin.tar.gz包放到/opt/soft下,加压到/opt/mod... 查看详情

flume架构及使用例子(代码片段)

...uide.htmlhttp://flume.apache.org/FlumeUserGuide.html#starting-an-agentFlume使用思路使用flume的关键就是写配置文件(1)配置Source 查看详情

flume简介及使用(代码片段)

...制和许多故障转移和恢复机制,具有强大的容错能力。它使用简单的可扩展数据模型,允许在线分析应用程序。3)为什么需要flume数据从哪里来?-》爬虫-》日志数据flum 查看详情

flume(代码片段)

...Interceptor3.6自定义Source3.7自定义Sink3.8Flume数据流监控3.8.1Ganglia的安装与部署3.8.2操作Flume测试监控4Flume对接Kafka4.1kafka-sink4.2flume拦截器topic分类5企业真实面试题(重点)5.1你是如何实现Flume数据传输的监控的5.2Flume的Sourceÿ... 查看详情

flume(代码片段)

...自定义Sink(更多自定这个)3.8Flume数据流监控3.8.1Ganglia的安装与部署3.8.2操作Flume测试监控第4章企业真实面试题(重点)flume官方文档:结合官方文档使用,多练习第1章Flume概述1.1Flume定义Flume最主要的作用... 查看详情

日志收集系统flume调研笔记第2篇-flume配置及使用实例(代码片段)

上篇笔记对Flume的使用场景和系统架构做了介绍,本篇笔记以实例说明Flume的配置方法。下面开始正文。1. Flume使用实例1.1配置Flumeagent的3个组件及其拓扑关系是在配置文件中指定的,总的原则是必须列出source/channel/sink的n... 查看详情

flume安装和使用(代码片段)

概览1-flume简介2-系统要求3-安装和配置4-启动和测试 一、flume的简介官网地址: http://flume.apache.org/1-概述Flume是一种分布式,可靠且可用的服务,用于高效地收集,汇总和移动大量日志数据。它具有基于流式数据流的简单... 查看详情

ganglia安装及配置

Ganglia安装及配置root用户下yum安装所依赖的环境(实际生产环境都已安装)yum-yinstallapr-develapr-utilcheck-develcairo-develpango-devellibxml2-develrpmbuildglib2-develdbus-develfreetype-develfontconfig-develgcc-c++expat-develpython 查看详情

日志采集框架flume的安装及使用

日志采集框架Flume的安装及使用1.Flume介绍1.1.Flume概述Flume是一个分布式、可靠、和高可用(旧版Flumeog才有高可用)的海量日志采集、传输和聚合的系统。Flume可以采集文件,socket数据包等各种形式源数据,又可以将采集到的数据输... 查看详情

安装flume(代码片段)

1.上传Flume到master的/home/hadoop目录2.把Flume压缩文件,解压到/usr/local中,使用以下命令:sudotar-zxvfapache-flume-1.9.0-bin.tar.gz-C/usr/local3.进入/usr/local目录,使用以下命令:cd/usr/local4.将解压后的apa 查看详情

安装flume(代码片段)

1.上传Flume到master的/home/hadoop目录2.把Flume压缩文件,解压到/usr/local中,使用以下命令:sudotar-zxvfapache-flume-1.9.0-bin.tar.gz-C/usr/local3.进入/usr/local目录,使用以下命令:cd/usr/local4.将解压后的apa 查看详情

flume快速入门及常用案例整理(代码片段)

flume快速入门及常用案例整理flume概述1.1flume定义flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,flume基于流式架构,灵活简单Flume最主要的作用就是,实时读取服务器... 查看详情

ganglia入门介绍及解决fsockopenerror:connectionrefused问题

一,问题描述Ganglia的各个组件安装情况(不是我装的,只知道这些信息):集群一共有4台机器,分别是192.168.121.34-37。Gmetad、Gweb和httpd安装在192.168.121.34上;Gmond安装在34,35,36,37机器上。访问Ganglia-web主页:http://192.168.121.34/ganglia-web/... 查看详情