storm简介——实时流式计算介绍

author author     2022-11-05     140

关键词:

概念

实时流式计算:

       大数据环境下,流式数据将作为一种新型的数据类型,这种数据具有连续性、无限性和瞬时性。是实时数据处理所面向的数据类型,对这种流式数据的实时计算就是实时流式计算。

 

 

特征

实时流式计算与传统的数据处理技术不同,其具有一下特点:

        低延迟:从处理的数据角度来看,每一条数据都可以在有限的时间内由系统成功处理完成,就是响应的时间很短。

        高吞吐:从处理的过程角度来看,系统节点在单位时间内能够成功处理的数据量比较多,也就是高吞吐量。对于数据处理的目标本质来说高吞吐量和低延迟是一样的。

        高容错:由于网络或其他原因,会出现错误或不完全的数据,系统对与这些数据都具有一定的容错性,不会因为这些

有缺失的数据导致系统崩溃。

        算法复杂点比较低:高吞吐量的必然要求,就要求使用更加高效简单的算法。

        

 

使用场景

        网站后台日志实时计算处理

        运营商流量实时监控

        交通数据实时处理

 

其他流式计算框架

           Queue+Worker

        Apache S4

        Spark Streaming

      (storm的计算是基于事件的,来一条数据流处理一条;spark streaming 是基于时间段来处理数据的,时间段可以越来越小,但不能基于事件来处理。这样就决定了storm的延迟性比spark streaming要小)

storm介绍及核心组件和编程模型

...数据、azkaban/oozie任务调度 流式计算流式计算:数据实时产生、数据实时传输、数据实时计算、实时展示代表技术:Flume实时获取数据、Kafka/metaq实时数据存储、Storm/JStorm实时数据 查看详情

storm基本原理概念及基本使用

...据、Hive批量计算数据1.2流式计算是什么流式计算:数据实时产生、数据实时传输、数据实时计算、实时展示代表技术:Flume实时获取数据、Kafka/metaq实时数据存储、Storm/JStorm实时数据计算、Re 查看详情

storm介绍

Storm主要的应用场景就是流式数据处理,例如实时推荐系统,实时监控系统等。storm中的相关概念在storm中,分布式的计算结构指的是一个topology(拓扑),一个topology由流式数据,spouts(流生产者),以及bolts(具体操作者)组成。Storm的t... 查看详情

storm学习:storm简介

  Storm是一个开源的分布式实时计算系统,可以简单、可靠的处理大量的数据流。Storm的部署和运维都很便捷,而且更为重要的是可以使用任意编程语言来开发应用。本教程是一本对storm的基础介绍手册,希望帮助所有愿意使用... 查看详情

storm入门

...架,它为你完成了消息传递等这些通用模块,让你专注于实时处理的业务逻辑。Storm--一种分布式实时计算系统。Storm之于流计算,类似于Hadoop 查看详情

storm第一章核心组件及编程模型

1流式计算  流式计算:数据实时产生、实时传输、实时计算、实时展示  代表技术:Flume实时获取数据、Kafka/metaq实时数据存储、Storm/JStorm实时数据计算、Redis实时结果缓存、持久化存储(mysql)。  一句话总结:将源源不断... 查看详情

53.storm简介

一、简介1.storm是twitter开源的一个分布式的实时计算系统,用于数据实时分析,持续计算,分布式RPC等等。官网地址:http://storm-project.net源码地址:https://github.com/nathanmarz/storm2.实时计算要解决一些什么问题?最显而易见的就是实... 查看详情

流式大数据处理的三种框架:storm,spark和samza

许多分布式计算系统都可以实时或接近实时地处理大数据流。本文将对三种Apache框架分别进行简单介绍,然后尝试快速、高度概述其异同。ApacheStorm在Storm中,先要设计一个用于实时计算的图状结构,我们称之为拓扑(topology)。... 查看详情

strom流式计算

... 主要学习方向Kafka分布式消息系统Redis缓存数据库Storm流式计算1.Storm的基本概念2.Storm的应用场景3.Storm和Hadoop的对比4.Storm集群的安装的linux环境准备5.zookeeper集群搭建6.Storm集群搭建7.Storm配置文件配置项讲解8.集群搭建常见问题... 查看详情

流处理kafkastream-sparkstreaming-storm流式计算框架比较选型

KafkaStream-SparkStreaming-Storm流式计算框架比较选型elasticsearch-headElasticsearch-sqlclientNLPchina/elasticsearch-sql:UseSQLtoqueryElasticsearchkafkastreamvssparkstreamingvsstorm_百度搜索[翻译]KafkaStreams简介:让流处理变得 查看详情

lambda架构简介

1.Lambda架构背景介绍Lambda架构是由Storm的作者NathanMarz提出的一个实时大数据处理框架。Marz在Twitter工作期间开发了著名的实时大数据处理框架Storm,Lambda架构是其根据多年进行分布式大数据系统的经验总结提炼而成。Lambda架构的目... 查看详情

实时计算,流数据处理系统简介与简单分析

...算。今天这篇文章详细介绍了实时计算,流数据处理系统简介与简单分析。编者按:互联网领域的实时计算一般都是针对海量数据进行的,除了像非实时计算的需求(如计算结果准确)以外,实时计算最重要 查看详情

storm集群组件和编程模型

...torm工作原理:    Storm是一个开源的分布式实时计算系统,常被称为流式计算框架。什么是流式计算呢?通俗来讲,流式计算顾名思义:数据流源源不断的来,一边来,一边计算结果,再进入下一个流。比如一般金... 查看详情

storm篇--storm基础概念

一、前述Storm是个实时的、分布式以及具备高容错的计算系统,Storm进程常驻内存,Storm数据不经过磁盘,在内存中处理。二、相关概念1.异步:流式处理(异步)客户端提交数据进行结算,并不会等待数据计算结果。2.同步:实... 查看详情

storm的基本概念安装测试

strom简介官方网址:http://storm.apache.org/是一个免费,开源的分布式实时计算系统,使用它可以轻松实现数据流的实时处理,Strom很简单,可以用任何编程语言storm用例:实时在线分析机器学习,连续计算,分布式RPC,ETL等。Strom的... 查看详情

聊聊我与流式计算的故事

...算是利用分布式的思想和方法,对海量“流”式数据进行实时处理的系统,它源自对海量数据“时效”价值上的挖掘诉求。优惠券计算服务的 查看详情

storm笔记整理:简介与设计思想(代码片段)

[TOC]实时计算概述有别于传统的离线批处理操作(对很多数据的集合进行的操作),实时处理,说白就是针对一条一条的数据/记录进行操作,所有的这些操作进行一个汇总(截止到目前为止的所有的统计总和)。实时计算与离线计算... 查看详情

storm实时计算实例(socket实时接入)

介绍实现了一个简单的从实时日志文件监听,写入socket服务器,再接入Storm计算的一个流程。源码日志监听实时写入socket服务器 [java] viewplain copy package socket;    import java.io.BufferedReader;   查看详情