产品日志我们所谈的“数据埋点”到底是什么?

BudingCode BudingCode     2023-02-16     491

关键词:

在产品规划的过程中,产品经理的工作往往需要使用数据来进行辅助,而我们 获取数据 最快捷的核心途径便是 “埋点”

首先我们来了解埋点的定义,所谓的埋点便是 事件追踪 Event Tracking,也就是针对特定用户行为或事件进行捕获,之后并通过SDK上报埋点的数据,当用户的行为满足某种条件后,比如进入某个界面,点击某个button,会自动触发记录和存储,然后这些数据会被实时或延迟传递到终端服务器,或者通过后端采集用户使用服务过程中的请求数据。

埋点的应用场景

埋点的应用场景用户行为分析产品功能分析发短信和PUSH精准化推荐
实例用户的点击、浏览页面停留、试听音频玩游戏、领取优惠券等一系列的行为均要通过数据采集存到数据库里然后对用户进行 漏斗转化行为路径 等分析迭代功能使用情况对比、功能带来的转化统计、产品A/B测试效果精准用户分群发短信 a.如浏览了某个产品详情页次数大于3次但是没有购买转化的用户 b.未购买某个产品的新注册用户通过数据采集上来的用户行为对用户做分群处理并贴上标签,然后精准化推荐首页内容

4种采集场景开启埋点之路

代码埋点(自定义埋点)全埋点可视化埋点服务端埋点
采集说明嵌入SDK,定义事件并添加好事件代码嵌入SDK嵌入SDK,可视化圈选定义 事件接口调用、数据结构化
场景以业务为导向通过采集用户定位进行分析无需采集时间,适用于活动页、着陆页、关键页用户在页面的行为与业务信息关联较少,页面较多且页面元素较少对行为数据的分析比较浅前后端数据整合,如订单数据
优势按需采集,业务信息更完善;对数据分析更聚焦简单、快捷;与代码埋点相比开发人员工作量较少与代码埋点相比,开发人员工作量较少更灵活、更准确、无需发版,数据上传更加及时
劣势与后两种采集方式相比,开发人员工作量较多嵌数据准确性不高,上传数据多,消耗流量高,数据维度单一(仅点击、加载、刷新)业务人员工作量较大、改版后需要重新定义事件、缺乏基于业务的解读仅服务端采集缺少前端的环境信息,前端交互数据缺失
采集工具友盟、百度统计GAWMDA

5W2H事件定义搞定埋点方案

5W2H分析法又叫做七何分析法,顾名思义5w就是:why、what、where、when、who,2h就是how、how much。

事件的核心:行为+行为的对象(做+什么)

事件的定义

事件的定义是: 在时间和空间中,信息的变动所产生的增益 – 谁在什么时候做了什么

为什么要以事件的方式进行埋点

  • 埋点的目标是要做分析,分析主要包 含:产品功能分析、漏斗分析、用户 分析、留存分析等
  • 所有的分析主题都可以拆分到一个一 个的事件
  • ev=click_banner,然后count一下uid 就是人数,count一下条数就是次数

四大基础埋点事件

基础埋点事件行为+行为对象
元素点击Click_Btn
页面浏览View_Page
APP激活AppInstall
APP启动AppStart

事件设计的核心要素


用户属性:基础属性+动态标签

基础属性动态标签(用的最多)
年龄是否购买过某个商品
性别过去7天内的活跃用户
城市累计消费金额大于1000的用户
职业每月消费次数大于2次的用户
年级是否是VIP用户
按事件及事件属性进行标签的标注

埋点事件是基于全量用户,用户的动态属性一般做用户细分,而用户属性在后续的数据分析中影响并不大。


时间:用户行为发生的时间–事件被触发的时间 + 埋点的上报时间

【触发时间】:事件开始记录的时间

【上报时间 】:事件上报到服务器的时间

时间:不同上报时间对页面浏览事件的数据统计有什么影响呢?

1.时间点(可单独作为上报时间)

  • 打开页面时间
    页面打开即上报,打开后 瞬间关闭的次数也被统计 上了

  • 页面加载完成时间
    去掉了误点的情况,但加 载成功与失败不管

  • 页面关闭时间
    页面打开即上报,打开后 瞬间关闭的次数也被统计 上了

2.时间段(需要触发时间+上报时间)

  • 页面停留时长
    用户打开页面后,在该页面停留 超过3s后触发计时器,在退出页 面时上报

  • 区域浏览时长
    用户在页面某个区域停留 的累计时长

    事件分析:【浏览了】+【考研】-【产品详情页】的PV和UV

5大技术利器避开埋点深坑

埋点要理解的数据知识-SDK

SDK是指一种软件开发工具包,是数据采集的必备工具,英文为“Software Development Kit”。本质上它其实是一些接口API的文件集合,为某个应用程序提供服务。也可以理解为应用开发者通过接入这些文件,并调用里面的相关接口,即可采集相应数据。因为SDK的大小一定程度上会影响应用程序性能,所以尽量轻 量处理,占内存大多在几百K和几兆之间。

SDK类型
主要分为客户端SDK、服务端SDK、前端SDK

  • 客户端SDK
    是指这类SDK接入在应用的终端,比如iOS、安卓等
  • 服务端SDK
    是指接入在后端,更多的在后台底层
  • 前端SDK
    是指接入在web网页端、H5页面、小程序等

不同类型的业务数据需要分配给不同的开发终端,一般用户浏览点击等流量行为由前端或客户端采集,其余业务数据
由服务端采集,如订单、优惠券领取、听课等客户端采集上报容易出现问题的数据均要通过服务端采集

SDK采集数据的类型

主要分为设备数据、应用数据、埋点数据

  • 设备数据
    终端硬件设备,如电脑设备、手机设备等, 如果是手机可以具体到手机类型、品牌、网络环境等。如果是电脑,则是电脑型号、浏览器 类型等;
  • 应用数据
    应用程序的数据,比如是APP,则是此APP应用程序内的基础数据,包括APP版本、渠道、安装时间等等
  • 埋点数据
    用户在某应用程序触发产生的行为数据,比如点击哪个页面、停留时长、页面曝光、启动时间等等。主要是基于业务考虑进行埋点 设计。

埋点要理解的数据知识-ID标识

主要分为两种 用户ID、设备ID

用户ID
在 Android 10 版本中,广告渠道商们作为非厂商系统应用将无法获取 IMEI、MAC 等设备信息。旧版本的手机系统在用户手动升级前将保持不变,但是搭载 Android 10 系统的手机系统将不支持获取 IMEI。

在一段时间内,将处于新旧版手机系统共存的状态,但是新版手机系统的用户占比将会逐渐提高,会造成新版系统用户无法进行推广渠道的匹配。 近日移动安全联盟针对该问题联合国内手机厂商推出补充设备标准体系方案,选择 OAID 字段作为 IMEI等的替代字段 。广告渠道商选择 OAID 作为 IMEI 的替代字段。OAID 字段是由中国信通院联合华为、小米、OPPO、VIVO 等厂商共同推出的设备识别字段,具有一定的权威性。 OAID 的准确性和覆盖率均满足广告场景的使用需求。

设备ID

  • 在做渠道推广投放时,如果投放的 是APP下载,第三方平台会需要回 调API来评估具体的投放效果,下 载的数量是通过设备ID进行计算的
  • 用户在APP上未登录时的行为一部 分也是通过设备ID进行识别,然后 登陆后和内部系统的UID进行映射

埋点要理解的数据知识-大数据架构


用户的行为日志通过数据处理后最终大部分会落到数仓中去,但 是数仓是T+1的数据更新频率, 如果需要实时的则需要从kafka 消费数据,然后后端通过接口的方式提供给前端

埋点要理解的数据知识-计算引擎

计算引擎定义
Hive基于Hadoop的数据仓库工具,可以将结构化的数据文件映射 为一张张数据库表,并提供简单的SQL查询功能,可以将SQL 语句转换为MapReduce任务运行。更多支持离线任务
Spark一个快速通用的Hadoop数据计算引擎,适用于实时任务。 同时也应用于机器学习、流处理等
Flink是最近流行的第4代查询引擎,主要是同时支持流数据和批量式数据处理,相较于Spark有较大的提升。但目前技术相 对新一些,应用得还不算多
Druid一种高效实时、迅速的分布式数据查询系统,它采用不是 前3者依赖的hadoop框架。主要支持聚合查询、实时查询, 且灵活。但有些数据分析指标不一定能支持
Impala一种数据查询引擎,优点在于高性能、低延迟(准实时)。 相比hive绕过底层MapReduce,所以更快。同时也支持复杂 的交互式查询

埋点要理解的数据知识-数据组件

计算引擎定义
HDFS能够提供高吞吐量的分布式文件系统
YARN用于任务调度和集群资源管理。就好比是一个项目的PMO,产品提需求,根据现有的资源、时间、成本等快速分配任 务,调动机器资源来支持
MapReduce基于YARN之上,用于大型数据集并行处理的系统。也是初代的计算引擎。Hive就是基于这个系统之上
Flume一个日志收集系统,作用在于将大量日志数据从各数据源进行收集、聚合,并最终存储
Sqoop用于底层数据传输的工具
Kafka一种高吞吐量的分布式消息队列系统
Hbase一个可伸缩的分布式数据库,支持大型表的结构化数据存储,底层使用HDFS存储数据
Hive基于Hadoop的数据仓库工具,可以将结构化的数据文件映射为一张张数据库表,并提供简单的SQL查询功能,可以将 SQL语句转换为MapReduce任务运行。更多支持离线任务
Spark一个快速通用的Hadoop数据计算引擎,适用于实时任务。同时也应用于机器学习、流处理等

手把手带你搭建数据埋点平台

什么是数据埋点平台
一切需求可溯源、需求按照规范输入、直接生成埋点文档、埋点数据直接出图、可增加各种分析模型、省时省力、自助式服务、作为平台可进行产品迭代、可提供API接口服务

埋点案例

来自开课吧

需求:产品上线新功能,需要统计如下指标,请提供埋点文档

  • 产品详情页的PV、UV,
  • 点击立即报名按钮的PV、UV、
  • 购买考研课程的用户数量、购买时间

埋点思路

  • 产品详情页的PV、UV(浏览)
  • 点击立即报名按钮的PV、UV(点击)
  • 购买考研课程的用户数量、购买时间(购买)
事件命名事件属性上报时机
Page_View页面标题、页面地址、产品名称、产品类别、页面类别加载完成即上报
Btn_Click元素名称、元素ID、所属页面url、跳转页面url点击即上报
User_Buy产品id、产品名称、购买渠道、支付方式等支付成功即上报

埋点设计

事件分析

目标:浏览过考研详情页且没有购买的用户,发push促进转化

搞懂数据埋点与数据同步

...行为习惯等,是建立用户画像、用户行为路径等数据产品的基础。埋点的作用:精准运营用户画像数据分析与挖掘埋点的分类:1、客户端埋点:需要接入客户端的埋点SDK,将实际的埋点代码嵌入到用户实际访问的... 查看详情

搞懂数据埋点与数据同步

...行为习惯等,是建立用户画像、用户行为路径等数据产品的基础。埋点的作用:精准运营用户画像数据分析与挖掘埋点的分类:1、客户端埋点:需要接入客户端的埋点SDK,将实际的埋点代码嵌入到用户实际访问的... 查看详情

搞懂数据埋点与数据同步

...行为习惯等,是建立用户画像、用户行为路径等数据产品的基础。埋点的作用:精准运营用户画像数据分析与挖掘埋点的分类:1、客户端埋点:需要接入客户端的埋点SDK,将实际的埋点代码嵌入到用户实际访问的... 查看详情

数据埋点的设计

...点体系,可以支撑后续的数据清洗、数据储存、数据产品、数据分析等,可以使整个数据应用事半功倍,极大提高数据使用效率。    那么埋点具体应该怎么做,有什么注意事项呢?某知名大厂具有丰富埋点... 查看详情

一篇文章搞懂数据埋点与数据同步

...行为习惯等,是建立用户画像、用户行为路径等数据产品的基础。埋点的作用:精准运营用户画像数据分析与挖掘埋点的分类:1、客户端埋点:需要接入客户端的埋点SDK,将实际的埋点代码嵌入到用户实际访问的... 查看详情

数据埋点是啥意思

...东西,传到服务器达到记录用户点击的每一步。问题三:产品助理的职位描述中有一条:“知道如何埋数据点,取数据”是什么意思?数据埋点,在链接中加一串指定代码吧,我之前做推广的时候做过。不知道会不会折叠...问题... 查看详情

关于数据埋点,你需要知道的技术方案和规范流程

...据采集的专用术语,在数据驱动型业务中,如营销策略、产品迭代、业务分析、用户画像等,都依赖于数据提供决策支持,希望通过数据来捕捉特定的用户行为,如按钮点击量、阅读时长等统计信息。因此,数据埋点可以简单理... 查看详情

数据埋点技巧

...我们从一个客户端安装、运行到最终被卸载来看看。就拿产品使用较多的工具“AxureRP”来举例吧。如果“AxureRP”是我们自己的软件,首先我们需要知道被安装了,之后,我们关注激活情况,也就是使用,到最后,被卸载了,这... 查看详情

ef到底是什么?

...rm项目,程序员操作数据的方法主要是通过使用ADO.NET。而我们MVC操作数据库呢? 与ADO.Net相比又有怎样的优势呢?一,大家都在谈的EF到底是什么?EF ,全称Entity FramWork。就是微软以ADO.NET为基础发展的所谓ORM(对象关... 查看详情

数据埋点

...些信息,用来跟踪应用使用的状况,后续用来进一步优化产品或给运营提供数据支撑,包括访问数(Visits),访客数(Visitor),停留时长(TimeOnSite),页面浏览数(PageViews)和跳出率(BounceRate)。这样的信息收集可以大致分为... 查看详情

数据埋点主流埋点方式了解(代码片段)

...P或网页服务被使用的情况,以便后续用来进一步优化产品或进行运营支持。埋点可以衡量用户与网站或APP互动的情况。数据获取手段-填写、埋点、日志(1)用户填写信息(2) 查看详情

前端如何设置埋点?(代码片段)

...了才可以获得数据进行分析,所以在做足数据埋点之后,我们可以拿到想要的目标数据;1)行为数据:时间,地点,人物,交互,交互的内容;2)质量数据:浏览器加载情况,错误异常等;3)环境数据:浏览器相关的元数据及... 查看详情

移动应用如何埋点收集啥数据以便于统计分析?

...是要从认清是什么开始:一、什么是数据埋点数据埋点让产品或运营等相关人员能按照具体的需求,定制性地统计较为复杂的用户数据。例如想要追踪用户的行为,观察页面相关点击数据,关键路径转化率,分析某个事件活动效... 查看详情

数据埋点是什么?

数据埋点是什么?所谓“埋点”,是数据采集领域(尤其是用户行为数据采集领域)的术语,指的是针对特定用户行为或事件进行捕获、处理和发送的相关技术及其实施过程。比如用户某个icon点击次数、观看... 查看详情

互联网产品怎么做数据埋点

在互联网产品上线之后,产品和运营人员需要即时了解产品的使用情况,有多少用户,用户使用了哪些功能,停留时长,使用路径。。。等。要回答这些问题,需要有数据,不能拍脑袋想当然。数据怎么得到呢?埋点就是采集数... 查看详情

sqlserver事务日志的lsn到底是什么?(代码片段)

...生需要围绕着数据文件打转,诸如包含数据的.mdf,事务日志的.ldf,很多时候深入了解这两类文件的合成原理,差不多对数据库就能理解一半了,关于.mdf的合成前面的文章已经有所介绍,这篇我们来聊一下.ldf的一些内部知识,... 查看详情

工程实践|在flutter中实现一个精准的滑动埋点(代码片段)

...:埋点。为了对行为特征的数据进行量化分析、优化产品,我们常常需要在特定的时机上报数据埋点,而曝光埋点则是其中的一个高频使用场景。🥲滑动埋点的痛在Flutter中,我们通常 查看详情

app埋点测试

...8日11:02:46 hackeey 阅读数:42543经过大半年的努力,产品终于开始趋向稳定,之前的版本一直在探索,需求经常改动,没时间系统进行埋点。随着产品的稳定以及工作的深入,越发认识到数据的重要性,所以开始着手数据埋... 查看详情