干货电商归因模型技术方案

艾华丰      2022-02-17     391

关键词:

作者介绍

@杭州阿坤

母婴电商行业数据分析师兼数据产品经理;

致力于研究电商行业的数据驱动增长,

以及数据产品从0到1的搭建;

“数据人创作者联盟”成员,“最佳创作奖”获得者。

 

01 电商归因目的

对于电商平台来说,当流量进入时,我们需要引导其完成购买任务,以实现流量价值最大化,在互联网红利消耗殆尽之时,流量会越来越贵,我们需要精细化运营每一份流量。

 

我们在做各种banner活动、Feed流推荐优化、活动页等进行效果评估,无法知道该位置最终产生了多少收益,也就很难针对该位置进行有效的改进。

 

如果进行单因数AB测试进行改版的效果评估,那也会存在如下2个问题:

  1. 单因素变量控制并不容易做到完全可控,如果产品处在增长期,产品增长本身就是一个影响因子,很容易忽略此类因素的影响。

  2. 评估方式低效,如果 2 天内只控制 1 个坑位变动,那么评估 20 个坑位内容改变就需要 40 天时间,这样的效率任何企业都无法接受。

 

因此,我们希望用数据分析中归因的方式解决坑位运营中评估的问题。

 

我们引入电商坑位归因的概念,把每一笔的成交都归给转化路径中不同的坑位。根据坑位的曝光转化价值来评判坑位的好与坏。把宝贵的流量尽可能都引导到转化率更高的坑位,以此达到精细化运营的效果。当然有了这个坑位价值评判的机制后各个坑位的改版也能准确的评估,真正做到了数据驱动增长。

 

02 归因类型简介

  1. 首次触点模型:多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为第一个「待归因事件」功劳为 100%。

  2. 末次触点归因:

    多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为最后一个「待归因事件」功劳为 100%。

  3. 线性归因:

    多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为每个「待归因事件」平均分配此次功劳。

  4. 位置归因:

    多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为第一个和最后一个「待归因事件」各占 40% 功劳,其余「待归因事件」平分剩余的 20% 功劳。

  5. 时间衰减归因:多个「待归因事件」对同一个「目标转化事件」作出贡献时,认为越靠近「目标转化事件」做出的贡献越大。

 

对于电商平台来说,末次触点归因是比较适合电商站内销售归因的。虽然用末次触点归因实现方案上比简单,但是直接将价值100%归因给购买或者转化之前最后一次接触的渠道,而完全不考虑整个过程中消费者到底接触过多少个触点。转化之前发生了太多的事情,该模型完全忽视了漏斗上层和中层部分的行为对转化的影响。

 

因此我们公司融合首次触点归因和末次触点归因,计算用户进入一级流量入口后再到完成的完整购物链接行为。一级流量流入的定义为:各个入口之间无法进行跳转,只能通过切换tab进行跳转或者返回初始位置后重新点击进入。这样我们就可以基于购物的完整链接的最外层进行销售归因,并且也能知道用户购物的完整路径,同时保证销售归因后各个入口坑位的销售额之和等于当日的销售额。

 

使用这种融合归因方式,也可能知道中间步骤的转化率。比如活动会场页和商品详情页的相关推荐,虽然对电商平台整体进行销售归因时,不会计算活动会场页各个模型的销售,也不会计算商品详情页的相关推荐。

 

但是由于我们记录了用户进入一级流量入口后的详细路径,因此我们单独研究活动会场页和商品详情页的效率时,也是可以计算得到各个模块的销售来进行对比分析。但是切记不能和一级流量入口的销售混合在一起看,这样会导致销售归因发生重复。

【干货】电商归因模型技术方案_数据分析

用户购物路径模拟图

 

03 电商归因实现方案

对于电商归因我们进行了三个方面的归因,包括:曝光归因、点击归因、销售归因。即归因出所有的商品曝光来自哪里,所有的商品点击来自哪里,所有的销售来自哪里。这样就可以追踪各个流量入口的曝光链路归因指标。比如各个流量入口的商品曝光点击率、商品点击支付率、商品曝光价值等等核心监控指标来评价各个流量入口的效率。

 

电商归因准确的前提是埋点日志的完整性,因为我们是通过需要归因的事件往前找到用户的购买路径,这样的好出是大大减少计算量,也基本解决的归因的问题。因此用户行为日志的完整记录才能真实还原用户的购买路径,否则就可能导致归因出错,最终造成错误的评价数据。

 

首先需要在埋点体系中引入PageId的概念,PageId的作用是每当用户产生一次跳转行为进入一个新页面时,为这个页面赋予一个新的PageId;而当用户点击返回时,不会产生新的PageId。PageId是越靠近的当前时间的页面浏览的行为越大,且不会重复,类似于自增ID的实现逻辑。PageId的实现当然是写入埋点SDK当中,这样保证所有的埋点事件都带上PageId,并且也无需开发同步每次单独写逻辑。

 

然后根据埋点日志去还原用户的行为路径,全程都可以仅仅使用SQL逻辑就能计算完成。

  1. 首先要确定所有要归因的end事件(末端事件),包括商品曝光、商品点击、商品加购成功(加购后可以通过server的订单表判断用户是否完成了付款,也达到了销售的归因目的)。

  2. 然后在确定所有归因head事件(首端事件),即之前就定义的好的各个一级流量入口。

    我们平台比较特殊,是工具类App同时拥有电商业务,这样一级流量入口会比较多,但是可以枚举完成的,不仅仅包括常规电商App的流量入口,还可以在各个工具页面嵌入电商入口,这样复杂性要强于一般的电商App。

  3. 我们的埋点日志都会记录用户发生各个行为的本地时间,用end事件时间去找最接近的这个时间的head事件,直接用SQL的left jon关联日志表就能完成计算。

    这样在首尾2段时间内的所有埋点日志行为就是我们需要日志。

  4. 然后筛选出这些日志中的所有点击事件,过滤掉其他无效事件。

    再对所有剩下的日志进行排序,按照本地时间排序,这样就得到了一条完整的用户有效行为的路径记录。

    对于这部分数据我们就可以进行存储使用了,这部分数据为归因后用户完整链路记录数据。

  5. 再基于PageId过滤掉同个页面相同PageId的事件,保留本地时间最晚的那一条事件记录。

    这样就得到了用户进入一级流量入口后真正进行末端事件的有效路劲。

    这部分数据也需要存储记录,并且这个部分真正归因完成的用户行为路径,此时的得到各个一级流量入口就行归因得到此末端事件的来源。

  6. 通过这样计算后就了解各个一级流量入口的商品曝光点击情况,也能知道销售情况。

    利用这些数据就能衡量各个流量入口的效率情况,也同样也可以中间承载页面的效率如何。

    就能帮助产品运营更好的改善各个功能以及迭代各式各样的活动。

【干货】电商归因模型技术方案_数据分析_02

用户进行一次加购的路径还原

 

通过上述方法的计算,我们最终得到的用户加过链路步骤为:【1,2,9,10,11】,并且入口事件【1】就此次加购事件的归因来源。

 

另外再来举个商品详情页相关推荐的例子,下图所示的用户行为最终得到的链路步骤为:【1,2,9,10,11,12】,由于我们是完整保留用户的路径,因此我也只能这次加购事件不仅来源于1,也有一部分功能功能来于11,也就是商品详情页的推荐,因此我们也能计算出商品详情页的推荐效率如何,后续算法团队迭代模型时也能根据这个数据来衡量优化的好与坏。

 

【干货】电商归因模型技术方案_数据分析_03

商品详情页之间的横跳类型用户路径

 

04 总结

通过以上方案得到电商归因模型数据,可以大大提高运营同学的运营效率,不再是盲人过河实的凭感觉去优化各个坑位和活动,已经可以通过数据清晰公平的判断运营每一次迭代的结果。

 

但是仅仅根据坑位归因决定坑位价值,容易出现短期偏见,即追求短期利益,比如在一款内容产品中镶嵌一些游戏元素,可以让用户停留更久、数据表现更好。但从长期来看,这种行为破坏了整个产品的价值定位,因为内容产品原本提供的是内容并不是游戏,产品也不并是为了追求用户停留时长而是为了实现价值。这是两者都存在的短期偏见。

 

因此不能仅仅根据坑位归因后的销售转化价值来评价坑位,还需要综合考虑产品价值定位、战略发展等因素,才能围绕长期目标进行健康发展。

电商风控赛事亚军方案分享!

 Datawhale干货 作者:许汝超,广州大学,Datawhale成员本次ApacheFlink极客挑战赛暨AAIGCUP——电商推荐“抱大腿”攻击识别赛题以电商推荐反作弊为背景,要求选手在少样本、半监督、隐私保护的场景下搭建风控模型... 查看详情

归因分析(attributionanalysis)模型解析

...后,是源自于怎样的用户行为路径而产生的?·如何使用归因分析得到的结论,指导我们选择转化率更高的渠道组合?你可能第一反应就是:当然是我点了哪个广告,然后进去商品详情页产生了购买以后,这个功劳就全部归功于... 查看详情

Google Analytics(分析)报告中的归因模型

】GoogleAnalytics(分析)报告中的归因模型【英文标题】:AttributionmodelinGoogleAnalyticsreports【发布时间】:2016-04-1212:32:45【问题描述】:我们在GoogleAnalytics(分析)中使用标准和自定义报告。但是对于我们的报告,我们需要另一个... 查看详情

Python中的渠道归因(马尔可夫链模型)

】Python中的渠道归因(马尔可夫链模型)【英文标题】:ChannelAttribution(MarkovChainModel)inPython【发布时间】:2018-08-1307:27:52【问题描述】:如何在Python中进行渠道归因(马尔可夫链模型)?就像我们在R中有“ChannelAttribution”包。【... 查看详情

常见用户行为分析模型:归因分析

...理论推导,能够相对完整地揭示用户行为的内在规律。而归因是精细化运营必不可少的利器,归因的目的,终究是为了提升运营转化与收入增长。本文详细介绍了归因分析模型的概念和应用场景,与大家分享。在PC互联网时代,... 查看详情

电商网站商品模型之商品详情页设计方案

如下设计方案参考淘宝和华为商城SKUSPU的关系SPU=StandardProductUnit(标准产品单位)SPU是商品信息聚合的最小单位,是一组可复用、易检索的标准化信息的集合,该集合描述了一个产品的特性。例如iphone4就是一个SPU,与套餐、存储... 查看详情

电商网站商品模型之商品详情页设计方案

如下设计方案参考淘宝和华为商城SKUSPU的关系SPU=StandardProductUnit(标准产品单位)SPU是商品信息聚合的最小单位,是一组可复用、易检索的标准化信息的集合,该集合描述了一个产品的特性。例如iphone4就是一个SPU,与套餐、存储... 查看详情

电商初级技术方案探讨

一.电商技术栈  主流: nginx+lua ??? 待验证from  http://www.infoq.com/cn/articles/e-commerce-web-tech-stack 二. java方案前端分移动端(Android、IOS)、PC端,业务层开放restful接口给前端调用,http协议j 查看详情

干货:通过双十一等项目实战看架构技术

每年“双11”都是一场电商盛会,消费者狂欢日。今年双11的意义尤为重大,它已经发展成为全世界电商和消费者都参与进来的盛宴。而对技术人员来说,双十一无疑已经成为一场大考,考量的角度是整体架构、基础中间件、运... 查看详情

亿级流量电商系统jvm模型参数预估方案(代码片段)

1.需求分析大促在即,拥有亿级流量的电商平台开发了一个订单系统,我们应该如何来预估其并发量?如何根据并发量来合理配置JVM参数呢?假设,现在有一个场景,一个电商平台,比如京东,需要... 查看详情

亿级流量电商系统jvm模型参数预估方案(代码片段)

1.需求分析大促在即,拥有亿级流量的电商平台开发了一个订单系统,我们应该如何来预估其并发量?如何根据并发量来合理配置JVM参数呢?假设,现在有一个场景,一个电商平台,比如京东,需要... 查看详情

如何撰写好的技术方案设计-真实案例干货分享

一、前言作为一个技术开发者,特别是高级、资深开发、架构师等,往往会遇到根据需求撰写技术方案。那么如何撰写一篇好的技术方案设计,我们今天就来聊一聊这个话题。二、技术方案是否有必要答案是肯定的。我见过太多... 查看详情

如何撰写好的技术方案设计-真实案例干货分享

一、前言作为一个技术开发者,特别是高级、资深开发、架构师等,往往会遇到根据需求撰写技术方案。那么如何撰写一篇好的技术方案设计,我们今天就来聊一聊这个话题。二、技术方案是否有必要答案是肯定的。我见过太多... 查看详情

干货分享品牌粉丝经济企业新型电商转型之路

【干货分享】品牌粉丝经济企业新型电商转型之路纵观国内电商发展趋势,从传统价格型电商、综合性电商、体验式电商逐步发展到现在,形成了天猫、京东、苏宁易购、唯品会等电商巨头,对于传统品牌企业机会将在哪里,如... 查看详情

35生鲜电商平台-技术方案与文档下载

说明:任何一个好的项目,都应该有好的文档与设计方案,包括需求文档,概要设计,详细设计,测试用例,验收报告等等,类似下面这个图:      有以下几个管理域:     1.开发域。&nbs... 查看详情

干货分享品牌粉丝经济企业新型电商转型之路

纵观国内电商发展趋势,从传统价格型电商、综合性电商、体验式电商逐步发展到现在,形成了天猫、京东、苏宁易购、唯品会等电商巨头,对于传统品牌企业机会将在哪里,如何在激烈的电商竞争中取得一席之地,值得我们思... 查看详情

技术干货原来arm+linux音频方案如此简单!

 嵌入式产品开发中经常遇到音频的输入输出问题,如何为其添加“喇叭”、“麦克风”设备呢?本文将简单介绍ARM+Linux产品中的音频解决方案。 我们先认识下I2S(Inter-IC Sound)总线。I2S又称集成电路内置音频总线,... 查看详情

营销渠道客户转化分析(归因分析模型)(代码片段)

1.背景及问题现某IT产品销售公司,有一定量的小公司水平的用户,这些用户在做出购买时,会接触到销售公司的多个营销渠道,不同的渠道上投入怎样分配,以实现营销效益的最大化,便成为了很多公司的市场营销部门亟需解... 查看详情