如何用excel进行预测分析?

houzidata houzidata     2022-11-29     510

关键词:

技术图片

 

【面试题】

 

一个社交APP, 它的新增用户次日留存、7日留存、30日留存分别是52%、25%、14%。

 

请模拟出来,每天如果日新增6万用户,那么第30天,它的日活数会达到多少?请使用Excel进行分析。

 

【分析思路】

 

第1日(次日)留存用户数=第1日新增用户数*次日留存率

第2日活跃用户数=第2日新增用户数+第1日留存用户数

第3日活跃用户数=第3日新增用户数+第2日留存用户数(第2日新增用户数*第2日留存率)+第1日留存用户数

...

第30日活跃用户数=第30日新增用户数+第29日留存用户数+第28日留存用户数+...+第1日留存用户数

 

也就是,

第30日活跃用户数=1日-29日每天的留存用户数(第1日留存用户数+第2日留存用户数+...+第29日留存用户数)+第30日新增用户数

 

现在只需要计算出1日-29日每天的留存用户数就可以了,而第N日的留存用户数=第N日新增用户数(6万)*第N日留存率。所以现在的问题是需要知道每天的留存率是多少。

 

 

那么,问题就来了。题目只有3个留存率(新增用户次日留存、7日留存、30日留存分别是52%、25%、14%)。

 

如何根据已有的几个留存率去预测剩下那些天的留存率呢?

 

很简单,用excel 1分钟就能搞定。

 

1.用现有的数据做散点图

 

技术图片

 

2.对散点图添加趋势线

 

技术图片

 

趋势线有以下几种类型,应该添加哪一类型的趋势线呢?

 

技术图片

 

一般来说,正常的留存曲线是一开始快速下降,然后开始缓慢下降,最后逐步平稳的曲线。

 

所以,留存曲线的形状会类似于下图:初始在震荡期快速下降;选择期开始缓慢下降;过了选择期就是平稳期,留存率会进入一个相对稳定的阶段。

 

技术图片

 

这种留存曲线的形状和乘幂函数十分接近,所以,在这里我们用幂函数来对留存曲线进行拟合。同时勾选“显示公式”和“显示R平方值”。最终得到了如下曲线,函数公式为y = 0.5227x^-0.385,R² = 0.9997,可以看到拟合后的幂函数的形状和上图的留存曲线的形状几乎一样。

 

技术图片

拓展:

你肯定想知道这个趋势线的可靠性有多大?

 

这就涉及到趋势线的 R 平方值。R 平方值是介于 0 和 1 之间的数值。当趋势线的 R 平方值为 1 或者接近 1 时,趋势线最可靠。如案例演示中,R的平方值达到了0.9997,因此可以说这条趋势线可靠性非常大。

 

要获得最精确的预测,为数据选择最合适的趋势线非常重要。

 

那么,什么情况下选用什么样的趋势线呢?

 

指数:指数趋势线适用于速度增加越来越快的数据。

 

线性:线性趋势线是适用于简单线性数据集合的最佳拟合直线。如果数据点的构成的趋势接近于一条直线,则数据应该接近于线性。线性趋势线通常表示事件以恒定的比率增加或减少。

 

对数:如果数据一开始的增加或减小的速度很快,但又迅速趋于平稳,那么对数趋势线则是最佳的拟合曲线。

 

多项式:多项式趋势线是数据波动较大时使用的曲线。

 

乘幂:乘幂趋势线是一种适用于以特定速度增加的曲线。但是如果数据中有零或负数,则无法创建乘幂趋势线。

 

移动平均:移动平均趋势线用于平滑处理数据中的微小波动,从而更加清晰地显示了数据的变化的趋势。(在股票、基金、汇率等技术分析中常用)

 

 

3.计算第n天留存率

 

拟合出留存曲线后, 我们就可以根据拟合的函数公式(y = 0.5227x^-0.385)去计算次日到30日的留存率。

 

也就是把x=1,x=2…x=30,分别代入函数公式,这里可以借助Excel的power幂函数,求出结果。如下图,可以看到按照模型函数公式计算出来的留存率,即模型留存率与给定的留存率几乎完全一致(黄色的行)。

 

技术图片

 

4.计算30天后日活数

 

通过上面的步骤,我们已经得到了每天的留存率。接下来我们就可以计算第30天的日活用户数有多少。

 

 

第1日(次日)留存用户数=第1日新增用户数*次日留存率

第2日活跃用户数=第2日新增用户数+第1日留存用户数

第3日活跃用户数=第3日新增用户数+第2日留存用户数(第2日新增用户数*第2日留存率)+第1日留存用户数

...

第30日活跃用户数=第30日新增用户数+第29日留存用户数+第28日留存用户数+...+第1日留存用户数

 

也就是,

第30日活跃用户数=1日-29日每天的留存用户数(第1日留存用户数+第2日留存用户数+...+第29日留存用户数)+第30日新增用户数

 

(1)在下图Excel步骤1的地方是题目的设定,每天固定新增用户数为6万

 

在下图步骤2的地方算出1日-29日每天的留存用户数,也就是第N日新增用户数(6万)*第N日留存率(F列对应的留存率)。

 

技术图片

 

 

(3)下图步骤3将这一列的值求和,就是第30日活跃用户数=1日-29日每天的留存用户数+第30日新增用户数

 

技术图片

5.总结

 

Excel里进行预测分析的2种办法:

1)时间序列数据如何预测?用预测工作表

2)其他数据如何预测?先画散点图,然后添加趋势线和公式

 

技术图片

 

 

推荐:人工智能时代的通用能力

 

技术图片

个数是如何用大数据做行为预测的?

“个数”是“个推”旗下面向APP开发者提供数据统计分析的产品。“个数”通过可视化埋点技术及大数据分析能力从用户属性、渠道质量、行业对比等维度对APP进行全面的统计分析。“个数”不仅可以及时统计用户的活跃、新增... 查看详情

如何用perl对excel的数据进行提取并分析

巡检类工作经常会出具日报,最近在原有日报的基础上又新增了一个表的数据量统计日报,主要是针对数据库中使用较频繁,数据量又较大的31张表。该日报有两个sheet组成,第一个sheet是数据填写,第二个sheet则是基于第一个shee... 查看详情

如何用sql分析电商用户行为数据(案例)

参考技术A     本文以“淘宝用户行为数据集”的分析全过程为例,展示数据分析的全过程——使用工具:MySQL,Excel,Navicat,PowerBI——分析类型:描述分析,诊断分析——分析方法:漏斗分析,用户路径分析... 查看详情

如何用 20 个自变量和 1 个目标变量进行时间序列预测?

】如何用20个自变量和1个目标变量进行时间序列预测?【英文标题】:Howtomaketimeseriesforecastingwith20Independentvariableandonetargetvariable?【发布时间】:2022-01-1614:53:42【问题描述】:在我正在研究的一个问题中,我必须进行时间序列预... 查看详情

如何用excel对散点图进行数据分析

散点图主要是分析两列数据的关系的。看散点的位置,就可以大概了解两列数据之间的相关性。其制作步骤如下;首先需要启动Excel,获得相应的数据源,这个数据源就是两列数据,就是X和Y,以此为基础就可以制作散点图啦。选... 查看详情

如何用spss对数据进行标准化处理

参考技术A1、打开spss,将界面切换到变量视图。在编辑栏目创建观测指标及类型。示例创建两个指标,一个作为自变量,另外一个作为因变量,分别是gpd和urbanization,代表人均gdp和城市化水平。2、指标及类型建好了以后,就要... 查看详情

如何用spss做相关性分析

参考技术A打开SPSS软件;点击“开始”按钮,双击“SPSS”软件。导入数据:点击左上角“文件”-----“打开”-----“数据”,并选择你的数据如果为spss数据可以直接导入,若为excel格式,需要在“文件类型”框中选择“excel格式”... 查看详情

如何用spss软件进行probit模型分析

参考技术A分析—回归—Probit,这样操作即可 查看详情

如何用python进行线性回归以及误差分析

参考技术A因变量是你自己确定的,一般主成分得分是作为自变量的,叫主成分回归分析 查看详情

如何用knime进行情感分析

SPSS、RapidMiner、KNIME以及Kettle四款工具都可以用来进行数据分析,只是彼此有各自的侧重点和有劣势。它们都可以逐步的定义数据分析过程,也同样都可以对数据进行ETL处理。笔者从自己关心的角度简单对比以上四款数据分析工... 查看详情

如何用 FFT 进行频谱分析? [关闭]

】如何用FFT进行频谱分析?[关闭]【英文标题】:howtodospectrumanalysewithFFTW?[closed]【发布时间】:2014-05-2700:54:17【问题描述】:我想更好地了解FFTW的API。FFTW是一个用于计算一维或多维离散傅里叶变换(DFT)的库。现在,假设我有一个... 查看详情

如何用excel计算p值?

MicrosoftExcel提供了一组数据分析工具,称为“分析工具库”,在建立复杂统计或工程分析时可节省步骤。只需为每一个分析工具提供必要的数据和参数,该工具就会使用适当的统计或工程宏函数,在输出表格中显示相应的结果。... 查看详情

如何用excel做客户管理教程

...个表进行管理,接下来请欣赏我给大家网络收集整理的如何用excel做客户管理教程。  如何用excel做客户管理教程1:准备和调取相关数据。  如何用excel做客户管理教程2:需要的相关数据包括客户拜访线路表(如图表1)、季度... 查看详情

如何用excel进行数据分组

工具/材料:MicrosoftOfficeWord2016版,Excel表格。 1、首先选中Excel表格,双击打开。 2、其次在该界面中,选中要进行数据分组的所在单元格。 3、继续在该界面中,点击上方工具栏里“排序”里“自定义排序”按钮。 ... 查看详情

如何用python进行线性回归以及误差分析

参考技术A  如何用Python进行线性回归以及误差分析   如果你想要重命名,只需要按下:  CTRL-b  状态条将会改变,这时你将可以重命名当前的窗口  一旦在一个会话中创建多个窗口,我们需要在这些窗口间移动的... 查看详情

如何用java对excel进行自定义排序?

  使用apachepoi读取进内存后排序再生成excel文件。  你在写sql语句的时候就事先通过orderby语句按哪一列或是哪几列排好了,那样导出的EXCEL表格是按你想排的那子了。参考技术A  使用apachepoi读取进内存后排序再生成excel文... 查看详情

如何用spss进行数据分析?

1.什么是SPSSSPSS是社会统计科学软件包的简称,其官方全称为IBMSPSSStatistics。SPSS软件包最初由SPSSInc.于1968年推出,于2009年被IBM收购,主要运用于各领域数据的管理和统计分析。作为世界社会科学数据分析的标准,SPSS操作操作界面... 查看详情

如何用spss进行解释变量的内生性检验与效果检验

在SPSS中,您可以使用回归分析来进行内生性检验和效应检验。首先,您需要准备好数据并将其导入SPSS。然后,打开“分析”菜单并选择“回归”>“线性...”。在“线性回归”对话框中,在“因变量”框中选择您希望预测的变... 查看详情