如何预测用户流失率，提前做好策略？

您当前位置：

首页营销资讯

如何预测用户流失率，提前做好策略？

2021-03-30 • 阅读

用户流失率直接反映了产品的市场接受程度如何，以及运营工作的好坏。预测流失率的目标在于预测用户将会在哪个时间点离开，从而提前准备好策略，留住他们。

什么是用户流失率？我们为什么需要关注用户流失率？

简单来说：用户流失率是指用户的流失数量与全部使用/消费产品（或服务）用户的数量的比例，是用户流失的定量表述，以及判断用户流失的主要指标，直接反映了产品的市场接受程度如何，以及运营工作的好坏。

一般来说，这个指标用在“订阅型产品”的情形居多，如信息订阅类App“锤子阅读”、绝大多数的在线SaaS产品，甚至传统的牛奶订购。

由于留住当前的用户要比获取新用户来的划算，所以预测流失率的目标在于：

预测用户将会在哪个时间点离开（在订阅期结束前），在合适的时间点对这些用户施加影响，挽留他们，如通过短信、邮件或APP，利用超低价商品吸引回访或者专属优惠券等，这些策略对于一些流失用户是很有效的！

接下来，笔者将利用简单的统计学知识，介绍一种基于用户不活跃记录的用户流失预测模型。

该模型在不使用机器学习算法的情况下，可以给出一个容易理解的用户流失预测，以便我们对将要离开的用户有一个相当准确的洞察。

废话不多说，进入正题吧~

一、用户活跃的操作性定义

在我们正式开始预测用户流失率之前，我们需要记录用户的历史活跃情况。做这个的目的在于：了解用户是否在使用我们的产品或服务。

那么，问题就来了，用户的“活跃”该做怎样的操作性定义（即根据可观察、可测量、可操作的特征来界定变量含义的方法）？

实际上，“用户活跃”的定义取决于你的业务背景，跟产品或者服务场景密切相关，不同类型的产品对“用户活跃”有不同的定义。以新浪微舆情的“信息监测”为例，它是一款订阅型的大数据产品，用户通过各种关键词的组合检索到信息后，然后选择邮件或者客户端订阅，按照自定义的接收频次来收取订阅信息。

对于这款数据产品来说，用户的活跃可以这样定义：如果一个用户是活跃的，那么在指定时间段内（分析单位取决于分析者，可以是天、周、月、季度或年），应该包含如下付费、使用或者互动行为：

该用户对“信息监测”的订阅尚未过期；
该用户在web端或者移动端登录产品页面；
该用户使用了产品的部分或全部功能，如基于信息源或者地域的定向监测功能；
该用户在此期间产生了一些消费，如文本数据下载、订阅续费等；
该用户在此期间对该产品有各种反馈，包括投诉。
…

对于这款产品来说，以月份为单位来分析用户行为是很有意义的，因为该产品最短的订阅期是一个月，最长的订阅期是一年。

一旦清晰的界定了“用户活跃”的定义，我们就可以用这些操作性定义来对每个月份的用户（不）活跃情况进行编码，利用二进制值（0,1）—假如在X月份，用户是活跃的，将ta的活跃值设定为1，否则设定为0。

二、建立“用户不活跃档案”

现在，对于每位用户，我们有了一个以月为单位的“活跃标记”，接下来我们以此为基础，建立起“用户不活跃档案”。这意味着，对于每个用户，笔者想对他们连续不活跃的月份数进行计数统计。

在这里，笔者选择了一年的“分析窗口”（也就是把12个月作为分析的时间范围），将“活跃档案”和“不活跃档案”以表格的形式呈现—蓝色表单显示每位用户在各个月份上的活跃记录，绿色表单则显示用户的不活跃记录。

根据用户在此时间段内可能出现的活跃情形，笔者枚举出3种典型用户，如下表所示：

1.用户A：

该用户在刚进入“分析窗口”时是活跃的，然而在5月变得不活跃（也就是说，5月份是第一个不活跃的月份）。接下来，这个用户的不活跃状态持续到了12月，也就一直持续到了“分析窗口”的末尾

因此，从5月到12月，“用户不活跃档案”对用户连续不活跃的月份进行逐月累加的计数统计。

2.用户B：

跟用户A一样，该用户刚开始也是活跃的。不同的是，该用户在3~6月期间是不活跃的，在7月仅维持了一个月的活跃状态，接着在8月和9月又进入不活跃状态，最后在“分析窗口”的10月、11月和12月又回到活跃状态。

在这种情况下，每当用户由不活跃状态返回活跃状态时，前面的不活跃月份计数需要重置。也就是说：当我们再次对该用户的连续不活跃月份进行计数时，需要重新从1开始计数，前面的不活跃月份计数不再累加。

3.用户C：

与上述提及的两类用户不同，该用户刚进入“分析窗口”时，是不活跃的状态。这种情形的发生，可能是用户的订阅早已过期（最好在正式分析前排除这种情形，因为很难处理），或者该用户在“分析窗口”开始前就是不活跃的。

因为我们看不到“分析窗口”前的用户活跃情况，所以用户在此之前的活跃状态，我们是不了解的。鉴于此状况，我们对这些月份进行特殊的标记—使用-1标记用户C头几个不活跃的月份。该用户其他的不活跃情形，可以参照前面两类用户方式进行计数。

Note：后面绿色的表单，也就是“用户不活跃档案”，才是我们接下来建立用户流失模型所需要关注的数据。

三、构建用户流失模型

有了上述的关于用户不活跃的操作性定义，我们就可以在“分析窗口”内（1月份到12月份）以月份为单位，对从0到12的连续不活跃月份数上的用户数量进行计数统计。

这个步骤可以通过数据透视表实现—通过聚合每个月、每个不活跃级别的用户数量。如下表所示：

上表中，从列的方向上来看，每个单元格的数值表示每个月的连续不活跃X个月的用户的数量。

举个例子来说：上表中第一个高亮数值（574），代表1月份已经不活跃1个月的用户数量，该数值来自于前面12月份的4815个活跃用户；第二个高亮数值（425）表示在2月份已经连续不活跃2个月的用户数量—425来自于574（1月份不活跃1个月的用户数，它是2月份不活跃2个月的用户数的基数）。值得注意的是：第一行的0个连续不活跃月份数，其实表示的是基数中活跃用户的数量。

使用这些数据，我们可以计算出在“分析窗口”内，每个月连续不活跃月份数的用户占比情况。如下面的绿色表格所示：

上表中，高亮的数值（74%）表示2月份已经连续2个月不活跃的用户占比。

该百分比是这样计算得到的：

笔者想获得最具代表性的数值，由此可以对分析窗口的最末4个月（9月，10月，11月和12月）取平均值。我们可能没有足够的数据去计算这些平均值（比如10月份、11月份和12月份）—在这种情况下，我们取所有可用数值的平均值（用于计算平均值的数值区域以红色线框标记）：

四、计算用户流失概率

哈哈，如果你还在看这篇文章，那么恭喜你！我们将要探讨最激动人心的部分。在这部分，我们将用上一点统计学的小知识。

让我们回顾一下

以上就是本站关于 [如何预测用户流失率，提前做好策略？] 的详细介绍。

如果您还有什么疑问或需求，请【立即咨询】客服或添加 VX：19008205409 由我们的专业顾问免费为您解答。