您当前位置:

首页 营销资讯

从0到1掌握用户画像知识体系

从0到1掌握用户画像知识体系

2021-03-29 • 阅读

前段时间上了一个用户画像的课程,授课老师是《用户画像:方法论与工程化解决方案》的基于对上述学习内容的理解,同时结合工作实践,通过本文和大家分享下有关用户画像的认知、建设方法、产品化和应用。

一、初识用户画像

1.1用户画像

随着用户的一切行为数据可以被企业追踪到,企业的关注点日益聚焦在如何利用大数据为经营分析和精准营销服务,而要做精细化运营,首先要建立本企业的用户画像。

提到用户画像的概念,我们区分下用户角色(Persona)和用户画像(Profile):

1.1.1  用户角色(Persona)

用户角色本质是一个用以沟通的工具,当我们讨论产品、需求、场景、用户体验的时候,为了避免在目标用户理解上的分歧,用户角色应运而生。用户角色建立在对真实用户深刻理解,及高精准相关数据的概括之上,虚构的包含典型用户特征的人物形象。如下是一个典型的用户角色:

1.1.2  用户画像(Profile)

用户画像更多被运营和数据分析师使用,精准营销、经营分析、个性化推荐都是基于用户画像的应用。用户画像是各类描述用户数据的变量集合,能够准确描述任何一个真实用户。如下是一个简化的用户画像:

{  “ID”: 123456,

“姓名”: “张建国”,

“性别”: “男”,

“出生年月”: 631123200,

“籍贯”: “北京”,

“居住地”: “北京”,

“教育背景”:

{  “学校”:”北京大学”,

“专业”: “CS”,

“入学年月”:1220218400

}

}

1.2  用户标签和用户画像

1.2.1  用户标签

用户标签,即对用户某个维度属性的描述,具有相互独立、可枚举穷尽的特点。采集业务、日志、埋点等数据后,经过不同统计方式计算出用户属性、用户行为、用户消费、风险控制、社交等维度标签。例如:性别、年龄、近30日访问次数、购买水平、经常活跃时间段等。有关用户标签体系建设的详细描述,见「2 建设标签和标签体系」章节。

1.2.2  用户画像

构建用户画像,就是给用户打上各种维度的标签。从业务价值来说,标签和画像是类似中间层的系统模块,为数据驱动运营奠定了基础,可以帮助大数据“走出”数据仓库,针对用户进行个性化推荐、精准营销等多样化服务。有关用户画像系统、落地应用的详细描述,见「3 用户画像产品化」「4 用户画像应用」「5 用户画像实践案例」章节。

1.3  用户群组和用户标签

用户标签和用户群组是两个容易混淆、具有迷惑的概念,下面尝试区分:

1.3.1  用户群组

需要用户属性和行为组合,才能圈选出全面的目标群体。只有行为数据,只能看到这个人做过什么事,但这个人是男是女、年龄多大、注册多久 、购买能力如何等信息都不知道,这样圈选出的用户群是有缺陷的,一般不会直接应用于精准营销场景。

1.3.2  用户标签

建立用户标签,不用非要组合用户属性和行为事件,单用用户属性可以,单用行为事件也可以。基于用户属性、行为事件计算出的用户标签,本质也是用户属性,或者说用户属性本身就是标签。

1.3.3  群组是标签的一种应用方式

标签作为一个中间层系统模块,在精准营销场景,往往不会只使用一个标签进行推送,更多情况下需要组合多个标签来满足业务上对人群的定义,见下图:

这里通过一个场景来介绍基于用户标签圈选用户群组的应用。某女装大促活动期间,渠道运营人员需要筛选出平台上的优质用户,并通过短信、邮件、Push等渠道进行营销。

第1步:通过圈选“浏览”“收藏”“加购”“购买”“搜索”与该女装相关品类的标签来筛选出可能对该女装感兴趣的潜在用户

第2步:组合其他标签(如“性别”“消费金额”“活跃度”等)筛选出对应的高质量用户群,推送到对应渠道。因此,将用户属性、行为事件数据抽象成标签后,可通过组合标签方式找到目标潜在用户人群。从这个角度理解,用户群组是用户标签应用的一种方式。

二、建设标签和标签体系

2.1  标签的分类

标签本身会有很多分类方式,但从标签的实现规则来看,大致可以分为以下3种类型:① 统计类标签、② 规则类标签、③ 机器学习挖掘类标签。

2.1.1 统计类标签这类标签

是最为基础也最为常见的标签类型,例如,对于某个用户来说,其性别、年龄、城市、星座、近7日活跃时长、近7日活跃天数、近7日活跃次数等字段可以从用户注册数据、用户访问、消费数据中统计得出。该类标签构成了用户画像的基础。

2.1.2  规则类标签

该类标签基于用户行为、用户属性和确定的规则产生。例如,对平台上“消费活跃”用户这一口径的定义为“近30天交易次数≥2”。在实际开发画像的过程中,由于运营人员对业务更为熟悉,而数据人员对数据的结构、分布、特征更为熟悉,因此规则类标签的规则由运营人员和数据人员共同协商确定。

2.1.3  机器学习挖掘类标签

该类标签通过机器学习挖掘产生,用于对用户的某些属性或某些行为进行预测判断。例如,根据一个用户的行为习惯判断该用户是男性还是女性、根据一个用户的消费习惯判断其对某商品的偏好程度。该类标签需要通过算法挖掘产生。

在项目工程实践中,一般统计类和规则类的标签即可以满足应用需求,在开发中占有较大比例。机器学习挖掘类标签多用于预测场景,如判断用户性别、用户购买商品偏好、用户流失意向等。一般地,机器学习标签开发周期较长,开发成本较高,因此其开发所占比例较小。

事实上,最终标签体系中是以用户视角定义的,需要结合具体的业务。比如某电商业务标签分类,用户属性维度标签、用户行为维度标签、用户消费维度标签、风险控制维度标签、社交属性维度标签。

2.2  标签建设流程

下图是一个标签建设流程,会侧重产品经理视角,主要描述需求的分析过程和产出文档,同时对标签的开发原理进行简单总结。

2.2.1  需求收集与分析

在需求收集与分析环节,可以按还原业务流程——明确商业目的——从策略推标签——汇聚标签的步骤开展。

某服装零售商,通过布局线上商城和线下实体店来扩大经营。线上的话,主要是通过微信公众号引流到小程序,然后在小程序完成交易。下面通过该服装零售案例,具体描述下,如何进行标签需求的收集与分析:

1、识别分析业务流程和业务场景触点

用户画像是基于业务的,因此,构建标签的第一个步骤就是识别与分析用户的决策流程和业务场景,以便快速熟悉业务。参考下方案例业务流程的还原:首先是通过各种场景被吸引来的微信用户关注公众号成为了粉丝,然后公众号运营人员会给微信粉丝推送图文消息进行粉丝运营,同时把粉丝引流到小程序商城,公众号粉丝最终会在小程序商城成交转化。

在整个过程中,公众号运营人员会持续进行微信粉丝的维护和流失粉丝的挽回等运营工作。

此处推荐:

a.《有效需求分析》中详细需求篇业务功能支持主线需求分析方法

2、明确每个业务场景触点的商业目的这一步基于之前对业务流程的梳理,洞察业务问题,明确想要达到什么商业目的,并对商业目的进行拆分。参考下方案例从明确整体商业目标,到商业目标拆解和量化的过程:

O:假设该服装零售商线上的布局已经比较完善,现阶段的首要商业目的就是提升销售金额,因此“提升销售金额”就是该零售电商的北极星指标,那么提升流量、提升转化率、提升客单价、提升复购率就是拆解后的核心指标。

S:此处假设想要提升进入小程序商城的流量,可以采取的策略也很多。比如,通过扫码关注后推送优惠券方式吸引更多的微信用户关注成为粉丝;再比如,产出更高质量微信图文,更好的运营微信私域流量。

M:紧接上一步,针对推送优惠券吸引用户关注公众号这个策略,我们可以重点关注通过扫码方式关注公众号比率、取关的比率,新旧粉丝的比率。

此处推荐:

a.OSM模型(Objective、Strategy、Measurement)

b.销售公式=流量*转化率*客单价*复购率

3、从商业目的导向运营策略设计及用户标签需求针对不同商业目的,对标签体系的建设也是不一样的,因此要从运营策略推导出标签。比如业务部门要做个性化推荐,做关于物或者人的兴趣、偏好的标签会比较有价值;但是如果要做精细化运营,关于用户的留存、活跃标签会更有价值。参考下方用户标签选用的案例:

把提升扫码方式关注率作为量化的目标,选用的运营策略是通过推送优惠券方式吸引微信用户扫码,新粉丝扫码关注后推送100元优惠券,老粉丝扫码后推送50元优惠券,那么执行运营策略过程中需要用到“是否新粉丝”这个标签。

在此阶段,可以准备一个简单的记录沟通内容的Excel模板,列表头包括标签名、标签规则、使用场景等,和业务方一起把沟通内容记录下来。

4、组织标签关于组织标签,需要基于对业务和策略的理解,以用户视角进行分类管理。下面是一个参考框架:

(1)用户属性类标签:性别、年龄、省份、城市、注册日期、手机号码等

(2)用户行为类标签:近30日访问次数、近30日客单价、近30日活跃天数、近30日访问时长、平均访问深度等

(3)用户消费类标签:收入状况、购买力水平、已购商品、购买渠道偏好、最后购买时间、购买频次等(4)商品品类类标签:高跟鞋、靴子、衬衫、法式连衣裙、牛仔裤等

(5)社交属性类标签:经常活跃的时间段、活跃地点、单身、评价次数、好评度等

2.2.2  产出标签需求文档

经过前面的需求收集与分析,已明确了业务方的标签需求。为了顺利交付研发,接下来还需要:撰写标签体系文档——根据标签规则确定埋点——撰写数据需求文档。

1、撰写标签体系文档

在此环节,数据产品经理需要根据前期和业务方的沟通内容,产出具体的标签体系文档:

(1)标签ID:例如, ATTRITUBE_U_01_001, 其中“ATTRITUBE”为人口属性主题,“_”后面的”U”为userid维度,“_”后面“01”为一级归类,最后面的“001”为该一级标签下的标签明细

(2)标签名称:英文格式名称,例如,famale

(3)标签汉语:女

(4)标签主题:描述标签所属的主题,例如,用户属性维度标签、用户行为维度标签、用户消费维度标签(5)标签层级ID:标签所属的层级,一般会分为2级(6)名称:与ID对应的名称

(7)标签类型:统计类标签、规则类标签、机器学习算法类标签

(8)更新频率:实时更新、离线T+1更新、单次计算(9)标签算法规则:

a.需要描述选择哪张数据表中的具体哪个字段,若需要多张表做关联,还需要说明通过什么字段进行join

b.具体的算法逻辑和统计周期,比如“近7天支付次数”,就是需要统计近7天支付的总次数。

(10)使用场景描述

(11)排期

(12)开发人

(13)需求方

(14)优先级

2、根据标签规则确定埋点

前面已经明确了标签的算法规则,接下来要进一步确定应该埋哪些点来采集所需的数据,下面是一个具体

案例:

针对“购买商品品类偏好”这个标签,会用到点击下单按钮事件数据,以及商品名称、商品分类等事件属性数据,那么就需要对点击下单按钮事件进行埋点。

3、撰写数据需求文档

埋点取哪些数据已经确定了,就需要产出具体的数据需求文档,交付负责埋点的开发同事进行埋点取数了。在数据需求文档,应该明确以下内容:

(1)埋点名:click_order

(2)埋点显示名:点击下单按钮

(3)上报时机:根据实际情况,选择是何时进行上报。比如对于点击下单事件,可以选择点击了下单按钮时就进行上报

(4)埋点形式:根据实际情况,选择是客户端埋点,还是服务端埋点。比如“购买商品品类偏好”标签的下单按钮点击事件,因为只是想判断用户对购买商品的偏好,用户点击按钮后已经能说明是否有偏好了,不需要等服务端返回是否成功的提醒,因此适合采用客户端埋点形式

(5)属性名:事件属性的名称,比如点击下单按钮事件的商品名称属性

(6)属性值:比如衬衫

(7)备注

实际工作中,撰写标签体系文档、根据标签规则确定埋点、撰写数据需求文档,会是一个互相完善补充的过程。

2.2.3  标签的开发

在整个工程化方案中,系统依赖的基础设施包括Spark、Hive、HBase、Airflow、MySQL、Redis、Elasticsearch。除去基础设施外,系统主体还包括ETL作业、用户画像主题建模、标签结果数据在应用端的存储3个重要组成部分。如图所示是用户画像数仓架构图,下面对其进行简单介绍。

1、Hive数据仓库ETL作业

下方虚线框中为常见的数据仓库ETL加工流程,也就是将每日的业务数据、日志数据、埋点数据等经过ETL过程,加工到数据仓库对应的ODS层、DW层、DM层中。

2、Hive数据仓库用户画像主题建模

中间的虚线框即为用户画像建模的主要环节,会对基于数据仓库ODS层、DW层、DM层中与用户相关数据进行二次建模加工。

3、标签结果数据在应用端的存储

在用户画像主题建模过程中,会将用户标签计算结果写入Hive,由于不同数据库有不同的应用场景,下面分别进行描述:

(1)MySQL

作为关系型数据库,在用户画像中可用于元数据管理、监控预警数据、结果集存储等应用中。下面详细介绍这3个应用场景:

a.元数据管理:MySQL具有更快的读写速度,平台标签视图中(Web端产品)的标签元数据可以维护在MySQL关系数据库中,便于标签的编辑、查询和管理。

b.监控预警数据:在对画像的数据监控中,调度流每跑完相应的模块,就将该模块的监控数据插入MySQL中,当校验任务判断达到触发告警阈值时,就触发告警。

c.结果集存储:存储多维透视分析用的标签、圈人服务用的用户标签、当日记录各标签数量等。

(2)HBase

与Hive不同的是,HBase能够在数据库上实时运行,而不是跑MapReduce任务,适合进行大数据的实时查询。

下面通过一个案例来介绍HBase在画像系统中的应用场景和工程化实现方式:

某渠道运营人员为促进未注册的新安装用户注册、下单,计划通过App首页弹窗发放红包或优惠券的方式进行引导。每天画像系统的ETL调度完成后对应人群数据就被推送到广告系统(HBase数据库进行存储)。

满足条件的新用户来访App时,由在线接口读取HBase数据库,在查询到该用户时为其推送该弹窗。

(3)Elasticsearch

是一个开源的分布式全文检索引擎,可以近乎实时地存储、检索数据。对于用户标签查询、用户人群计算、用户群多维透视分析这类对响应时间要求较高的场景,也可以考虑选用Elasticsearch进行存储。

2.2.4  标签发布与效果追踪

通过开发测试,上线后需要持续追踪标签应用效果及业务方反馈,调整优化模型及相关权重配置。

三、用户画像产品化

从业务价值来说,标签和画像类似一个为前台服务提供数据支持的中间层系统模块。开发完画像标签数据,如果只是“躺在”数据仓库中,并不能发挥更大的业务价值。只有将画像数据产品化后才能以标准方式提升数据处理链路上各个环节的效率,同时也更便于业务方使用。下面分别从产品化后涵盖的标签生产架构和功能模块两个角度进行总结:

3.1  用户画像产品系统架构

下图是一个用户画像产品系统的结构图,数据是从左到右的,主要包括数据采集、数据接入、数据整合/标签计算、标签应用4个层级。下面尝试对其进行简单描述:

3.1.1  数据采集

在数据采集模块,主要通过客户端/服务端SDK、导入、对接第三方应用3种埋点方式进行日志数据、业务数据、第三方数据的采集。

1、SDK

(1)客户端SDK:通过客户端SDK埋点,可以采集iOS、Android、小程序、网站等各种客户端的用户行为数据和用户属性信息。

(2)服务端SDK:若数据已经存在数据库、数据仓库,比如订单信息,可以使用对应开发语言的服务端SDK进行数据的采集。

2、Importer

可以根据运行环境、源数据格式、导入数据量的大小等影响因素,选择不同大导入方式,把历史文件数据导进用户画像产品系统。

3、Link针对不同第三方产品OpenAPI的特点,采用接收事件消息推送、或主动轮询方式采集用户在不同第三方应用系统的个人属性和行为事件数据。

3.1.2  数据接入

埋点数据先大量进入Kafka,然后慢慢消费接入后续的数据整合存储系统。

3.1.3  数据整合/标签计算

在用户画像系统中,主要使用Hive作为数据仓库,进行ETL处理,开发相应的用户属性表和用户行为表,以及标签的计算。

1、数据整合

各种渠道接进来的数据,存在孤立、空值、格式不对应、超过极限范围等数据质量问题,因此需要进行脏数据清洗、格式转换、用户识别与合并等整合工作:

(1)Clean/Transform

a.Clean:比如,某个用户的出生年月时间是未来的某个日期时刻,因此就需要把这类脏数据给过滤掉

b.Transform:比如,通过某个第三方应用API获取到的所有用户的地区信息是IPB标准编码形式,为了能和其他渠道的信息一起进行分析,就需要根据IPB标准编码转换成标准的省、市格式

(2)Id Mapping

a.各个渠道接进来的用户属性数据、行为事件数据等都是孤立的,为了能计算用户的全方位的综合标签,就需要做用户的识别合并,比如通过unionID,识别合并绑定在同一微信开放平台的公众号、小程序、网站的同一个用户的信息。

经过数据整合处理,数据会进入下面的数据模型中:

2、标签计算

在用户画像系统,会做一套批量离线的标签处理引擎,依赖的是底层比较稳定的数据结构。这个标签引擎一边读事件数据,一边读用户的属性数据,再配合上特定的标签规则,做一个批量计算,最后生成用户标签。

3.1.4  标签应用

标签的应用主要分为前端画像展示、通过API接入其他系统两大类应用方式,通过下面的「3.2 用户画像产品化功能模块」章节具体描述。

3.2  用户画像产品功能模块

3.2.1  系统看板

通常用户画像系统的数据看板,以可视化形式展示企业的核心用户数据资产情况或者重点关注的人群数据。旨在建立和统一使用者对企业数据资产或者核心人群数据的基础认知,主要分成以下几类:

1、用户量级及变化趋势:不同设备类型ID量级、不同类型用户量级(如注册与非注册用户、付费与非付费用户等);

2、标签资产:按主要类目统计标签个数等;

3、核心用户标签:展示固有或自定义人群的关键标签画像数据等;

3.2.2  标签管理

供业务人员进行标签的增、删、改、查等操作,包含:标签分类、新建标签、标签审核、标签上下架、标签覆盖人数监控等。

基于用户行为数据、用户属性数据,通过设置标签规则创建标签:

3.2.3  单用户画像

主要能力包含通过输入用户ID,来查看单用户画像的详情数据,如用户的属性信息、用户行为等数据。

3.2.4  用户分群和用户群画像

1、用户分群

用户分群功能主要是面向业务人员使用。产品经理、运营、客服等业务人员在应用标签时,可能不仅仅只查看某一个标签对应的人群情况,更多地可能需要组合多个标签来满足其在业务上对人群的定义。例如:组合“过去7天领取优惠券次数大于1次”、“活动活跃度等于高和极高”、“女性”用户这3个标签定义目标人群,查看该类人群覆盖的用户量。

2、用户群画像

和用户分群功能相似,用户群画像功能首先也需要组合标签圈定用户群体,不同之处在于用户群画像功能支持从多个维度去分析圈定用户群体的特征,而用户分群功能侧重的是将筛选出来的用户群推送到各业务系统中,提供服务支持。

3.2.5  BI分析

BI平台和这些数据打通后,可以丰富数据的维度,支持通过多种分析模型进行更加丰富和深层的分析及对比。

3.2.6   OpenAPI

OpenAPI能够保障画像系统数据与各系统之间打通,如push推送系统、营销系统、广告系统、推荐系统、BI等平台,并且保证各系统数据的实时更新,避免同源不同数的问题。

四、用户画像应用

前面提到过用户画像主要有:经营分析、精准营销、个性化推荐与服务3个方面的应用。具体又可以分为:

4.1  经营分析

用户画像系统的标签数据通过API进入分析系统后,可以丰富分析数据的维度,支持进行多种业务对象的经营分析。下面总结的是一些市场、运营、产品人员分析时会关注的指标:

4.1.1  流量分析

1、流量

以上就是本站关于 [从0到1掌握用户画像知识体系] 的详细介绍。

如果您还有什么疑问或需求,请【立即咨询】客服或添加 VX:19008205409 由我们的专业顾问免费为您解答。

此文章来源于网络,如有侵权,请联系删除

全国统一客服热线(7X24)

19008205409

邮 箱:2880605093@QQ.com

网 址:www.zq-mall.com

Q Q:2880605093

Copyright © 2021-2022鱼爪多媒网 版权所有 蜀ICP备16020933号-1

客服邮箱:2880605093@QQ.com 或致电:19008205409