编辑|李同学
制作社区|
01
痛点及标签建设解决方案
我们先思考一个问题:企业发展到什么阶段需要构建标签体系?
1、业务发展到什么阶段需要建立标签体系?
不同规模、不同业务阶段的企业对数据系统的需求不同。并非所有企业都需要建立标签体系。
在业务的起步阶段和初期成长期,广泛的投入也能带来更好的增长和转化,业务的需求往往是有形的。
在成长到成熟阶段,随着流量红利消失、增长乏力,运营商开始探索精细化运营以提高ROI,考虑在正确的时间向正确的人推荐正确的内容,从而改善用户体验并带动转化。数据建设不仅需要满足自助数据采集和分析的需求,还需要逐步建立一些用户标签表,以满足初期精细化运营的需求。
并且随着各业务开始进行精细化运营,标签体系的建设将会逐步完善,数据团队也会搭建标签平台,提高标签接入效率和标签质量。
在制作标签的过程中您会遇到哪些问题?解决办法是什么?
2.标签制作过程中的问题及解决方案
在标签体系建设的不同阶段,会遇到一系列问题:
起步阶段:数据质量与数据应用的矛盾
在标注初期,数据开发同学主要注重快速支撑操作性标注需求,缺乏标签数据构建规范、应用规范等设计。运营商在应用标签时,存在标签含义和逻辑不明确、标签覆盖率低、部分算法标签准确率不高等问题。导致运营商不敢使用,或者花更多时间咨询,费时费力。
成长期:标签权限控制与灵活便捷的矛盾
随着各业务线对标签需求的提升,标签用户越来越多,标签应用出口数量也随之增加。对于业务人员来说,标签就是业务资产。在运营过程中,需要控制到达用户的频率和方式。与业务用户的过多或不当接触会损害用户体验,给业务线带来损失。例如,58车的业务希望增加流量并交叉招募用户进行营销活动,例如通过圈选招募7天活跃用户,每天持续到达车的着陆页;这必然会引起招聘业务运营的反对,车业务每天都会联系车的登陆页面。招募用户会影响用户体验。
因此,需要划分不同业务标签的归属,并审批标签权限。但增加权限审批又会带来新的问题。添加审批后,每次操作中要使用标签,都得找业务负责人审批。有时需要进行群组通讯来申请权限。大大提高了标签使用的效率和便利性。减少。
成熟阶段:标签价值与成本的矛盾
数据平台上的标签越来越多。已经开发上线了数千个标签,占用了较多的服务器存储和计算资源,但平台上实际使用的标签只有几百个。如何合理评价标签的价值?如何提高高价值标签的使用率,剔除低价值标签?
因此,标签建设需要构建结构化、场景化、系统化的解决方案。
3、标签体系建设方案
58大数据平台支持房屋租赁、新房、招聘、新车、送货上门等十几个业务线的数据。数据覆盖58 APP、安居客APP、小程序等多个终端。业务线较多,对接流程复杂。因此,58在打造标签体系时采用了组织协作+平台建设+运营的方式。
在组织协作层,大数据团队主要负责对接各业务线需求、开发通用标签、构建标签平台能力等;业务数据团队负责自助获取业务标签;运营团队负责提出需求并审批标签权限。
平台建设层主要构建标签管理与分析平台,包括ID建模、标签建模、数据仓库规范、元数据管理、权限管理、标签评估、标签推荐等能力。
在运营层面,大数据团队目前正在梳理各业务线的标签应用状况,形成一套细化的运营应用案例,供各业务线参考学习。
这里需要注意的是,在不同阶段,构建大数据标签体系的侧重点是不同的。
在起步阶段和成长期,主要目标是提高效率。需要不断提高标签质量,保证标签的可用性;构建合理的标签权限控制和标签推荐能力,提高标签的易用性。
成熟阶段主要目标是保证标签应用价值的增长,同时进行成本控制,管理标签的全生命周期,评估标签价值,及时剔除无用标签,释放服务器存储和计算资源。
4. 标签构建架构
在数据采集层,对内嵌数据、表格数据、业务系统日志数据以及个人推送数据等第三方数据的访问,跨多个终端、多个业务线,打破数据孤岛。
在数据存储和计算层,我们构建数据仓库建模、用户/客户/企业ID系统建模、标签系统建模规范,并支持数据的离线和实时同步。
在标签平台层,构建标签全生命周期管理,包括标签接入生产、标签挖掘、元数据管理、标签下线、权限审批;以及标签评估和分析能力,包括标签打分、标签推荐等能力。
这里需要注意的是:
02
标签系统
1、标签建设痛点及解决方案
随着标签数据的建立越来越多,运营商在使用时会遇到以下问题:
标签分类不明确,找不到对应的标签。比如,房地产、招聘等十几个业务线的标签混在一起,用户和客户公司的标签也混在一起,很难找到。
在构建标签时,我们依靠我们的感觉。很多标签没有实际的使用场景,上线后也没有人会使用。例如,在创建“房地产-浏览商圈数”这个标签时,产品方原本以为在做细节操作时,可以选择浏览商圈较多的用户群体进行触达并转化。但后来发现,在实际操作中,无法实现如此详细的场景,而且自推出以来,还没有人使用过此类标签。
58的标签体系采用结构化、场景化的方式构建,保证了标签构建的可扩展性、业务易用性和应用价值。
2. 标签结构
标签的结构化构建分为用户、客户、企业、帖子等实体对象。如果是电商业务,往往分为买家、卖家、产品;对于外卖业务来说,往往分为用户、商家、骑手等。
按照业务划分,可以分为1+N模式,即通用中间平台+N个业务,如通用、房产、招聘、汽车、本地服务等。将用户的基本信息类别分为通用性,如性别、年龄、访问服务的预测倾向等,打通各业务的数据源,提高标签的覆盖率和准确性;将业务线特定数据汇总到每项业务中,如新房活跃用户、招聘活跃用户、二手车接驳用户等,方便业务经营者使用,也便于后续权限控制。
按标签类型,以用户标签为例,可分为基本信息、行为偏好、个性化标签。基本信息标签用于描述用户的基本属性,包括身体属性、社交属性、地理位置、设备信息等,如居住城市、设备型号、学历等。
行为偏好标签通过洞察用户近期的各种行为,如访问、收藏、打电话、即时通讯、支付等,进一步细化用户需求,包括主动行为、连接偏好、付费交易、用户分层等几大类,比如用户的访问活跃度、用户的购房意向、价格偏好等。
在对行为标签进行分类时,一个常见的问题是业务方将用户行为路径上隐藏的行为数据穷举出来,做成标签,比如浏览数、浏览过的房子数、收藏数、收藏数等。即时消息和电话数量。等等,业务建设的出发点是好的,但是当业务实际使用时,就会遇到不知道如何组合、不知道使用哪个标签的问题。
因此,在构建好标签结构并保证标签结构的可扩展性和分类清晰之后,在开发具体标签时,需要结合业务使用场景,进行场景化构建。
3.场景化标注
基于场景的标签构建主要是指从标签的实际使用场景出发,拆分相关的操作模型,从操作策略上逆推,确定需要构建哪些标签数据。
日常运营中常用的业务分析模型有OSM模型、模型、用户行为路径、用户分层、RFM模型等。
OSM 模型:目标、策略和指标。例如,在促进支付的目标下,运营商可以通过制定向潜在用户发送优惠券的方式来增加付费用户数量。
:获客、激活、留存、付费、推荐。不同阶段对应不同的运营策略。对于成熟阶段的企业来说,各业务的运营重点更注重留存。
用户行为路径:是常用的用户分析方法。在整理埋点和指标系统时,经常会用到数据产品。当然,这种方法也可以用于标签系统的梳理。但需要注意的一点是,在统计用户访问APP、访问详情页、点击详情页、IM/电话点击、购买操作行为数据时,需要结合运营目标(O)和策略( S)并发展为标签(M)。
用户分层:很大程度上是用户行为路径的组合,分为潜在用户、活跃用户、连接用户、付费用户。
RFM模型:这是交易业务中常用的客户模型。它利用近期消费时间、消费频率、消费金额三个指标,将重要价值客户、一般价值客户、重要发展客户、一般发展客户、重要保留客户、一般客户分为8类群体:保留客户、重要客户客户保留,以及一般客户保留。我这里就不展开了。详细内容请查看草帽小子之前写的文章。
在标签体系构建过程中,OSM模型是基础,贯穿于标签构建的各个阶段。是一个比较通用的模型,用户行为路径分析,用户分层模型; RFM模型常用于特定的业务模型。
这些商业模式如何应用?我们先看一个例子。
4.场景标签设计案例
业务背景:无忧租房是针对个人房东群体推出的VIP会员服务。租赁经营者希望鼓励个人房东购买无忧租赁套餐,增加付费客户数量。
总体目标是增加付费客户数量,并将其分解为吸引新客户、促进转移、保留/复购等子目标。
在吸引新客户阶段,需要扩大曝光并完善服务和运营策略,在租赁首页活动空间/主页上添加浮窗资源空间,添加个性化租赁首页活动空间,展示无忧租赁活动针对“有租房需求的个人房东”。曝光更多房东;同时,向“房产已挂牌1、3、7、14天但尚未成功出租的个人房东”发送推送/短信。
产品服务策略:增加业主推荐租客页面,提供“本次看房用户特征的意向度高的租客、价格偏好、户型偏好”等信息,推出个人用户画像服务,包括个人意向价格、意向公寓类型、7 日常活动、连接数量、租赁目的等数据可帮助房东全面了解租户。
在转化推广阶段,梳理无忧租赁页面的转化路径,包括曝光、服务浏览、提交订单、购买等;
在留存阶段,需要鼓励客户升级套餐,向购买基础套餐的用户群体推送高级套餐介绍/优势;应鼓励客户续费和复购,并在服务期间提高认知度。该机制应推动“新推荐租户”。提高业主无忧租赁服务意识;敦促服务即将到期的客户续订;服务过期的客户将被召回。
整体策略构建和标签构建以OSM模型为框架,划分模型中新增获客、推广、留存场景,并结合用户行为路径分析方法,进一步获取用户、客户、属性标签需要构建的。
结构式设计标签逻辑结构清晰,扩展性强,但容易与业务脱节,不契合实际业务使用场景。场景设计标签贴合业务使用场景,使用率较高,但比较碎片化,容易混乱。 ,所以需要采用“结构化+场景化”的设计方法。
5.58 标签系统
58标签系统按照结构化、场景化建设原则,针对房产、招聘、汽车等各类业务构建用户标签、客户标签、企业标签系统,构建性别、职业、居住城市、浏览行为、价格偏好等数千个标签。
从标签结构也可以看出,不同实体对象的标签数量是不同的。例如,企业标签的应用场景较少,所需建设的数量也相对较少。一般构建的用户标签比较多,匹配的用户运营团队成员也比较多。还有很多相应的运营活动。
梳理完使用哪些标签后,接下来的建设重点就是标签开发。
6. 标签开发类型
标签开发类型一般是开发者重点关注的数据产品和模块。标签按照统计方法分类,可分为事实标签、规则标签和算法标签;根据更新频率,可分为离线标签和实时标签;按数据类型可分为数值、字符串、字符串数组等;按照维度分类,可以分为单维标签和多维标签。
事实标签是用户画像最基本、最常见的标签。它们通常基于原始数据的清理进行分类,并用于描述客观事实。例如姓名、会员级别、终端类型、购买次数、购买金额等。
规则标签,顾名思义,是根据一定的规则生成的。与事实标签不同,规则标签具有更多的业务属性,其业务规则需要与业务人员共同制定。例如,“活跃用户”标签可以定义为“过去30天内发生x次行为a”和“过去30天内发生x次行为b”进行综合评价。
算法标签无法根据现有事实和规则推导出来,导致标签覆盖率低,商业价值大幅降低。这时就需要利用决策算法进行数据挖掘和训练,得到标签预测结果。
7. 性别标签
比如性别标签需要使用58底层的多个数据源,优先考虑身份认证数据,然后再取一些用户填写的数据。
当没有上述强认证数据时,识别出有APP列表的用户,并根据相关特征通过LR算法进行分类预测。选择用户5年内最新安装的APP列表、性能次要偏好、手机型号、操作系统等特征进行模型训练。预测准确率达到86.94%,性别标签覆盖率从20%提高到74%。
但随着个人防护法的颁布,获取APP名单的数据逐渐下降。为了进一步提高标签覆盖率,对于无法获取APP列表的用户的性别预测,根据用户访问行为,90天查看帖子数>=5,采用LR算法进行预测,特征使用用户的帖子内容、帖子标题、帖子一级表现等级、帖子二级表现等级。使用post数据预测准确率为73.7%,标签覆盖率提高5%。
03
标签管理平台
1、标签建设痛点及解决方案
制定标签规范和标签构建流程后,通过维护在线文档来指导构建。但存在标签质量无法验证、标签权限申请麻烦、标签线上线下管理混乱等问题。构建标签管理和分析平台,提高标签的可用性、易用性和价值。
2.标签生命周期管理
构建标签全生命周期管理与分析,以及标签权限管控能力。核心问题包括标签数据质量、标签应用质量和标签安全。
做好标签的添加、查看、使用、评估、下载,即标签访问、标签查看、标签使用、标签评估、标签下线的全生命周期管理。构建标签生产、元数据管理、标签市场、安全管理四类能力,开展标签数据质量和标签应用价值两类评估。
3. 标签评估
标签数据质量评估包括标签准确性、标签覆盖率和元数据完整性。应用价值评估主要从标签使用情况、关注度、标签应用效果三个方面进行评估。
例如,标签应用价值总分=权重*标签使用得分+权重*标签关注度得分+权重*标签应用效果得分。
1. 标签使用
标签使用情况用于表示标签使用在什么地方,通常在标签应用模块中,如人群选择、人群分析、接口调用等。
标签使用得分=权重*标签分析次数得分+权重*人群选择次数得分+权重*接口调用次数得分
分析次数得分=单个标签日平均分析次数/(所有标签每日最大分析次数/100分)