新媒易动态
NEWS CENTER
NEWS CENTER
2021-06-22
我们来了解推荐系统框架的数据流。
为什么要了解数据流?
对于一款非常复杂的产品,比如像推荐系统这块由多个模块组成的产品,只有了解了其数据流,才能知道这个系统是如何运作的。
对于产品经理自身而言,只有了解了整体数据流,才能增强自己对复杂产品设计的把控能力。
要了解推荐系统的数据流,首先需要知道,对于一个推荐系统,主要的数据模块。可以将其抽象成3个模块:用户数据、物料数据、用户行为。
对于一个推荐系统,它的目标是什么?通过两个case来了解。
1)Case 1:资讯场景
比如资讯场景业务目标是点击率。点击率的计算逻辑 = click / show。
那为了提升点击率,我们需要哪些数据实现目标?
聚焦到用户行为数据,如何定义哪些是正样本、哪些是负样本。
需要注意的是,在行为数据定义时候(样本定义时候),经常出现的几个show虚报的问题:
2)Case 2:小视频场景
比如小视频场景,建模目标是完播率,即视频的播放时长/视频的总时长。
将推荐系统实现业务目标拆分成两条数据流来理解,在线数据流和离线数据流。
1)在线数据流