仅只有未实名的,新媒易不收取任何费用,公益非盈利机构
24小时服务热线: 4000-162-302
请扫码咨询

新媒易动态

NEWS CENTER

依据用户历史的行为数据推荐他平常喜欢看的内容

2021-07-16

简而言之,依据用户历史的行为数据推荐他平常喜欢看的内容。

还是拿前面说过的:为喜剧电影偏好者推荐喜剧电影。所以我们可以制定量化规则。

如:我们统计了该用户过去的观影数据,其中观看【喜剧片】10次,【悬疑片】5次,【战争片】4次,【爱情片】1次,那么加起来合计观影次数=10+5+4+1=20次,其中按照比例计算分别占比:50%、25%、20%、5%。

那么我们通过现有的数据可以观察到,该用户的仅有数据中显示其对【喜剧片】和【悬疑片】较为有兴趣(这里我们定义从历史数据中取Top2,【喜剧】和【悬疑】符合我们自定规则),于是当用户下次开机时,我们有了在首页为用户推荐一定数量的【喜剧片】和【悬疑片】的依据。上述,大概是简单的用户偏好推荐算法。

协同过滤推荐

这里我就不献丑了。这种推荐算法比较经典,也是业界常用的推荐算法。比较典型的案例是:啤酒和尿布。超市人员发现购买啤酒的用户同时也购买了尿布。于是这个故事可以写成:买尿布的家庭中有婴儿,母亲照顾婴儿,父亲去超市买尿布同时也买啤酒。

明星偏好推荐

这里同上述第一项相似,就不再赘述了。主要目的有两个,一个是筛选出近期比较热的明星,推荐他的内容;另一部分是按照用户对明星的偏好,推荐用户偏好的明星的内容。

通过上述的推荐算法的规则的建立,结合已知的数据,我们似乎可以为单个用户做个性化推荐了。下图所示,但这里只是整个系统的一部分。


3)推荐结果的过滤和排序

完成了前面的内容后,理论上我们可以做出一个较为简单的推荐系统。但是在实际业务中还会牵涉到两项比较重要的工作需要完成:过滤和排序。

① 推荐结果的过滤

这里的过滤:主要是针对媒资库中剔除不符合业务规则的媒资的过程。而不符合业务规则需要依据实际的业务来确定,常见的不符合规则的类型有如下:

  1. 被加入黑名单的媒资内容:加入黑名单后将不再呈现在用户视野中,故而需要过滤掉。
  2. 媒资版权过期:媒资库中过滤掉版权过期的内容。
  3. 话题敏感的媒资内容:某些时间段或特殊事件引发的敏感内容“下架”。
  4. 排重过滤:这里的排重过滤也有多种形式,常见的是:推荐系统在最近的一段时间段为用户推荐过某电影,但是用户并没有播放,可能是用户对该项推荐不感兴趣。当推荐次数积累到一定程度时,系统将自动过滤该媒资。
  5. 其他:这里的过滤条件可能会有多种,主要源自于业务需求,故而不再一一列举。下面的流程图中是实际业务中需要进行过滤的选项。


② 推荐结果的排序

通过上述过滤,推荐结果的媒资集合已经被清理了一轮。但集合中剩余的内容并不是所有的媒资都需要呈现给用户。用户的视野是有限的,推荐位的数量也是有限的,所以我们应该从这个集合中再次筛选出比较“易产生兴趣”的内容,进而提升用户可能对推荐内容产生的兴趣。

排序的方式有多种,这里只列举了一部分并且是单一的排序方式。也可以通过算法规则进行综合排序等,这里只讨论单一排序。排序方式包括:

  1. 热度排序:媒资集合中所有的媒资按照热度来排序;
  2. 评分排序:按照评分大小来排序;
  3. 上线时间排序:按照上线的时间远近来排序;
  4. 其他。
相关推荐