推荐系统实战(三)

推荐系统的冷启动问题

推荐系统冷启动概念

  • ⽤户冷启动:如何为新⽤户做个性化推荐
  • 物品冷启动:如何将新物品推荐给⽤户(协同过滤)
  • 系统冷启动:⽤户冷启动+物品冷启动
  • 本质是推荐系统依赖历史数据,没有历史数据⽆法预测⽤户偏好

用户冷启动

  • 收集⽤户特征

    • ⽤户注册信息:性别、年龄、地域

    • 设备信息:定位、⼿机型号、app列表

    • 社交信息、推⼴素材、安装来源

  • 引导用户填写兴趣

  • 使用其它站点的行为数据, 例如腾讯视频&QQ音乐 今日头条&抖音

  • 新老用户推荐策略的差异

    • 新⽤户在冷启动阶段更倾向于热门排⾏榜,⽼⽤户会更加需要长尾推荐
    • Explore Exploit⼒度
    • 使⽤单独的特征和模型预估
  • 举例 性别与电视剧的关系

物品冷启动

  • 给物品打标签
  • 利用物品的内容信息,将新物品先投放给曾经喜欢过和它内容相似的其他物品的用户。

系统冷启动

  • 如果应用缺少用户行为数据,可以做基于内容的推荐
  • 随着用户行为越来越多,可以转到协同过滤
  • 基于内容的推荐和协同过滤的推荐结果都计算出来,加权求和得到最终的推荐结果

基于内容的推荐

  • 给物品打标签
    • 可以是系统提取(从业务数据库中提取)
    • 用户填写
  • 利用标签的文字转换成词向量
    • Word2Vec转换成词向量,表示语义
  • 利用词向量构建物品的向量
    • 一个物品有N个关键词,一个关键词对应一个词向量
    • 对这N个关键词加权求和取平均,得到物品向量
  • 通过物品向量计算相似度
    • 利用皮尔逊相关系数计算物品向量相似度
  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!

扫一扫,分享到微信

微信分享二维码
  • Copyrights © 2020-2021 chenk
  • 由 帅气的CK本尊 强力驱动
  • 访问人数: | 浏览次数:

请我喝杯咖啡吧~

支付宝
微信