推荐算法实战-1-简介
本文是推荐算法实战系列第一篇文章。
1、推荐系统架构
召回
召回主要是从一大堆的物料中,排除与用户不相关的,留下可能符合用户品味的。
主要考虑相关性和多样性。
召回模型由于候选集规模巨大,通常采用“离线计算,在线缓存(查询)”的模式。而且,不能出现用户信息和物料信息的交叉。限制了模型的表达能力和精度。
召回模型最常见的是双塔模型,在线时用相似向量查找(给定用户向量,查找topK的物品向量),因而需要用到向量数据库。
通常采用多路召回弥补精度的不足,以及多样性要求。
精排是优中选优,召回不是小号精排,拿精排的思路做召回很容易翻车。
粗排
介于召回和精排之间。小型推荐系统可有可无。
精排
推荐系统的重头戏。
重排
精排时,相似内容会打上相近的分数。
重排不是过滤筛选,...
共计 17 篇文章,3 页。