智能推荐系统 对于智能推荐系统相信大家已经不
作者:admin 发布时间:2023-03-28 17:31:42 分类:妙招 浏览:102
对于智能推荐系统相信大家已经不再陌生了,现在它已经在内容分发平台、电商、广告、音视频等互联网产品中随处可见。
一、为什么越来越多产品需要做推荐系统?
主要有以下两方面的原因:
(1)信息过载
互联网上每天都在产生海量的信息,用户想要迅速和准确地找到他们感兴趣的内容或商品越来越困难。如果用户的目标明确,他可以使用搜索(其实搜索也是有关键字的推荐、推荐是无关键字的搜索),但很多时候我们的用户是没有明确目标的。这时候如果产品能够高效匹配用户感兴趣的内容或商品,就能提高用户体验和粘性,获取更多的商业利益。
(2)长尾效应
绝大多数用户的需求往往是关注主流内容和商品,而忽略相对冷门的大量“长尾”信息, 导致很多优秀的内容或商品没有机会被用户发现和关注。如果大量长尾信息无法获取到流量,信息生产者就会离开平台,影响平台生态的健康发展。
二、认识推荐系统
推荐系统定义:推荐系统是人与信息的连接器,用已有的连接去预测未来用户和物品之间会出现的连接。
推荐系统本质上处理的是信息,它的主要作用是在信息生产方和信息消费方之间搭建起桥梁,从而获取人的注意力。
世界是一个数字化的大网,从人类角度来看里面只有两类节点:人和其他。万事万物有相互连接的大趋势,比如:人和人倾向于有更多社会连接,于是有了各种社交产品;比如:人和商品有越来越多的消费连接,于是有了各种电商产品;比如:人和资讯有越来越多的阅读连接,于是有了信息流产品。
一个完整的推荐系统通常由以下部分组成:用户端前台展示、后台日志系统、推荐算法引擎。
个人绘制的推荐系统架构图
前台展示:就是你在app或网页上看到的推荐、猜你喜欢、你的个性化歌单、经常一起购买的商品等部分展示的内容。
后台日志系统:用户数据、用户行为数据、内容数据等日志数据采集、存储、清洗和分析,从而建立画像体系,包括用户画像和物品画像。
推荐算法引擎:各种算法模型、模型训练配置、推荐效果评估体系。
搭建推荐系统所需投入:
首先要搭建团队,其中算法工程师是必不可少的,当前也是薪酬较高的;其次还要购置存储和计算资源,如果不是云产品你可能还要自己购置硬件设备;然后还有长时间的数据积累和算法优化。
推荐系统是一个需要长期持续投入的东西,从投入/产出比和时间成本上来说,产品经理不要随便拍大腿就要做一个智能推荐系统。
如何判断一个产品是否需要推荐系统?
第一,看看产品的目的。如果一款产品的目的是建立越多连接越好,那么它最终需要一个推荐系统。
典型的目的不是建立连接的产品就是工具类产品,单纯为提高人类某些工作的效率而存在,比如:AXURE、ERP……虽然如今很多产品都从工具切入想做成社区,但至少在工具属性很强时不需要推荐系统。
第二,看看产品现有的连接。如果你的产品中物品很少,少到用人工就可以应付过来,用户产生的连接不多,这时候不适合搭建推荐系统。应该要有长尾效应才可能让推荐系统发挥效果。
三、推荐算法-协同过滤基本原理
推荐系统里最经典的算法非协同过滤莫属。协同过滤又称基于领域的算法,核心在于协同,互帮互助。其又可以分为两类:基于用户的协同过滤算法(UserCF)、基于物品的协同过滤算法(ItemCF)。
(1)基于用户的协同过滤算法(UserCF)
当一个用户需要个性化推荐时,可以先通过用户的相似度计算找到和他有相似兴趣的其他用户,然后把那些用户喜欢而他没有听说过的物品推荐给他,这种方法称为基于用户的协同过滤算法。
如用户A曾经看过《增长黑客》、《流量池》和《原则》,用户B曾经看过《增长黑客》和《原则》,当我们给B推荐时,推荐系统计算出A和B的相似度比较高,而A曾经读过的《流量池》用户B没有读过,因此就将《流量池》推荐给B用户,这就是经典的基于用户的协同过滤。
由上面的描述可知,基于用户的协同过滤算法主要包括两个步骤:
找到和目标用户兴趣相似的用户集合;
找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户。
(2)基于物品的协同过滤算法(ItemCF)
介绍基于物品的协同过滤之前,先来看下基于用户的协同过滤可能带来的问题。
用户数据量比较大时,需要计算的用户之间的相似度会比较多,计算量大。
构建用户向量时是使用用户对已消费过的物品的评分/行为来构建的,用户的兴趣是会随时间改变的,导致计算相似用户的频率较高。
数据比较稀疏,用户和用户之间有共同的消费行为实际上是比较少的,而且一般都是一些热门物品,对发现用户兴趣帮助也不大。
基于物品的协同过滤算法,给用户推荐那些和他们之前喜欢的物品相似的物品。
用户A、B和C分别喜欢的物品如图所示,则计算物品2与物品1的相似度的公式为:
物品2与物品1的相似度=同时喜欢物品1和物品2的用户数/喜欢物品1的用户数=2/3;
物品3与物品1的相似度=0;
物品4与物品1的相似度=1;
如果对一个喜欢了物品1的用户D进行推荐,则推荐的优先级为4>2>3。
基于物品的协同过滤算法主要包括的步骤:
计算物品之间的相似度;
根据物品的相似度和用户的历史行为给用户生成推荐列表。
以上只是协同过滤算法的基本原理,现实中的算法模型要远比这个复杂,而且很少采用单一模型,基本是组合模型。我也是刚刚才开始做推荐系统,至于更为复杂的矩阵分解、基于机器学习的推荐算法等后续我自己搞明白再单独成文分享给大家。
四、推荐系统的冷启动
推荐系统需要已有的连接去预测未来用户和物品之间会出现的连接。
对于BAT(百度腾讯阿里)、TMD(头条美团滴滴)这样的巨头他们已经积累了大量的用户数据,在某个产品上智能推荐的时候不存在冷启动的问题。
对于很多没有大量用户数据的产品来说,如何在这种情况下设计推荐系统并且让用户对推荐结果满意,从而愿意使用推荐系统,就是冷启动的问题。
冷启动问题主要分两大类:
(1)用户冷启动
用户冷启动主要解决如何给新用户或者不活跃用户做个性化推荐的问题。当新用户到来时,我们没有他的行为数据,所以也无法根据他的历史行为预测其兴趣,从而无法借此给他做个性化推荐。
(2)物品冷启动
物品冷启动主要解决如何将新的物品或展示次数较少的物品推荐给可能对它感兴趣的用户这一问题。
一般来说,可以参考如下方式来解决冷启动的问题:
利用用户注册时提供的年龄、性别等数据做粗粒度的个性化推荐;
利用用户的社交网络账号登录(需要用户授权),导入用户在社交网站上的好友信息,然后给用户推荐其好友喜欢的物品;
要求新注册用户在首次登录时选择一些兴趣标签,根据收集到的用户兴趣信息,给用户推荐同类的物品;
给新用户或不活跃用户推荐热门排行榜,然后等到用户数据收集到一定的时候,再切换为个性化推荐。
五、评估推荐系统的效果
推荐系统推荐质量的高低可以通过如下指标进行评估,作为推荐系统的反馈结果他们也是算法模型迭代优化的依据。这些指标有些可以定量计算,有些只能定性描述。
(1)预测准确度
准确度表现在用户对推荐内容的点击率,点击后的各种主动行为(购买、分享等),停留时长等。
(2)覆盖率
覆盖率是描述一个推荐系统对物品长尾的发掘能力。最简单的定义是,推荐系统推荐出来的物品占总物品的比例。
(3)多样性
良好的推荐系统不仅仅能够准确预测用户的喜好,而且能够扩展用户的视野,帮助用户发现那些他们可能会感兴趣,但不那么容易发现的东西。
比如:你在某个电商网站买了一双鞋子,然后你每次登录这个网站他都给你推荐鞋子,这种情况你就会对推荐系统很失望,这就是典型的不具备多样性。假如知道了用户的喜好,推荐系统大部分给他推荐感兴趣的,小部分去试探新的兴趣是更优的策略。
(4)新颖性
新颖的推荐是指给用户推荐那些他们以前没有听说过的物品。
(5)惊喜度
如果推荐结果和用户的历史兴趣不相似,但却让用户觉得满意,那么就可以说推荐结果的惊喜度很高。与新颖性的区别是推荐的新颖性仅仅取决于用户是否听说过这个推荐结果。
(6)信任度
如果你有两个朋友,一个人你很信任,一个人经常满嘴跑火车,那么如果你信任的朋友推荐你去某个地方旅游,你很有可能听从他的推荐,但如果是那位满嘴跑火车的朋友推荐你去同样的地方旅游,你很有可能不去。这两个人可以看做两个推荐系统,尽管他们的推荐结果相同,但用户却可能产生不同的反应,这就是因为用户对他们有不同的信任度。
(7)实时性
推荐系统的实时性,包括两方面:一是实时更新推荐列表满足用户新的行为变化;二是将新加入系统的物品推荐给用户。
(8)健壮性
任何能带来利益的算法系统都会被攻击,最典型的案例就是搜索引擎的作弊与反作弊斗争。健壮性衡量了推荐系统抗击作弊的能力。
相关推荐
- 万凤之王演员表 1、《万凰之王》是2011年香
- 李白登黄鹤楼的三首诗 李白黄鹤楼的诗有:《黄鹤楼送孟
- ill 简要回答ill是一个英语单词,
- 吴克烈 吴克烈的拼音怎么读吴克烈的拼音
- 新浪超新星 1、《超新星运动会第四季》是由
- 杨澜的婚姻 杨澜有两段婚史,现任老公是吴征
- exm 1、exm是打扰的意思。exm
- 倪安东资料 倪安东资料介绍:倪安东(Ant
- japanesemaincurrent 1、QCC空间是QQ空间物品C
- 李宁鞋码对照表 李宁鞋码对照表李宁的鞋子尺码几
- 张慧清简历 1、张慧清。2、女。3、曾任云
- 河北省导游考试网 1,全国导游证考试各省市考导游
- 椰子350 椰子350是阿迪达斯的运动鞋,
- 查询手机号码机主 随着通信时代的不断发展,要想联
- 小神童全自动洗衣机 1、插上小神童全自动洗衣机电源
- 清凉山公园 唐以前、还算可以的,长安历史文
- 洛克王国小甲壳虫 1、犄角甲虫。2、是洛克王国土
- 淘宝代付款 品牌型号:vivos9系统:O
- 嫡孙是什么意思 1、长子嫡孙所谓长子嫡孙,是嫡
- cobu3d 1、宝儿(BoA),1986年
- 狗不理包子 01狗不理包子铺原名“德聚号”
- 爱情三贱客 1、《爱情三贱客》是于2012
- 深圳交强险 我们买了车之后,就得买保险,不
- 海阔天空粤语歌词 1、歌词今天我寒夜里看雪飘过(
- 海豚式打腿 1、海豚式打腿是一种游泳姿势,
- 狮子狗落地秒 LOL中的狮子狗是一个很强力的
- 数码伴侣盒 数码伴侣盒其实就是一种专门使用
- 桃花源记道法加点 要了解桃花源记的加点,当然得先
- 猴年 猴年是根据中国传统历法来确定的
- 沭阳旅游 沭阳县十大旅游景点1.沭阳南湖
- 最新推荐
-
- 野心勃勃的意思 【野心勃勃】的意思,拼音,读音
- 梦幻诛仙青云门加点 梦幻诛仙青云门加点,相信很多小
- 卡天赋bug 卡天赋bug之前,最烦人的就是
- 颊 【颊】字的意思解释,拼音,组词
- 百无禁忌什么意思 【百无禁忌】的意思,拼音,读音
- 对方 【对方】的意思,拼音,读音
- profiled单词的意思,例句
- 自树一帜的意思,拼音
- 拾人牙慧什么意思 【拾人牙慧】的意思,拼音,读音
- 倦的组词 疲倦
- 酒席 【酒席】的意思,拼音,读音等)
- 步步生莲游戏 阴阳师谋士任务中怎么种莲花?玩
- 叠组词 重叠
- 雀圣1演员表 演员表角色演员备注十三飞元秋雀
- 火炬之光2修改器怎么用 火炬之光2修改器怎么用?《火炬
- 地牢围攻1攻略 地牢围攻1攻略及地牢围攻1攻略
- derivative单词的意思,例句
- 硬派 【硬派】的意思,拼音,读音等)
- 年年 【年年】的意思,拼音,读音
- supplying单词的意思,例句
- 繁弦急管的意思 【繁弦急管】的意思,拼音,读音
- 引诱 【引诱】的意思,拼音,读音
- 遗嘱的拼音 【遗嘱】的意思,拼音,读音等)
- 求道 【求道】的意思,拼音,读音等)
- 夏组词 “夏”组词,拼音,解释夏橘夏成
- brutally单词的意思,例句
- 生化危机5秘籍 生化危机5攻略秘籍及生化危机5
- 国手是什么意思 【国手】的意思,拼音,读音
- bitty单词的意思,例句
- 瓜田李下的意思,拼音
- 天下3职业介绍 天下3职业加点和天下3职业技能
- looting单词的意思,例句
- 缀的组词和拼音 【缀】字的意思解释,拼音,组词
- 慎的组词 “慎”组词,拼音,解释慎狱慎防
- 中国乒乓球运动员 中国乒乓球十大巨星中国乒乓球十
- 诡组词 【诡】字的意思解释,拼音,组词
- 极限的祭坛攻略 极限的祭坛攻略及地下城极限的祭
- 冷暖自知的意思 【冷暖自知】的意思,拼音,读音
- 跳水拼音 【跳水】的意思,拼音,读音等)
- 朱墨 【朱墨】的意思,拼音,读音等)
- 刀剑2公测 刀剑2什么时候公测?可能有部分
- 通天塔电影解析 2007年奥斯卡结束当夜,罗杰
- 楷怎么读 【楷】字的意思解释,拼音,组词
- 受罚 【受罚】的意思,拼音,读音
- 鬼镜1 (本文由火锅剧场原创:hott
- 瞎子摸象的意思,拼音
- 弦组词 “弦”组词,拼音,解释弦脉弦韦
- tighten单词的意思,例句
- 莫须有 【莫须有】的意思,拼音,读音等
- 无能 【无能】的意思,拼音,读音等)
- 凉帽 【凉帽】的意思,拼音,读音
- 隐姓埋名 【隐姓埋名】的意思,拼音,读音
- 清理平台 清理平台任务完成攻略清理平台任
- 四不像是什么 【四不像】的意思,拼音,读音等
- 驱魔师pk加点 驱魔师pk加点和法驱魔师加点,
- 猎刃好玩吗 猎刃好玩吗?猎刃怎么样?猎刃游
- 国统纲领 国统纲领全名为国家统一纲领,经
- 验的组词 “验”组词,拼音,解释验明正身
- 独组词 独立
- 外宽内深 【外宽内深】的意思,拼音,读音