2009年8月3日,我和 xlvector 一起建立了 Resys Group。
Netflix Prize 给我们的启示是,没有一个单一的模型可以准确的反应出所有用户的行为。设计推荐系统需要组合不同的算法,发挥出群体的智能。这也是建立 Resys 讨论组的初衷,群体的行为需要群体的智能去预测。
Resys,取自 Recommender System 的简写。建立之初,我们的想法是这里的讨论要专注在推荐系统领域,因此采用了朋友邀请朋友的加入方式。但出乎我们的意料,Resys 的发展还蛮快的,大家的讨论也非常热烈,并且在8月22日,成功地举办了第一次线下聚会。
目前,这里已经聚集了国内对 Recommender System 最感兴趣的一拨人。
豆瓣算法负责人胖子
1. 推荐系统目前最大的问题不是技术,而是没有合适的产品形态。搜索这种产品形态存在很久了,互联网之前就有,并且大家广泛接受,因此要作的是寻找更好的技术和合适的商业模式。推荐面临的问题是没有大家认可的产品形态,只能依附在别的产品上,并且由于这个产品本身不是为推荐设计的,80%的功能不是靠推荐来解决,推荐做得再好,也只是优化剩下的20%
2. 关于小众与大众,我的看法与上面的几位同学有点差异。用长尾理论的话来说,大众是头,小众是尾,只是我认为与长尾理论这本书说的不同,在可预见的未来,这个头不会变平,会更尖,热的会更热。长尾很难从短头抢生意,只是头变高了,总有东西会滚下来,长尾也会变高。基本上,介入一个领域后,想作大事情,最先满足的一定是大众的需求。大众需求的特质就是磨平个性,小众是强调个性,这就像麦当劳和精品私房菜、成衣和裁缝的关系。
3. 目前我们所讨论的基于算法的”推荐”,满足的是小众的需求。这不是故意这样设计的,而是迫不得已,因为大众化的需求有其他更便捷、成本更低廉的方式获取,用推荐来作这个,得不偿失。在获取信息的相关领域,搜索引擎满足的是大众的需求,并且性价比最高的满足了这个需求,推荐要挤进这个领域,目前只能去作长尾。
4. 不过这并不是说推荐没得做,yahoo在做头的时候,google也在长尾里。如果推荐能够找到一种合适的形式,以更高的性价比满足大众化的信息获取的需求--一定是大众化的,就可以反客为主。即便挤不进短头里,在长尾也不是一定没有前途。
5. 我个人倾向于推荐无法单独作为一个产品出现,但与搜索不同,推荐的应用领域不局限于互联网,并且,未来推荐很有可能作为一项基础技术的面目出现在各种应用场合,类似模式识别技术、虚拟现实技术、触感技术等等。
当当网搜索/推荐技术负责人王洪涛
从产品角度,个性化推荐已经渗透到当当购物流程的各个环节:购物前、购物中、购物后。
1、商品信息页面
买了****也买了****,看了****也看了****——基于一定时间段内的订单和访问日志数据推荐购买组合——基于同一张订单的数据
2、购物车、收藏夹
会根据用户当前选中的商品进行实时计算、推荐商品
3、email邮件
我们会在订单确认信等回馈信件中附带根据本次包裹商品计算出来的商品推荐但为了避免用户取消订单去选择别的商品,我们是在用户收到商品之后再推荐的
4、独立的个性化页面
集合所有数据源的推荐大全,但目前该产品数据表现不好,我们准备跟购物流程更深度结合。
我们也有对人的推荐,即挖掘潜在与之兴趣相投的人群,便于follow其最近的购物行为,扩展推荐。从技术算法角度,我们主要用到基于内容的(当当商品搜索也是我们team在负责)、协同过滤、关联规则等方法。在实际开发中,我们也遇到了cold start的问题,特别是我们希望促进百货类商品的销售(而百货又是弱势品类), 我们会基于商品的一些类别等属性进行推荐,这时的粒度不是基于product而是基于class。
我们的经验表明,个性化推荐技术是电子商务网站(特别是大型电子商务)的重要手段(当然地位还不能跟搜索比) 。
粗略估算,对销售贡献10%~15%是没有任何问题的;
这里面最重要的几个应用:
1、商品信息页面上的买了***也买了
2、商品信息页面上的打包购买推荐
3、购物车推荐
Netflix Prize 冠军团队 The Ensemble 成员 xlvector
2009年8月,我个人推荐的精彩内容:
其他资源:
- Resys @ CiteULike
- Resys @ Tweepml
- Netflix Prize by xlvector
- Understanding RBM by WangYuanTao
- From Search To Discover by Wanght
感谢每一位 Group 成员的精彩发言!
欢迎对推荐系统感兴趣的朋友加入 Resys Group。








who have CoFE ,engine help me get it