最好走的路越走越难,最难走的路越走越容易

Follow guwendong on Web
  • Subscribe to Beyond Search via RSS
  • Follow @clickstone on SinaWeibo
  • Join Resys Google Group
  • Follow @clickstone on Douban
  • Follow @clickstone on Twitter

Tag Archives: amazon

Early Amazon: The first week

原文链接:http://glinden.blogspot.com/2006/01/early-amazon-first-week.html

原文作者 Greg Linden 毕业于华盛顿大学计算机学院,1997 年加入 Amazon,领导开发了享誉业界的 Amazon 推荐引擎。
著名的 Item-based 推荐算法的提出者之一;Findory.com 创始人。
其 Blog – Geeking with Greg 是个性化推荐领域最有影响力的博客(没有之一)。

1997 年初的亚马逊公司,邋遢、混沌、但令人兴奋。

亚马逊公司位于美国西雅图市,办公室在第二大道的哥伦比亚大厦里,这是一座砖体结构的建筑物,已经有些年头了,离派克市场不远。从办公室的窗户望出去感觉 还不错,有一个本地的美沙酮诊所,还有一个贩卖怪诞假发的商店。你甚至隐约可以看见一些脱衣舞俱乐部,它们就藏在几个街区远的地方。插播八卦:派克市场有一个著名的 Athenian 餐厅,传世经典爱情影片《西雅图夜未眠》中,汤大哥就是在这里泡梅甜心的。

当然了,我现在还只是一个眨巴着大眼睛的刚刚研究生毕业的菜鸟,还不敢奢望有这样一个靠窗的工位。

我的工位在厨房。在亚马逊公司,空间从来都是一种奢侈,那个时候自然也是这样。报到的那天,我被领到我的办公室——一张安装在厨房角落里的牌桌,上面放着一台 PC。

在厨房办公还是着实有些乐趣的。在亚马逊,我几乎什么人都不认识,大多数同事都沉浸在无聊的窃窃私语之中。不过,他们倒经常会到离我不远的柜台上去取茶和咖啡。我弄了一个糖果瓶——嗯,免费的——尽力和他们搞关系,以求套出些什么来。

我的第一项任务是开始学习代码库。打开一个 shell 窗口,调出 emacs,然后开始阅读代码。我花了一些天来跟踪针对不同 URL 的分发器,研究 ol’ obidos ——一个用来支持 Amazon 网站运转的大型 CGI 程序——是怎样漂亮地处理不同的请求,主页,书籍详情页,搜索,购物车,以及订单流转。至今,大多数亚马逊 URL 里面还包含着“/exec/obidos”。插播八卦:不用为不知道 Obidos 为何物而犯囧,哥只是个传说。这里是正解


这个系列其实我就想动手翻译了,一直拖着到现在才终于开工。与此类似的,还有一个 Doug Edwards 和 Ron Garret 撰写的 Early Google 系列,不过不知道什么时候已经被删掉了,Google fans 们有兴趣的话可以刨刨看。

 

推荐系统:Amazon、Pandora 和 Del.icio.us

Alex Iskold 在 RWW 上发表了一篇文章,“The Art, Science and Business of Recommendation Engines”,这是一篇非常不错的关于“Recommender Systems”的文章,推荐大家一定阅读一下。由于Google,现在大家关注的热点是“Search”,但互联网不仅仅只是 Search,应该有更多,我们也需要更多。当我们知道自己要什么的时候,我们要做的是“Search”,比如我喜欢易中天的《品三国》,我可以 google 一下,看看它会给我些什么不一样的东西。这个时候,我的目的很明确,Search 围绕我的目的,可以作很多。但更多的时候,我其实并不是明确地知道自己想要什么,我只是无聊,我不知道应该 Search 什么,我就是想随便“翻翻”。这个“翻翻”就是 Alex 文章里面说到的 “Browse”。Alex 提到了很重要的一点,在 “Browse” 的状态下,用户“需要一些建议”(open to suggestions)。这正是需要 Recommender Systems 发挥作用的时候!

Alex 总结了 3 种推荐模式,它完全是从应用的角度划分的,但基本是可以和我之前提到的学术界的 3 种划分相对应的。

  1. 个人化推荐(personalized recommendation)—— 基于个人以前的行为模式进行推荐。
  2. 社会化推荐(social recommendation)—— 基于和你相似用户以前的行为模式进行推荐。
  3. 项推荐(item recommendation)—— 基于项本身进行推荐。

当然还有这 3 种混合模式的推荐。而且通常下,一个好的推荐系统,必然也是多种推荐方法相混合。觉得推荐模式的是数据!我们不讨论 Alex 的划分。他分析了 3 个非常成功的案例:Amazon、Pandora和 Del.icio.us。

Amazon 是当之无愧的“推荐之王(King of recommendation)”,无论是从推荐的实际效果还是从对推荐的重视程度上来看,都很难再找出一个能和 Amazon 比肩的应用。“据说(rumored)” Amazon 30% 的销售是依靠推荐带来的!Amazon 自然是根据需要选择了不同的推荐方法,Alex 的分析基本正确。

Pandora 为推荐系统打开了一个新思路,Alex 形象地称之为基于“基因”的推荐。据说,Pandora 大概花了四年的时间来准备它的音乐库,分析每一首歌曲的音乐特质,提取它的基因。冷开始问题,是所有推荐系统新上线时的最大问题,Pandora 通过耐心的积累和专业的工作,换来了上线后用户对其推荐准确性和低廉进入成本的如潮好评!“绑架?我们不专业啊!”,石头里这句经典的台词,其实在玩笑间说出了一个实实在在的道理——要成就一件事情,需要专业,包括态度的专业和技术的专业。但我个人认为,如果 Pandora 仅是停留在目前这种状况,还是无法建立不可逾越的壁垒的。它需要进一步在自己和用户之间建立一种有效的反馈回路,从而不断调整自己的推荐系统。Amazon 具备这种天然的反馈回路——它可以跟踪用户对推荐产品的实际购买情况。这完全不影响用户体验,在不知不觉间就可以完成。而 Pandora 不具备此天然回路,因为听音乐通常是一种背景活动,比如我,我会边写程序边听音乐,绝大部分它推荐给我的歌曲,我都会听,很少快进或者跳过,从而使 Pandora 丧失了获取反馈的机会。以 Pandora 现有的数据基础,如果可以很好的解决这个问题,那么 Pandora 之外的音乐推荐网站就都可以干别的去了。

有没有可能把 Pandora 这种基于“基因”的推荐方法拓展开来呢?Alex 说可以使用“tag”。但我个人持保留态度。Del.icio.us 是 tag 应用的开创者,它确实为我们管理和组织信息带来了一种新的行之有效的方法。但以此为基础进行推荐可行吗?应该慎重对待此问题。tag 的使用太过于随意,因人而异差别很大,基于这种随意打上的 tag 进行推荐,风险太大。推荐系统里有句名言,“不准确的推荐,还不如不推荐”!我曾经贴过一篇关于 tag 的文章,“Manual vs. automated tagging”,也推荐大家看一看。总之,一套精心设计的、能够引导用户正确标注的 tag 系统,是围绕 tag 展开推荐的基础。

Greg 对 Alex 的文章进行了回应,“The value of recommendation engines”,同样值得一看。

 

ResysChina 发起人
1. 持续关注 个性化推荐 技术;
2. 持续关注 Semantic Web 技术;
3. 评论与上两项相关的互联网业务与产品;

我相信技术的力量!
wendell.gu@GMail.com

Archives