最好走的路越走越难,最难走的路越走越容易

Follow guwendong on Web
  • Subscribe to Beyond Search via RSS
  • Follow @clickstone on SinaWeibo
  • Join Resys Google Group
  • Follow @clickstone on Douban
  • Follow @clickstone on Twitter

Category Archives: 三言两语

Google Matrix

Google 退出中国事件发生之后,来自木遥同学的一篇文字,让我不能同意更多!其中有这么一段,

这个「国家(指 Google)」是网络世界中的第一个霸权,它可以控制数据和知识的流通,影响人类的所见所闻乃至精神世界的每个方面;它握有大量个人隐私信息,并且具有无可撼动的垄断地位;它在许多场合起到的已经是近乎可以类比于公权力的作用。而另一方面,它只是一家私有公司,没有任何方式可以从外部对它合法的控制力进行监督和制约。它当然也许确实会始终尽量不干预搜索排名,小心翼翼地维护互联网的自由和公正,但这只是它自己的道义承诺而已,而我们甚至想不出什么办法来验证这一点。

木遥的整篇文字非常中肯,但若单独摘引这一段,则是典型的“断章取义”。同一段文字,放在木遥的全文里看与单独看此段,差不多会造成两种理解,作语义的同学想必对此有深刻体会,这就是 Context(上下文)的作用。

在 Personalization 方面,亦是如此 —— Context 非常重要!

春节前,kuberResys Group 里发起了一个讨论,“基于SNS/Lifestream的推荐”,提到了 Google 近期的一些动作。其实长久以来,在个性化领域,Google 一直在下一盘很大的棋!看看他的布局吧。

  1. Personalized new tab page
    这个是2009年1月 Google Toolbar 推出的一个 feature,当你打开 Firefox 时,不再只是看到一个空白 tab 页,Google 会根据你的浏览历史,为你定制一个个性化 tab,包含你最常用的一些站点或页面。这个已经是新一代浏览器的标配了。

  2. Interested-based Ads
    传统的 Adsense 广告,是根据与网页内容的相关度进行展示的,与浏览者本身的兴趣无关。2009年3月 Google 推出了这种基于用户兴趣的广告,浏览者看到的不再仅是与内容相关的广告,而是与其本身兴趣相符的广告。至于用户兴趣哪里来的?抛开搜索记录不说,遍布互联网的 Analytics 和 Adsense 脚本本身,就能干不少事情了。

  3. Personalized keyword-suggestions
    尽管这个搜索提示功能没少给谷歌找麻烦,但 Google 显然认为这个东东对用户是有益的,尤其是对登录之后的搜索用户。当用户登录了 Google 帐号,并启用了 Web History 功能之后,搜索提示会把你最近频繁使用的几个关键字显示给你,这对搜索到一半被打断回头又想继续的用户来说体验很好。当然了,谷歌用户自然是无缘使用的。

  4. Google Reader by Personalized Ranking
    个性化的信息阅读,是用户长久以来的心声,久觅未果不少人甚至已经开始自己动手实现。2009年10月,Google Reader 对在这方面的官方支持终于千呼万唤始出来。最吸引眼球的是新增的“Sort by magic”排序功能,它综合考虑用户的阅读历史,包括 Trends、Start、Share 以及 Like 等,将待阅读的内容进行个性化地排序。这对动辄 1000+ 未读条目的用户来讲,绝对是个福音,就我个人的使用体验来看,效果相当不错。

  5. Google News Personalization
    2009年10月,Google CEO Eric Schmidt 在接受采访的时候说,“想像这样一个媒体:它知道你是谁,知道你喜欢什么,知道你看过哪些新闻,它能够评价你是否喜欢正在阅读的文章,还能够专门挑出你感兴趣的广告…”——科技是多么的伟大!但也有用户说了,“靠!这简直是阿鼻地狱啊,还是麻溜地不要再用 Google 服务了”,杯具啊!

  6. Personalized Search
    Google CEO Eric Schmidt 和美女总裁都说了,“搜索的未来要靠个性化”!目前,基于关键字的搜索,无疑已经成为帮助用户从信息海洋中寻找内容的重要手段,但互联网暴长的数据容量其实让 Google 也很头大。搜索引擎通过长期分析用户的搜索行为,可以感知用户的意图,从而在特定范围内完成搜索,有效地提高搜索效率,增强用户粘性。有关 Google 个性化搜索更详尽的资料,可以参考这里,另外 Resys 里也有过一次热烈的讨论

  7. Personalized Gmail Ads
    从 Gmail 诞生的第一天,它就是贴着小广告的。这个事情之前差点犯了众怒,后来 Google 保证仅展示“Family-Safe”的广告,并许诺说,“Ads and links to related pages only appear alongside the message that they are targeted to, and are only shown when the Google Mail user, whether sender or recipient, is viewing that particular message.”。现在,Google 在标红的“only”前面加入了一个“not”。隐私问题与个性化服务的矛盾由来已久,这个事情我认为解决方案和 Google 退出中国的诉求是一致的,只要有法可依即可。关于 Gmail 里的广告,这里有一枚杯具,欢迎围观。

  8. Google Buzz
    Buzz 在这事儿上毫不含糊,直接就说了,“Buzz recommends interesting posts and weeds out ones you’re likely to skip.”。为了验证 Google 的这个说法,我正在戒推进行中,全力使用 Buzz,看它能不能给我带来什么惊喜。就目前的体验来讲,我基本上是可耻的失败鸟。

  9. Google Friend Connect
    Boss 总是最后出场!但人生就像一个茶几,你永远不知道下一个被放上来的是哪枚杯具。Facebook 新近发布的 Open Graph,有很大机会把擅长把别人搞成杯具的 Google 搞成彻头彻尾的杯具帝,让我们拭目以待吧!


图片来源

 

长尾效应,有没有,有没有?

长尾理论 [1],是由《Wired》杂志的主编 Chris Anderson 在 2004 年提出的。此外,他还编撰了同主题的一本书《长尾理论》,来详细阐述这个概念及其带来的深远影响。尽管 Anderson 在致力于颠覆人们对畅销产品的认知,但无疑他自己已经从畅销产品上大赚了一票——《长尾理论》这本书一经出版即大卖。

以 iTunes 服务为例,长尾理论认为,对于这样的纯数字服务来说,由于不再需要货架,也没有制造成本和分销费用,卖出一件非流行品与卖出一件流行品之间没有任何区别,它们的边际利润都是一样的。于是乎,流行不再是利润的唯一代名词了。通过尽可能地扩充产品种类,尽可能地降低产品价格,并充分发挥个性化推荐技术的效能,可以把顾客的需求朝长尾的方向引导,通过大量的之前无人问津的产品产生销售,累积起来就可以获得一个甚至比原有流行市场容量还要大的利基市场。

我是长尾理论的坚定拥护者。


但人生就是一个又一个的轮回。在长尾理论风光了五年之后,重量级的质疑终于还是来了。
沃顿商学院的信息学教授 Serguei Netessine 与他的博士研究生 Tom Tan 一起,发表了一篇工作论文,《Is Tom Cruise Threatened? Using Netflix Prize Data to Examine the Long Tail of Electronic Commerce》。他们通过分析 Netflix Prize 公布的数据,研究了消费者在 Netflix 网站上表现出来的对热门影片以及小众影片的需求情况。论文使用的分析方法严谨有逻辑,讲解也详实有条理,因此结果相当令人信服:“在大部分情况下,长尾效应可能并没有人们想象的那么普遍”!

我这里仅陈述结论,对具体内容感兴趣可以去读一下 paper。

1)论文提出了一个重要问题,到底如何定义“头部”和“长尾”?

在长尾理论里,Anderson 使用的是“绝对定义(absolute term)”的办法,比如“100 部顶级大片”和“100 部小众影片”。Anderson 之所以这么界定,是建立在与传统实体商业模式相比较的基础之上的,比如,录像租赁连锁店 Blockbuster 平均只能提供不到 3000 个DVD;4 万首曲目通常是一个中等音像店的流动库存量。在传统模式下,能够提供的产品总量是相对稳定的,而且所有的产品也都是以某种差不多固定的比率被消费的。
而 Netessine 教授则认为,Anderson 使用的这种绝对定义的方法是有误导性的。在互联网环境下,虽然消费者不再受地域限制,单一产品的受众得以增加;但产品的数量有了极大的提高,越来越多的产品根本无法被发现,或者还来不及被发现就又被新产品淹没了——Netflix 的数据证明了这种结论。因此,必须使用“相对定义(relative term)”的方法,把产品数量快速变化这个因素考虑进来。

2)如果同意使用“相对定义”的方法,那么,Netessine 教授的研究结果表明,在 Netflix 公布的数据中,并没有发现其中存在任何长尾效应。而且还恰恰与长尾理论正相反,帕累托原理(80/20法则)的效应变得更强了,人们对 Top-20% 影片的需求,从 2000 年的 86% 增长到了 2005 年的 90%。
此外,论文中也使用了 Anderson 的绝对定义方法来进行数据分析,结果发现,长尾效应只显示了一部分:随着时间的推移,消费者对大片的需求确实下降了,但对小众影片的需求也同样在逐步降低。(那需求哪里去了?)

3)下面这些现象,均会在一定程度上限制长尾效应发挥作用。

  • 大胆尝试小众影片的主要是电影发烧友,但是发烧友在观影群体中仅占很小的一部分(大约 25%)。而且从满意程度上看,小众影片与大片相比并不能带来额外的满意度。
  • 目前流行的基于协同过滤的推荐系统,有滞后效应,并倾向于把相似的影片推荐给相似的用户,而且,越多人打分的影片被推荐的概率越大。
  • 通常我们会认为,社会化网络 SNS
    的流行,使得口碑(word-of-mouth)的力量被几何性放大了。但有研究表明,口碑的作用其实是使“好的更好,差的更差”,即正面的口碑对畅销产品的影响更大,而负面的评价对利基产品的影响更大。而且,相似用户倾向于消费相似的产品,因为这样大家才具有共同的话题。
  • 总体的搜索成本确实在下降,但同样也是“好的更好”,畅销产品的搜索结果相比利基产品更好了。

很明显,技术进步在同时提升了畅销产品和利基产品需求的情况下,却拉大了畅销产品与利基产品的差距。“好的更好”,对长尾效应是个严峻的问题,


前文中,我有意留了一个悬而未决的问题:“需求哪里去了”?Anderson 与 Netessine 的分歧正在这里。基于 Netflix 的数据分析结果表明,Top-500 影片的需求下降了,而紧接着的一部分需求却扩大了。按照绝对定义,
Anderson 认为这是人们的需求在向长尾移动的表现;而按照相对定义,Netessine 认为这部分应该算在 Top-20% 中,即人们对头部的需求更大了。我个人认为,不管怎样,这都确实反应了人们多样化的诉求是存在的,并且在不断增长。

另外我觉得,与 Anderson 的长尾理论相比,Netessine 这份研究报告存在的一个问题就是他把所有的影片同等对待了。比如《变形金刚》和《疯狂的石头》,一个票房几亿美元,一个只有三千万人民币。尽管相比之下对石头的需求要低得多,但参照石头的拍摄成本来讲,这样的需求度足够了。与此相同的还有豆瓣音乐人,“Converse”的 Fans 只有 15369 个,与大牌歌手相比简直不值一提,但对于 Converse 来讲,这已经是一个很棒的开始了。

但无论如何,Netessine 教授的这篇报告,还是值得长尾理论实践者的高度关注。国内业界领先的实践者胖子,在这方面有着特别的智慧:

用长尾理论的话来说,大众是头,小众是尾,只是我认为与长尾理论这本书说的不同,在可预见的未来,这个头不会变平,会更尖,热的会更热。长尾很难从短头抢生意,只是头变高了,总有东西会滚下来,长尾也会变高。基本上,介入一个领域后,想作大事情,最先满足的一定是大众的需求。大众需求的特质就是磨平个性,小众是强调个性,这就像麦当劳和精品私房菜、成衣和裁缝的关系。

我想,不管是相对定义的头更尖了,还是绝对定义的头更扁了,只要那条尾巴存在,我们这些专注于满足用户个性化需求的从业者,就值得为此努力。
 

信仰在空中飘摇

我不是一个滥情的人,更很少在 blog 里面发泄情绪。那是第一次,这次是第二次。

“看着电视上的节日晚会
你觉得有意思吗
听着电台里的明星访谈
你觉得有意思吗
聊着网络上的花边新闻
你觉得有意思吗
过着现代程序化的生活
你觉得有意思吗” ——《有意思吗》

二十年前,
看着电视里面威武拉风的塔克,我嗷嗷乱叫,像一个《红旗下的蛋》。

十年前,
被授予五十周年国庆优秀标兵,我无动于衷,嘟哝着《别来纠缠我》。

上周,
在嘹亮的为人民服务口号声中,我蒙头大睡,《梦里回到唐朝》。

“也许征程的迷惘会扯碎我的手臂
可我相信未来会给我一双梦想的翅膀
虽然挫折的创伤已让我寸步难行
可我坚信光明就在远方” ——《光明》

十五年前,
足球比赛被淘汰了,和哥们儿肩并着肩高唱着《执着》,
那一天,《笑着哭》。

十年前,
欢迎新生联欢会上,和室友撕扯着破锣嗓子《随心所欲》
那一天,《我在长大》。

五年前,
某大项目庆功会上,给学弟世故地指点着要《活得精彩》,
那一天,《我没有远方》。

“还记得许多年前的春天,
那时的我还没剪去长发,
没有信用卡没有她,
没有24小时热水的家。” ——《春天里》

今天,《问自己》,《奴隶努力》,只是《为了让生活继续》?

“伴随着自由的钟声象正义地审判
能听到窗外更猛烈的忏悔和呢喃
脆弱的巨塔伴随着虚空轰然坍塌
血之墙在闪电的轰鸣中颤抖不安

为活着的却不存在的人们而到来
为善良的却在流血的生命而坚持
为所有的罪与罚和爱与死而祈祷
为我们坚信却迷惘的未来而飘扬

这不曾是我们想要的光明
所有的痛都还在这里
就在最后可以说出再见之前
让我们怀着信仰在空中飘扬” ——《信仰在空中飘扬》

如果,你和我一样,三十而立,有迷茫,有无助,另外还有那么一点点小理想,
那么,《信仰在空中飘扬》,送给你,
一个人,认真听,
这歌声里,有力量。

 

ResysChina 发起人
1. 持续关注 个性化推荐 技术;
2. 持续关注 Semantic Web 技术;
3. 评论与上两项相关的互联网业务与产品;

我相信技术的力量!
wendell.gu@GMail.com

Archives