最好走的路越走越难,最难走的路越走越容易

Follow guwendong on Web
  • Subscribe to Beyond Search via RSS
  • Follow @clickstone on SinaWeibo
  • Join Resys Google Group
  • Follow @clickstone on Douban
  • Follow @clickstone on Twitter

Tag Archives: privacy

Google Matrix

Google 退出中国事件发生之后,来自木遥同学的一篇文字,让我不能同意更多!其中有这么一段,

这个「国家(指 Google)」是网络世界中的第一个霸权,它可以控制数据和知识的流通,影响人类的所见所闻乃至精神世界的每个方面;它握有大量个人隐私信息,并且具有无可撼动的垄断地位;它在许多场合起到的已经是近乎可以类比于公权力的作用。而另一方面,它只是一家私有公司,没有任何方式可以从外部对它合法的控制力进行监督和制约。它当然也许确实会始终尽量不干预搜索排名,小心翼翼地维护互联网的自由和公正,但这只是它自己的道义承诺而已,而我们甚至想不出什么办法来验证这一点。

木遥的整篇文字非常中肯,但若单独摘引这一段,则是典型的“断章取义”。同一段文字,放在木遥的全文里看与单独看此段,差不多会造成两种理解,作语义的同学想必对此有深刻体会,这就是 Context(上下文)的作用。

在 Personalization 方面,亦是如此 —— Context 非常重要!

春节前,kuberResys Group 里发起了一个讨论,“基于SNS/Lifestream的推荐”,提到了 Google 近期的一些动作。其实长久以来,在个性化领域,Google 一直在下一盘很大的棋!看看他的布局吧。

  1. Personalized new tab page
    这个是2009年1月 Google Toolbar 推出的一个 feature,当你打开 Firefox 时,不再只是看到一个空白 tab 页,Google 会根据你的浏览历史,为你定制一个个性化 tab,包含你最常用的一些站点或页面。这个已经是新一代浏览器的标配了。

  2. Interested-based Ads
    传统的 Adsense 广告,是根据与网页内容的相关度进行展示的,与浏览者本身的兴趣无关。2009年3月 Google 推出了这种基于用户兴趣的广告,浏览者看到的不再仅是与内容相关的广告,而是与其本身兴趣相符的广告。至于用户兴趣哪里来的?抛开搜索记录不说,遍布互联网的 Analytics 和 Adsense 脚本本身,就能干不少事情了。

  3. Personalized keyword-suggestions
    尽管这个搜索提示功能没少给谷歌找麻烦,但 Google 显然认为这个东东对用户是有益的,尤其是对登录之后的搜索用户。当用户登录了 Google 帐号,并启用了 Web History 功能之后,搜索提示会把你最近频繁使用的几个关键字显示给你,这对搜索到一半被打断回头又想继续的用户来说体验很好。当然了,谷歌用户自然是无缘使用的。

  4. Google Reader by Personalized Ranking
    个性化的信息阅读,是用户长久以来的心声,久觅未果不少人甚至已经开始自己动手实现。2009年10月,Google Reader 对在这方面的官方支持终于千呼万唤始出来。最吸引眼球的是新增的“Sort by magic”排序功能,它综合考虑用户的阅读历史,包括 Trends、Start、Share 以及 Like 等,将待阅读的内容进行个性化地排序。这对动辄 1000+ 未读条目的用户来讲,绝对是个福音,就我个人的使用体验来看,效果相当不错。

  5. Google News Personalization
    2009年10月,Google CEO Eric Schmidt 在接受采访的时候说,“想像这样一个媒体:它知道你是谁,知道你喜欢什么,知道你看过哪些新闻,它能够评价你是否喜欢正在阅读的文章,还能够专门挑出你感兴趣的广告…”——科技是多么的伟大!但也有用户说了,“靠!这简直是阿鼻地狱啊,还是麻溜地不要再用 Google 服务了”,杯具啊!

  6. Personalized Search
    Google CEO Eric Schmidt 和美女总裁都说了,“搜索的未来要靠个性化”!目前,基于关键字的搜索,无疑已经成为帮助用户从信息海洋中寻找内容的重要手段,但互联网暴长的数据容量其实让 Google 也很头大。搜索引擎通过长期分析用户的搜索行为,可以感知用户的意图,从而在特定范围内完成搜索,有效地提高搜索效率,增强用户粘性。有关 Google 个性化搜索更详尽的资料,可以参考这里,另外 Resys 里也有过一次热烈的讨论

  7. Personalized Gmail Ads
    从 Gmail 诞生的第一天,它就是贴着小广告的。这个事情之前差点犯了众怒,后来 Google 保证仅展示“Family-Safe”的广告,并许诺说,“Ads and links to related pages only appear alongside the message that they are targeted to, and are only shown when the Google Mail user, whether sender or recipient, is viewing that particular message.”。现在,Google 在标红的“only”前面加入了一个“not”。隐私问题与个性化服务的矛盾由来已久,这个事情我认为解决方案和 Google 退出中国的诉求是一致的,只要有法可依即可。关于 Gmail 里的广告,这里有一枚杯具,欢迎围观。

  8. Google Buzz
    Buzz 在这事儿上毫不含糊,直接就说了,“Buzz recommends interesting posts and weeds out ones you’re likely to skip.”。为了验证 Google 的这个说法,我正在戒推进行中,全力使用 Buzz,看它能不能给我带来什么惊喜。就目前的体验来讲,我基本上是可耻的失败鸟。

  9. Google Friend Connect
    Boss 总是最后出场!但人生就像一个茶几,你永远不知道下一个被放上来的是哪枚杯具。Facebook 新近发布的 Open Graph,有很大机会把擅长把别人搞成杯具的 Google 搞成彻头彻尾的杯具帝,让我们拭目以待吧!


图片来源

 

隐私问题与个性化服务

Web 上的隐私保护是个让人头疼的问题!已经有激进点儿的人在说,“Privacy is Dead: Get Over It”。确实,随着计算机存储容量的扩展,以及数据分析能力的提升,我们在 web 上的每个动作,都有可能会被保存下来,被进一步的加工,并被各种形式的应用所利用。

这些大数据的存在,有可能会造成严重的后果,即使初衷是好的。AOL Search Log 事件就是一个鲜活的例子。2006 年 6 月,AOL 实验室发布了一组数据 [1],“500k User Queries Sampled Over 3 Months” (此乃镜像链接,AOL实验室的原始数据已经被删除了)。刚开始,学术界的人们都欢欣鼓舞,如此大量的数据公开出来确实难能可贵,毋庸置疑会有力地促进相关的学术研究 [2]。但没多久,就出现了一个大问题,AOL 数据集里面的第 4417749 号用户,被人还原出了真实的身份 [3]。一下子,舆论哗然,隐私保护组织也开始不遗余力地展开讨伐。最终,此事以 AOL 关闭实验室相关部门,CTO Maureen Govern 被 fire 掉才告一段落。隐私得到了保护,但世界失去了一次进步的机会 [4]!后面的 Netflix Prize 竞赛,也遭遇了类似的问题,但谢天谢地,这次的影响很小。

而另一方面,基于这些数据所得到的分析结果,无论对个人还是对服务提供商,都有益处。拿我来讲,经常在 Amazon 上面搜索书籍和打分,使得 Amazon 可以向我推销能吸引我的商品;启用了 Google 的搜索历史服务,使得 Google 可以向我提供适合我的搜索结果;向豆瓣贡献着打分数据,使得豆瓣可以帮我找到我会觉得好看的电影。而与此同时,Amazon、Google 甚至是豆瓣,通过大量收集这样的数据,已经建立起了非常高的进入壁垒。后来者由于缺乏这样的数据积累,在类似的服务上也很难再有所超越。

通常情况下,如果你严肃地探讨隐私保护的问题,大多数人也许会发现,这是一个虚幻的命题。大多数人并不见得能够清楚地说明到底在顾虑什么,往往,大家只是担忧而已,甚至仅仅是潜意识型的思维,“我只是不想让别人了解我”。但当我们把问题拉回到现实情况,我们会发现,隐私也许根本不是问题。你在地址栏里主动输入 amazon.com,在 Amazon 的网上超市里面选购商品,下订单并付款,然后给出评价完成交易。Amazon 为我们提供了一种体验很好的服务,我们乐意在 Amazon 上浏览,进行各种活动,看起来 Amazon 似乎有权利使用我们的这些行为数据,提升他们的服务,从而让我们更快乐的购物。因此,虽然 Amazon 记录了我们的一举一动,但并没有人抱怨隐私受到了侵犯。

个性化服务,已经被公认为是下一个十年中的 next big thing 之一,而隐私问题,却一直在困扰着个性化服务的发展。我个人认为,从业人士和相关部门,实在是有必要来共同关注和解决这个问题了。制定相应的行业规范,是非常有必要的,甚至是制定专门的法律都不为过。毕竟,这是一个价值超过10亿$的问题!

 

ResysChina 发起人
1. 持续关注 个性化推荐 技术;
2. 持续关注 Semantic Web 技术;
3. 评论与上两项相关的互联网业务与产品;

我相信技术的力量!
wendell.gu@GMail.com

Archives