最好走的路越走越难,最难走的路越走越容易

Follow guwendong on Web
  • Subscribe to Beyond Search via RSS
  • Join Resys Google Group
  • Follow @clickstone on Douban
  • Follow @clickstone on Twitter

隐私问题与个性化服务

本文可以任意转载,转载时请务必以超链接形式标明文章 原始出处版权信息

Web 上的隐私保护是个让人头疼的问题!已经有激进点儿的人在说,“Privacy is Dead: Get Over It”。确实,随着计算机存储容量的扩展,以及数据分析能力的提升,我们在 web 上的每个动作,都有可能会被保存下来,被进一步的加工,并被各种形式的应用所利用。

这些大数据的存在,有可能会造成严重的后果,即使初衷是好的。AOL Search Log 事件就是一个鲜活的例子。2006 年 6 月,AOL 实验室发布了一组数据 [1],“500k User Queries Sampled Over 3 Months” (此乃镜像链接,AOL实验室的原始数据已经被删除了)。刚开始,学术界的人们都欢欣鼓舞,如此大量的数据公开出来确实难能可贵,毋庸置疑会有力地促进相关的学术研究 [2]。但没多久,就出现了一个大问题,AOL 数据集里面的第 4417749 号用户,被人还原出了真实的身份 [3]。一下子,舆论哗然,隐私保护组织也开始不遗余力地展开讨伐。最终,此事以 AOL 关闭实验室相关部门,CTO Maureen Govern 被 fire 掉才告一段落。隐私得到了保护,但世界失去了一次进步的机会 [4]!后面的 Netflix Prize 竞赛,也遭遇了类似的问题,但谢天谢地,这次的影响很小。

而另一方面,基于这些数据所得到的分析结果,无论对个人还是对服务提供商,都有益处。拿我来讲,经常在 Amazon 上面搜索书籍和打分,使得 Amazon 可以向我推销能吸引我的商品;启用了 Google 的搜索历史服务,使得 Google 可以向我提供适合我的搜索结果;向豆瓣贡献着打分数据,使得豆瓣可以帮我找到我会觉得好看的电影。而与此同时,Amazon、Google 甚至是豆瓣,通过大量收集这样的数据,已经建立起了非常高的进入壁垒。后来者由于缺乏这样的数据积累,在类似的服务上也很难再有所超越。

通常情况下,如果你严肃地探讨隐私保护的问题,大多数人也许会发现,这是一个虚幻的命题。大多数人并不见得能够清楚地说明到底在顾虑什么,往往,大家只是担忧而已,甚至仅仅是潜意识型的思维,“我只是不想让别人了解我”。但当我们把问题拉回到现实情况,我们会发现,隐私也许根本不是问题。你在地址栏里主动输入 amazon.com,在 Amazon 的网上超市里面选购商品,下订单并付款,然后给出评价完成交易。Amazon 为我们提供了一种体验很好的服务,我们乐意在 Amazon 上浏览,进行各种活动,看起来 Amazon 似乎有权利使用我们的这些行为数据,提升他们的服务,从而让我们更快乐的购物。因此,虽然 Amazon 记录了我们的一举一动,但并没有人抱怨隐私受到了侵犯。

个性化服务,已经被公认为是下一个十年中的 next big thing 之一,而隐私问题,却一直在困扰着个性化服务的发展。我个人认为,从业人士和相关部门,实在是有必要来共同关注和解决这个问题了。制定相应的行业规范,是非常有必要的,甚至是制定专门的法律都不为过。毕竟,这是一个价值超过10亿$的问题!

相关文章:

Leave a Reply

You can use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

1. 持续关注 个性化推荐 技术;
2. 持续关注 Semantic Web 技术;
3. 评论与上两项相关的互联网业务与产品;

我相信技术的力量!
wendell.gu@GMail.com

Archives