<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Beyond Search &#187; 三言两语</title>
	<atom:link href="http://www.guwendong.com/post/category/opinions/feed" rel="self" type="application/rss+xml" />
	<link>http://www.guwendong.com</link>
	<description>最好走的路越走越难，最难走的路越走越容易</description>
	<lastBuildDate>Wed, 11 Aug 2010 16:43:41 +0000</lastBuildDate>
	
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Google Matrix</title>
		<link>http://www.guwendong.com/post/2010/google_matrix.html</link>
		<comments>http://www.guwendong.com/post/2010/google_matrix.html#comments</comments>
		<pubDate>Tue, 27 Apr 2010 11:52:15 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[三言两语]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[personalization]]></category>
		<category><![CDATA[privacy]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/?p=354</guid>
		<description><![CDATA[Google 退出中国事件发生之后，来自木遥同学的一篇文字，让我不能同意更多！其中有这么一段，
这个「国家（指 Google）」是网络世界中的第一个霸权，它可以控制数据和知识的流通，影响人类的所见所闻乃至精神世界的每个方面；它握有大量个人隐私信息，并且具有无可撼动的垄断地位；它在许多场合起到的已经是近乎可以类比于公权力的作用。而另一方面，它只是一家私有公司，没有任何方式可以从外部对它合法的控制力进行监督和制约。它当然也许确实会始终尽量不干预搜索排名，小心翼翼地维护互联网的自由和公正，但这只是它自己的道义承诺而已，而我们甚至想不出什么办法来验证这一点。
木遥的整篇文字非常中肯，但若单独摘引这一段，则是典型的“断章取义”。同一段文字，放在木遥的全文里看与单独看此段，差不多会造成两种理解，作语义的同学想必对此有深刻体会，这就是 Context（上下文）的作用。
在 Personalization 方面，亦是如此 —— Context 非常重要！
 春节前，kuber 在 Resys Group 里发起了一个讨论，“基于SNS/Lifestream的推荐”，提到了 Google 近期的一些动作。其实长久以来，在个性化领域，Google 一直在下一盘很大的棋！看看他的布局吧。


Personalized new tab page
 这个是2009年1月 Google Toolbar 推出的一个 feature，当你打开 Firefox 时，不再只是看到一个空白 tab 页，Google 会根据你的浏览历史，为你定制一个个性化 tab，包含你最常用的一些站点或页面。这个已经是新一代浏览器的标配了。

Interested-based Ads
 传统的 Adsense 广告，是根据与网页内容的相关度进行展示的，与浏览者本身的兴趣无关。2009年3月 Google 推出了这种基于用户兴趣的广告，浏览者看到的不再仅是与内容相关的广告，而是与其本身兴趣相符的广告。至于用户兴趣哪里来的？抛开搜索记录不说，遍布互联网的 Analytics 和 Adsense 脚本本身，就能干不少事情了。

Personalized keyword-suggestions
 尽管这个搜索提示功能没少给谷歌找麻烦，但 Google 显然认为这个东东对用户是有益的，尤其是对登录之后的搜索用户。当用户登录了 Google 帐号，并启用了 Web History 功能之后，搜索提示会把你最近频繁使用的几个关键字显示给你，这对搜索到一半被打断回头又想继续的用户来说体验很好。当然了，谷歌用户自然是无缘使用的。

Google Reader by Personalized Ranking
 个性化的信息阅读，是用户长久以来的心声，久觅未果不少人甚至已经开始自己动手实现。2009年10月，Google [...]]]></description>
			<content:encoded><![CDATA[<p>Google 退出中国事件发生之后，来自<a href="http://blog.farmostwood.net/441.html" id="pla2" title="我们为什么信息 Google？">木遥</a>同学的一篇文字，让我不能同意更多！其中有这么一段，</p>
<blockquote><p>这个「国家（指 Google）」是网络世界中的第一个霸权，它可以控制数据和知识的流通，影响人类的所见所闻乃至精神世界的每个方面；它握有大量个人隐私信息，并且具有无可撼动的垄断地位；它在许多场合起到的已经是近乎可以类比于公权力的作用。而另一方面，它只是一家私有公司，没有任何方式可以从外部对它合法的控制力进行监督和制约。它当然也许确实会始终尽量不干预搜索排名，小心翼翼地维护互联网的自由和公正，但这只是它自己的道义承诺而已，而我们甚至想不出什么办法来验证这一点。</p></blockquote>
<p>木遥的整篇文字非常中肯，但若单独摘引这一段，则是典型的“断章取义”。同一段文字，放在木遥的全文里看与单独看此段，差不多会造成两种理解，作语义的同学想必对此有深刻体会，这就是 Context（上下文）的作用。</p>
<p><b>在 Personalization 方面，亦是如此 —— Context 非常重要！</b></p>
<p> 春节前，<a href="http://www.cnblogs.com/kuber" id="dak7" title="kuber">kuber</a> 在 <a href="http://groups.google.com.hk/group/resys/" id="bum2" title="Resys Group">Resys Group</a> 里发起了一个讨论，“<a href="http://groups.google.com.hk/group/resys/browse_thread/thread/59eb4cc3b0fe20f7#" id="al23" title="基于SNS/Lifestream的推荐">基于SNS/Lifestream的推荐</a>”，提到了 Google 近期的一些动作。其实长久以来，在个性化领域，Google 一直在下一盘很大的棋！看看他的布局吧。</p>
<p><img src="http://docs.google.com/File?id=ddjqwpms_590c6cg7ggb_b" style="float:right;height:240px;margin-left:1em;margin-right:0px;width:320px"></p>
<ol>
<li><a href="http://googleblog.blogspot.com/2009/01/google-toolbar-in-firefox-personalized.html" id="yq3z" title="Google Toolbar in Firefox: a personalized new tab page">Personalized new tab page</a><br />
 这个是2009年1月 Google Toolbar 推出的一个 feature，当你打开 Firefox 时，不再只是看到一个空白 tab 页，Google 会根据你的浏览历史，为你定制一个个性化 tab，包含你最常用的一些站点或页面。这个已经是新一代浏览器的标配了。</p>
</li>
<li><a href="http://googleblog.blogspot.com/2009/03/making-ads-more-interesting.html" id="cjc7" title="Making ads more interesting">Interested-based Ads</a><br />
 传统的 Adsense 广告，是根据与网页内容的相关度进行展示的，与浏览者本身的兴趣无关。2009年3月 Google 推出了这种基于用户兴趣的广告，浏览者看到的不再仅是与内容相关的广告，而是与其本身兴趣相符的广告。至于用户兴趣哪里来的？抛开搜索记录不说，遍布互联网的 Analytics 和 Adsense 脚本本身，就能干不少事情了。</p>
</li>
<li><a href="http://googleblog.blogspot.com/2009/05/faster-is-better-on-google-suggest.html" id="luua" title="Faster is better on Google Suggest">Personalized keyword-suggestions</a><br />
 尽管这个搜索提示功能没少给谷歌<a href="http://www.google.org.cn/posts/why-google-search-suggeest-shows-lots-of-porn-content.html" id="gtt:" title="转：为什么在 Google 搜索儿子，搜索建议会出现大量低俗内容">找麻烦</a>，但 Google 显然认为这个东东对用户是有益的，尤其是对登录之后的搜索用户。当用户登录了 Google 帐号，并启用了 Web History 功能之后，搜索提示会把你最近频繁使用的几个关键字显示给你，这对搜索到一半被打断回头又想继续的用户来说体验很好。当然了，<a href="http://www.google.org.cn/posts/google-china-music-using-windows-live-id-save-your-music-list.html" id="rddj" title="谷歌音乐杯具的可以用微软 Windows Live ID 账户登陆保存播放列表了">谷歌用户</a>自然是无缘使用的。</p>
</li>
<li><a href="http://googleblog.blogspot.com/2009/10/reading-gets-personal-with-popular.html" id="wrp2" title="Reading gets personal with Popular items and Personalized ranking">Google Reader by Personalized Ranking</a><br />
 个性化的信息阅读，是用户长久以来的心声，久觅未果不少人甚至已经开始自己<a href="http://www.guwendong.com/post/2009/greader_share.html" id="fja9" title="怎样利用 GReader Share 数据？">动手实现</a>。2009年10月，Google Reader 对在这方面的官方支持终于千呼万唤始出来。最吸引眼球的是新增的“Sort by magic”排序功能，它综合考虑用户的阅读历史，包括 Trends、Start、Share 以及 Like 等，将待阅读的内容进行个性化地排序。这对动辄 1000+ 未读条目的用户来讲，绝对是个福音，就我个人的使用体验来看，效果相当不错。</p>
</li>
<li><a href="http://glinden.blogspot.com/2009/10/google-ceo-on-personalized-news.html" id="rk3r" style="color:#551a8b" title="Google CEO on personalized news">Google News Personalization</a><br />
 2009年10月，Google CEO Eric Schmidt 在接受采访的时候说，“想像这样一个媒体：它知道你是谁，知道你喜欢什么，知道你看过哪些新闻，它能够评价你是否喜欢正在阅读的文章，还能够专门挑出你感兴趣的广告&#8230;”——科技是多么的伟大！但也有用户说了，“靠！这简直是阿鼻地狱啊，还是麻溜地不要再用 Google 服务了”，杯具啊！</p>
</li>
<li><a href="http://googleblog.blogspot.com/2009/12/personalized-search-for-everyone.html" id="y-lu" title="Personalized Search for everyone">Personalized Search</a><br />
 Google CEO&nbsp;<a href="http://www.techcrunch.com/2009/09/03/google-ceo-eric-schmidt-on-the-future-of-search-connect-it-straight-to-your-brain/" id="oo8x" title="Google CEO Eric Schmidt On The Future Of Search: “Connect It Straight To Your Brain”">Eric Schmidt</a>&nbsp;和<a href="http://www.daniweb.com/news/story220007.html" id="v-hf" style="color:#551a8b" title="Google's Mayer Predicts Personalization Is Key to Future Search">美女总裁</a>都说了，“搜索的未来要靠个性化”！目前，基于关键字的搜索，无疑已经成为帮助用户从信息海洋中寻找内容的重要手段，但互联网暴长的数据容量其实让 Google 也很头大。搜索引擎通过长期分析用户的搜索行为，可以感知用户的意图，从而在特定范围内完成搜索，有效地提高搜索效率，增强用户粘性。有关 Google 个性化搜索更详尽的资料，可以参考<a href="http://www.huomah.com/Search-Engines/Search-Engine-Optimization/The-SEO-guide-to-Google-personalized-search.html" id="s_3r" title="The SEO guide to Google personalized search">这里</a>，另外 Resys 里也有过一次热烈的<a href="http://groups.google.com.hk/group/resys/browse_thread/thread/9b8fdec17741cc26/21a2a8e9e0bec63e" id="x27o" title="多特征的推荐系统">讨论</a>。</p>
</li>
<li><a href="http://gmailblog.blogspot.com/2010/01/serving-better-ads-in-gmail.html" id="wl7l" title="Serving better ads in Gmail">Personalized Gmail Ads<br />
</a>从 Gmail 诞生的第一天，它就是贴着小广告的。这个事情之前差点犯了众怒，后来 Google 保证仅展示“Family-Safe”的广告，并<a href="http://mail.google.com/mail/help/intl/en_GB/more.html" id="h31-" title="More on Google Mail and privacy">许诺</a>说，“Ads and links to related pages <font class="Apple-style-span"><span class="Apple-style-span" style="background-color:#e06666">only</span></font> appear alongside the message that they are targeted to, and are&nbsp;<font class="Apple-style-span"><span class="Apple-style-span" style="background-color:#e06666">only</span></font> shown when the Google Mail user, whether sender or recipient, is viewing that particular message.”。现在，Google 在标红的“only”前面加入了一个“not”。<a href="http://www.guwendong.com/post/2008/privacy_and_personalization.html" id="i46j" title="隐私问题与个性化服务">隐私问题与个性化服务</a>的矛盾由来已久，这个事情我认为解决方案和 Google 退出中国的诉求是一致的，只要有法可依即可。关于 Gmail 里的广告，这里有一枚<a href="http://groups.google.com.hk/group/resys/browse_thread/thread/c7c223e79eb06afd" id="oj1g" title="杯具">杯具</a>，欢迎围观。</p>
</li>
<li><a href="http://googleblog.blogspot.com/2010/02/introducing-google-buzz.html" id="xm4l" title="Google Buzz">Google Buzz</a><br />
 Buzz 在这事儿上毫不含糊，直接就说了，“Buzz recommends interesting posts and weeds out ones you&#8217;re likely to skip.”。为了验证 Google 的这个说法，我正在戒推进行中，全力使用 Buzz，看它能不能给我带来什么惊喜。就目前的体验来讲，我基本上是可耻的失败鸟。</p>
</li>
<li><a href="http://googleblog.blogspot.com/2009/11/google-friend-connect-now-more.html" id="b58y" title="Google Friend Connect, now more personalized">Google Friend Connect</a><br />
 Boss 总是最后出场！但人生就像一个茶几，你永远不知道下一个被放上来的是哪枚杯具。Facebook 新近发布的&nbsp;<a href="http://blog.facebook.com/blog.php?post=383404517130" id="brbi" title="Building the Social Web Together">Open Graph</a>，有很大机会把擅长把别人搞成杯具的 Google 搞成彻头彻尾的杯具帝，让我们拭目以待吧！
</li>
</ol>
<p>
<img src="http://docs.google.com/File?id=ddjqwpms_587c9wcw9dj_b" style="height:443px;width:600px"><br />
 图片<a href="http://www.huomah.com/Search-Engines/Search-Engine-Optimization/The-SEO-guide-to-Google-personalized-search.html" id="sak1" title="The SEO guide to Google personalized search">来源</a></p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2010.<br/>
本文网址：<a href="http://www.guwendong.com/post/2010/google_matrix.html">http://www.guwendong.com/post/2010/google_matrix.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/google" rel="tag">google</a>, <a href="http://www.guwendong.com/post/tag/personalization" rel="tag">personalization</a>, <a href="http://www.guwendong.com/post/tag/privacy" rel="tag">privacy</a> | <a href="http://www.guwendong.com/post/2010/google_matrix.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2010/google_matrix.html/feed</wfw:commentRss>
		<slash:comments>8</slash:comments>
		</item>
		<item>
		<title>长尾效应，有没有，有没有？</title>
		<link>http://www.guwendong.com/post/2009/longtail_netflix.html</link>
		<comments>http://www.guwendong.com/post/2009/longtail_netflix.html#comments</comments>
		<pubDate>Mon, 12 Oct 2009 16:40:20 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[三言两语]]></category>
		<category><![CDATA[longtail]]></category>
		<category><![CDATA[netflix]]></category>
		<category><![CDATA[resys]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2009/longtail_netflix.html</guid>
		<description><![CDATA[

长尾理论 [1]，是由《Wired》杂志的主编 Chris Anderson 在 2004 年提出的。此外，他还编撰了同主题的一本书《长尾理论》，来详细阐述这个概念及其带来的深远影响。尽管 Anderson 在致力于颠覆人们对畅销产品的认知，但无疑他自己已经从畅销产品上大赚了一票——《长尾理论》这本书一经出版即大卖。
以 iTunes 服务为例，长尾理论认为，对于这样的纯数字服务来说，由于不再需要货架，也没有制造成本和分销费用，卖出一件非流行品与卖出一件流行品之间没有任何区别，它们的边际利润都是一样的。于是乎，流行不再是利润的唯一代名词了。通过尽可能地扩充产品种类，尽可能地降低产品价格，并充分发挥个性化推荐技术的效能，可以把顾客的需求朝长尾的方向引导，通过大量的之前无人问津的产品产生销售，累积起来就可以获得一个甚至比原有流行市场容量还要大的利基市场。
我是长尾理论的坚定拥护者。





但人生就是一个又一个的轮回。在长尾理论风光了五年之后，重量级的质疑终于还是来了。沃顿商学院的信息学教授 Serguei Netessine 与他的博士研究生 Tom Tan 一起，发表了一篇工作论文，《Is Tom Cruise Threatened? Using Netflix Prize Data to Examine the Long Tail of Electronic Commerce》。他们通过分析 Netflix Prize 公布的数据，研究了消费者在 Netflix 网站上表现出来的对热门影片以及小众影片的需求情况。论文使用的分析方法严谨有逻辑，讲解也详实有条理，因此结果相当令人信服：“在大部分情况下，长尾效应可能并没有人们想象的那么普遍”！
我这里仅陈述结论，对具体内容感兴趣可以去读一下 paper。

1）论文提出了一个重要问题，到底如何定义“头部”和“长尾”？

在长尾理论里，Anderson 使用的是“绝对定义（absolute term）”的办法，比如“100 部顶级大片”和“100 部小众影片”。Anderson 之所以这么界定，是建立在与传统实体商业模式相比较的基础之上的，比如，录像租赁连锁店 Blockbuster 平均只能提供不到 3000 个DVD；4 万首曲目通常是一个中等音像店的流动库存量。在传统模式下，能够提供的产品总量是相对稳定的，而且所有的产品也都是以某种差不多固定的比率被消费的。
而 Netessine 教授则认为，Anderson 使用的这种绝对定义的方法是有误导性的。在互联网环境下，虽然消费者不再受地域限制，单一产品的受众得以增加；但产品的数量有了极大的提高，越来越多的产品根本无法被发现，或者还来不及被发现就又被新产品淹没了——Netflix 的数据证明了这种结论。因此，必须使用“相对定义（relative term）”的方法，把产品数量快速变化这个因素考虑进来。
2）如果同意使用“相对定义”的方法，那么，Netessine 教授的研究结果表明，在 Netflix [...]]]></description>
			<content:encoded><![CDATA[<div>
<div>
<div><span><a title="长尾理论" href="http://www.wired.com/wired/archive/12.10/tail.html">长尾理论</a> <a title="译言的中文翻译" href="http://www.yeeyan.com/articles/view/dding/41">[1]</a>，是由《Wired》杂志的主编 Chris Anderson 在 2004 年提出的。</span>此外，他还编撰了同主题的一本书《<span><a title="长尾理论" href="http://www.douban.com/subject/1919072/">长尾理论</a></span>》，来详细阐述这个概念及其带来的深远影响。尽管 Anderson 在致力于颠覆人们对畅销产品的认知，但无疑他自己已经从畅销产品上大赚了一票——《<span>长尾理论</span>》这本书一经出版即大卖。</p>
<p>以 iTunes 服务为例，<span>长尾理论认为，</span>对于这样的纯数字服务来说，由于不再需要货架，也没有制造成本和分销费用，卖出一件非流行品与卖出一件流行品之间没有任何区别，它们的边际利润都是一样的。于是乎，流行不再是利润的唯一代名词了。通过尽可能地扩充产品种类，尽可能地降低产品价格，并充分发挥个性化推荐技术的效能，可以把顾客的需求朝长尾的方向引导，通过大量的之前无人问津的产品产生销售，累积起来就可以获得一个甚至比原有流行市场容量还要大的利基市场。</p>
<p>我是长尾理论的坚定拥护者。</p>
<div style="text-align:center">
<div style="text-align:left"><img style="width:550px;height:270px" src="http://docs.google.com/File?id=ddjqwpms_505d484btf7_b">
</div>
</div>
<p><span><br />
但人生就是一个又一个的轮回。在长尾理论风光了五年之后，重量级的质疑终于还是来了。</span><span>沃顿商学院的信息学教授 <a href="http://www.netessine.com/">Serguei Netessine</a> 与他的博士研究生 Tom Tan 一起，发表了一篇工作论文，《</span><a title="Is Tom Cruise Threatened? Using Netflix Prize Data to Examine the Long Tail of Electronic Commerce" href="http://knowledge.wharton.upenn.edu/papers/1361.pdf">Is Tom Cruise Threatened? Using Netflix Prize Data to Examine the Long Tail of Electronic Commerce</a><span>》。他们通过分析 Netflix Prize 公布的<a title="数据" href="http://archive.ics.uci.edu/ml/datasets/Netflix+Prize">数据</a>，研究了消费者在 Netflix 网站上表现出来的对热门影片以及小众影片的需求情况。论文使用的分析方法严谨有逻辑</span>，讲解也详实有条理，因此结果相当令人信服：“<span>在大部分情况下，长尾效应可能并没有人们想象的那么普遍</span>”！</p>
<p>我这里仅陈述结论，对具体内容感兴趣可以去读一下 paper。</p>
</div>
<p>1）论文提出了一个重要问题，到底如何定义“头部”和“长尾”？
</div>
<p>在长尾理论里，<span>Anderson 使用的是“绝对定义（</span><span>absolute term</span><span>）”的办法，比如</span><span>“100 部顶级大片”和“100 部小众影片</span>”。Anderson 之所以这么界定，是建立在与传统实体商业模式相比较的基础之上的，比如，录像租赁连锁店 Blockbuster 平均只能提供不到 3000 个DVD；4 万首曲目通常是一个中等音像店的流动库存量。<span>在传统模式下，能够提供的产品总量是相对稳定的，而且所有的产品也都是以某种差不多固定的比率被消费的。</span><br />
而 Netessine 教授则认为，Anderson 使用的这种绝对定义的方法是有误导性的。在互联网环境下，虽然消费者不再受地域限制，单一产品的受众得以增加；但产品的数量有了极大的提高，越来越多的产品根本无法被发现，或者还来不及被发现就又被新产品淹没了——Netflix 的数据证明了这种结论。因此，必须使用“相对定义（relative term）”的方法，把产品数量快速变化这个因素考虑进来。</p>
<p>2）<span>如果同意使用“相对定义”的方法，那么</span>，Netessine 教授的研究结果表明，在 Netflix 公布的数据中，<span>并没有发现其中存在任何长尾效应。而且还恰恰与长尾理论正相反，</span><span>帕累托原理（80/20法则）的效应变得更强了，人们对 Top-20% 影片的需求，从 2000 年的 86% 增长到了 2005 年的 90%。<br />
</span><span>此外，论文中也使用了 </span>Anderson 的绝对定义方法来进行数据分析<span>，结果发现，长尾效应只显示了一部分：随着时间的推移，</span><span>消费者对大片的需求确实下降了，但</span><span>对小众影片的需求也同样在逐步降低。（那需求哪里去了？）</p>
<p>3）下面这些现象，均会在一定程度上限制长尾效应发挥作用。<br />
</span></div>
<div>
<ul>
<li><span>大胆尝试小众影片的主要是电影发烧友，但是发烧友在观影群体中仅占很小的一部分（大约 25%）。而且从满意程度上看，小众影片与大片相比并不能带来额外的满意度。</span></li>
<li><span>目前流行的基于协同过滤的推荐系统，有滞后效应，并倾向于把相似的影片推荐给相似的用户，而且，越多人打分的影片被推荐的概率越大。</span></li>
<li>通常我们会认为，社会化网络 SNS<br />
的流行，使得口碑（word-of-mouth）的力量被几何性放大了。但有研究表明，口碑的作用其实是使“好的更好，差的更差”，即正面的口碑对畅销产品的影响更大，而负面的评价对利基产品的影响更大。而且，相似用户倾向于消费相似的产品，因为这样大家才具有共同的话题。</li>
<li><span>总体的搜索成本确实在下降，但同样也是“好的更好”，畅销产品的搜索结果相比利基产品更好了。</span></li>
</ul>
<p><span>很明显，技术进步在同时提升了畅销产品和利基产品需求的情况下，却拉大了畅销产品与利基产品的差距。</span><span>“好的更好”，对长尾效应是个严峻的问题，</span></p>
<div><span><br />
前文中，我有意留了一个悬而未决的问题：“需求哪里去了”？Anderson 与 Netessine 的分歧正在这里。基于 Netflix 的数据分析结果表明，Top-500 影片的需求下降了，而紧接着的一部分需求却扩大了。按照绝对定义，</span>Anderson 认为这是人们的需求在向长尾移动的表现；而按照相对定义，<span>Netessine 认为这部分应该算在 Top-20% 中，即人们对头部的需求更大了。</span><span>我个人认为，</span><span>不管怎样，这都</span><span>确实</span><span>反应了人们多样化的诉求是存在的，并且在不断增长。</span></p>
</div>
<div>另外我觉得，与 Anderson 的长尾理论相比，<span>Netessine </span>这份研究报告存在的一个问题就是他把所有的影片同等对待了。比如《变形金刚》和《疯狂的石头》，一个票房几亿美元，一个只有三千万人民币。尽管相比之下对石头的需求要低得多，但参照石头的拍摄成本来讲，这样的需求度足够了。与此相同的还有豆瓣音乐人，“<a title="Converse" href="http://www.douban.com/minisite/converse/">Converse</a>”的 Fans 只有 15369 个，与大牌歌手相比简直不值一提，但对于 Converse 来讲，这已经是一个很棒的开始了。</p>
<p>但无论如何，<span>Netessine 教授的这篇报告，还是值得长尾理论实践者的高度关注。</span>国内业界领先的实践者<a title="胖子" href="http://www.douban.com/people/1000037/">胖子</a>，在这方面有着特别的智慧：</p>
<blockquote><p>用长尾理论的话来说，大众是头，小众是尾，只是我认为与长尾理论这本书说的不同，在可预见的未来，这个头不会变平，会更尖，热的会更热。长尾很难从短头抢生意，只是头变高了，总有东西会滚下来，长尾也会变高。基本上，介入一个领域后，想作大事情，最先满足的一定是大众的需求。大众需求的特质就是磨平个性，小众是强调个性，这就像麦当劳和精品私房菜、成衣和裁缝的关系。
</p></blockquote>
<div style="text-align:left">我想，不管是相对定义的头更尖了，还是绝对定义的头更扁了，只要那条尾巴存在，我们这些专注于满足用户个性化需求的从业者，就值得为此努力。<br />
<img style="width:400px;height:300px" src="http://docs.google.com/File?id=ddjqwpms_507cwrs5rd3_b">
</div>
</div>
</div>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2009.<br/>
本文网址：<a href="http://www.guwendong.com/post/2009/longtail_netflix.html">http://www.guwendong.com/post/2009/longtail_netflix.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/longtail" rel="tag">longtail</a>, <a href="http://www.guwendong.com/post/tag/netflix" rel="tag">netflix</a>, <a href="http://www.guwendong.com/post/tag/resys" rel="tag">resys</a> | <a href="http://www.guwendong.com/post/2009/longtail_netflix.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2009/longtail_netflix.html/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>信仰在空中飘摇</title>
		<link>http://www.guwendong.com/post/2009/my_30_years.html</link>
		<comments>http://www.guwendong.com/post/2009/my_30_years.html#comments</comments>
		<pubDate>Wed, 07 Oct 2009 10:22:18 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[三言两语]]></category>
		<category><![CDATA[blah]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2009/my_30_years.html</guid>
		<description><![CDATA[我不是一个滥情的人，更很少在 blog 里面发泄情绪。那是第一次，这次是第二次。

“看着电视上的节日晚会
你觉得有意思吗
听着电台里的明星访谈
你觉得有意思吗
聊着网络上的花边新闻
你觉得有意思吗
过着现代程序化的生活
你觉得有意思吗” ——《有意思吗》

二十年前，
看着电视里面威武拉风的塔克，我嗷嗷乱叫，像一个《红旗下的蛋》。
十年前，
被授予五十周年国庆优秀标兵，我无动于衷，嘟哝着《别来纠缠我》。
上周，
在嘹亮的为人民服务口号声中，我蒙头大睡，《梦里回到唐朝》。

“也许征程的迷惘会扯碎我的手臂
可我相信未来会给我一双梦想的翅膀
虽然挫折的创伤已让我寸步难行
可我坚信光明就在远方” ——《光明》

十五年前，
足球比赛被淘汰了，和哥们儿肩并着肩高唱着《执着》，
那一天，《笑着哭》。
十年前，
欢迎新生联欢会上，和室友撕扯着破锣嗓子《随心所欲》，
那一天，《我在长大》。
五年前，
某大项目庆功会上，给学弟世故地指点着要《活得精彩》，
那一天，《我没有远方》。

“还记得许多年前的春天，
那时的我还没剪去长发，
没有信用卡没有她，
没有24小时热水的家。” ——《春天里》

今天，《问自己》，《奴隶努力》，只是《为了让生活继续》?

“伴随着自由的钟声象正义地审判
能听到窗外更猛烈的忏悔和呢喃
脆弱的巨塔伴随着虚空轰然坍塌
血之墙在闪电的轰鸣中颤抖不安
为活着的却不存在的人们而到来
为善良的却在流血的生命而坚持
为所有的罪与罚和爱与死而祈祷
为我们坚信却迷惘的未来而飘扬
这不曾是我们想要的光明
所有的痛都还在这里
就在最后可以说出再见之前
让我们怀着信仰在空中飘扬” ——《信仰在空中飘扬》

如果，你和我一样，三十而立，有迷茫，有无助，另外还有那么一点点小理想，
那么，《信仰在空中飘扬》，送给你，
一个人，认真听，
这歌声里，有力量。

© guwendong for Beyond Search, 2009.
本文网址：http://www.guwendong.com/post/2009/my_30_years.html
tags: blah &#124; 参与讨论
]]></description>
			<content:encoded><![CDATA[<p>我不是一个滥情的人，更很少在 blog 里面发泄情绪。<a title="这是最好的年代，这是最坏的年代！" href="http://www.guwendong.com/post/2007/acknowledgement_of_a_phd.html">那是</a>第一次，这次是第二次。</p>
<p>
“看着电视上的节日晚会<br />
你觉得有意思吗<br />
听着电台里的明星访谈<br />
你觉得有意思吗<br />
聊着网络上的花边新闻<br />
你觉得有意思吗<br />
过着现代程序化的生活<br />
你觉得有意思吗” ——《有意思吗》</p>
<p>
二十年前，<br />
看着电视里面威武拉风的塔克，我嗷嗷乱叫，像一个《红旗下的蛋》。</p>
<p>十年前，<br />
被授予五十周年国庆优秀标兵，我无动于衷，嘟哝着《别来纠缠我》。</p>
<p>上周，<br />
在嘹亮的为人民服务口号声中，我蒙头大睡，《梦里回到唐朝》。</p>
<p>
“也许征程的迷惘会扯碎我的手臂<br />
可我相信未来会给我一双梦想的翅膀<br />
虽然挫折的创伤已让我寸步难行<br />
可我坚信光明就在远方” ——《光明》</p>
<p>
十五年前，<br />
足球比赛被淘汰了，和哥们儿肩并着肩高唱着《执着》，<br />
那一天，《笑着哭》。</p>
<p>十年前，<br />
欢迎新生联欢会上，和室友撕扯着破锣嗓子<span>《随心所欲》</span>，<br />
那一天，《我在长大》。</p>
<p>五年前，<br />
某大项目庆功会上，给学弟世故地指点着要《活得精彩》，<br />
那一天，《我没有远方》。</p>
<p>
“还记得许多年前的春天，<br />
那时的我还没剪去长发，<br />
没有信用卡没有她，<br />
没有24小时热水的家。” ——《春天里》</p>
<p>
今天，《问自己》，《奴隶努力》，只是《为了让生活继续》?</p>
<p>
“伴随着自由的钟声象正义地审判<br />
能听到窗外更猛烈的忏悔和呢喃<br />
脆弱的巨塔伴随着虚空轰然坍塌<br />
血之墙在闪电的轰鸣中颤抖不安</p>
<p>为活着的却不存在的人们而到来<br />
为善良的却在流血的生命而坚持<br />
为所有的罪与罚和爱与死而祈祷<br />
为我们坚信却迷惘的未来而飘扬</p>
<p>这不曾是我们想要的光明<br />
所有的痛都还在这里<br />
就在最后可以说出再见之前<br />
让我们怀着信仰在空中飘扬” ——《信仰在空中飘扬》</p>
<p>
如果，你和我一样，三十而立，有迷茫，有无助，另外还有那么一点点小理想，<br />
那么，《<a title="信仰在空中飘扬" href="http://www.douban.com/subject/3843530/">信仰在空中飘扬</a>》，送给你，<br />
一个人，认真听，<br />
这歌声里，有力量。</p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2009.<br/>
本文网址：<a href="http://www.guwendong.com/post/2009/my_30_years.html">http://www.guwendong.com/post/2009/my_30_years.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/blah" rel="tag">blah</a> | <a href="http://www.guwendong.com/post/2009/my_30_years.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2009/my_30_years.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Toby&#8217;s Lessons on recommendation systems</title>
		<link>http://www.guwendong.com/post/2009/toby_lessons_on_recommendation_systems.html</link>
		<comments>http://www.guwendong.com/post/2009/toby_lessons_on_recommendation_systems.html#comments</comments>
		<pubDate>Mon, 07 Sep 2009 16:35:51 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[三言两语]]></category>
		<category><![CDATA[resys]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2009/toby_lessons_on_recommendation_systems.html</guid>
		<description><![CDATA[Toby Segaran 是 Recommender Systems 及 Semantic Web 方面的大牛，著有两本很受欢迎的技术著作，《Programming Collective Intelligence》[1]、 《Programming the Semantic Web》。他具备一项羡煞旁人的技能——轻描淡写之间理清算法脉络，让枯燥的公式变成具有喜感的代码。我是他的 fans。
今年上半年，他受 Andreas Weigend 之邀，在 Stanford 的 Data Mining and Electronic Business 课堂上做了一次有关“Recommender Systems”的讲座。Andreas Weigend 之前在 Amazon 任职，位居首席科学家，在 Amazon 的推荐引擎建设方面做出了大量的贡献。下面是 Toby 自己列出的一些主要观点，


Amazon makes 20-30% of its sales from recommendations. Only 16% of people go to Amazon with explicit intent to buy [...]]]></description>
			<content:encoded><![CDATA[<p><a title="http://blog.kiwitobes.com/" href="http://blog.kiwitobes.com/">Toby Segaran</a> 是 Recommender Systems 及 Semantic Web 方面的大牛，著有两本很受欢迎的技术著作，<a title="《Programming Collective Intelligence》" href="http://www.douban.com/subject/2209702/">《Programming Collective Intelligence》</a><a title="我对此书的书评" href="http://www.guwendong.com/post/2008/programming_collective_intelligence_review.html">[1]</a>、 <a title="《Programming the Semantic Web》" href="http://www.douban.com/subject/3571979/">《Programming the Semantic Web》</a>。他具备一项羡煞旁人的技能——轻描淡写之间理清算法脉络，让枯燥的公式变成具有喜感的代码。我是他的 fans。</p>
<p>今年上半年，他受 <a title="Andreas Weigend" href="http://weigend.com/">Andreas Weigend</a> 之邀，在 Stanford 的 <a title="Data Mining and Electronic Business" href="http://weigend.com/teaching/stanford/">Data Mining and Electronic Business</a> 课堂上做了一次有关“Recommender Systems”的讲座。Andreas Weigend 之前在 Amazon 任职，位居首席科学家，在 Amazon 的推荐引擎建设方面做出了大量的贡献。下面是 Toby 自己列出的一些主要观点，</p>
<div>
<ul>
<li>Amazon makes 20-30% of its sales from recommendations. <b>Only 16% of people go to Amazon with explicit intent to buy something</b></li>
<li>The data that you collect matters much more than the algorithm you use. Amazon’s<br />
algorithm is essentially a large product-product correlation matrix for<br />
the past hour, but it works for them because hey collect so much data<br />
through user actions</li>
<li>Many problems including shopping, targeted advertising, dating, finding events, etc. can be framed as recommendation problems</li>
<li><b>Very important take away</b>: find ways to collect as<br />
much user input as possible without being disruptive. People don&#8217;t<br />
train systems, they try to benefit themselves, but this is the best<br />
kind of training data</li>
<li>There are a lot of different types of data that can train a system:<br />
votes, clicks, page-view time, purchases, tagging, adding a title — the<br />
user does these things anyway, and you can use the data</li>
<li><a title="A/B testing at Amazon and Microsoft" href="http://glinden.blogspot.com/2007/06/ab-testing-at-amazon-and-microsoft.html">A/B testing</a> is an effective and underused way to learn about<br />
people. Simply by varying the way you phrase something, you can learn<br />
more about your users</li>
<li>Very few systems now are combining metadata or content with<br />
collaborative filtering. The consensus in the class when discussing a<br />
music recommendation system was that this could be very effective</li>
</ul>
<p>
</div>
<p>课程相关的资料在<a title="这里" href="http://stanford2009.wikispaces.com/">这里</a>，看完<a title="这个" href="http://stanford2009.wikispaces.com/7_Recommend+5.18">这个</a>，再对比我曾经所学的课程，想死的心都有了！</p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2009.<br/>
本文网址：<a href="http://www.guwendong.com/post/2009/toby_lessons_on_recommendation_systems.html">http://www.guwendong.com/post/2009/toby_lessons_on_recommendation_systems.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/resys" rel="tag">resys</a> | <a href="http://www.guwendong.com/post/2009/toby_lessons_on_recommendation_systems.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2009/toby_lessons_on_recommendation_systems.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>玩聚SR和豆瓣新九点</title>
		<link>http://www.guwendong.com/post/2009/social_media_sr_nine.html</link>
		<comments>http://www.guwendong.com/post/2009/social_media_sr_nine.html#comments</comments>
		<pubDate>Mon, 12 Jan 2009 09:55:04 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[三言两语]]></category>
		<category><![CDATA[douban]]></category>
		<category><![CDATA[ju690]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2009/social_media_sr_nine.html</guid>
		<description><![CDATA[如果有一篇文章，在来源（作者、发布的网站）你不确认的情况下，如何判断其是否可读呢？
 选择只能是：标题+摘要。这个没招儿，那么多文章，必须有一个快速筛选的方法。标题是最一目了然的地方，这也是为什么那么多标题党的原因。摘要通常有两个方法，发布者给出，或者是自己快速扫一眼。人确实太NB了，随便扫一眼，就够计算机折腾一壶了。那计算机有办法模拟人来理解文章吗？语义分析。这个我不展开说了。 当文章看多了之后，我们会积累下来什么经验呢？ 

     某作者小A写的文章比较靠谱。这个信任的作者。   
     某网站小E摘选的文章比较靠谱。这个其实信任的是编辑。   

 因此总结下来，评价一篇文章可读性的因素主要是 3 个： 

     内容是否是我感兴趣的。   
     我是否信任这个作者。   
     我是否信任某个第三方的评价。   

 一个好的阅读工具，应该能够有效地帮助我们发掘和强化这三个因素。
 Social Media 之所以流行，恰恰是因为它针对上面三个因素引入了一些新的特性。Social Media 有一个基本假设，即群体智慧，意思是说，参与到 social [...]]]></description>
			<content:encoded><![CDATA[<p>如果有一篇文章，在来源（作者、发布的网站）你不确认的情况下，如何判断其是否可读呢？</p>
<p> 选择只能是：标题+摘要。这个没招儿，那么多文章，必须有一个快速筛选的方法。标题是最一目了然的地方，这也是为什么那么多标题党的原因。摘要通常有两个方法，发布者给出，或者是自己快速扫一眼。人确实太NB了，随便扫一眼，就够计算机折腾一壶了。那计算机有办法模拟人来理解文章吗？语义分析。这个我不展开说了。<br /> 当文章看多了之后，我们会积累下来什么经验呢？<br /> 
<ol>
<li>     某作者小A写的文章比较靠谱。这个信任的作者。   </li>
<li>     某网站小E摘选的文章比较靠谱。这个其实信任的是编辑。   </li>
</ol>
<p> 因此总结下来，评价一篇文章可读性的因素主要是 3 个：<br /> 
<ol>
<li>     内容是否是我感兴趣的。   </li>
<li>     我是否信任这个作者。   </li>
<li>     我是否信任某个第三方的评价。   </li>
</ol>
<p> 一个好的阅读工具，应该能够有效地帮助我们发掘和强化这三个因素。</p>
<p> Social Media 之所以流行，恰恰是因为它针对上面三个因素引入了一些新的特性。Social Media 有一个基本假设，即群体智慧，意思是说，参与到 social 中的群体越多，media 所反应出来的智慧越高超。
<ol>
<li>     Tag，针对第一个因素。提高了内容判断的效率和准确性。作者小A的标题是有主观性的，而 Tag 是广大读者打的，更趋于客观。   </li>
<li>     Blog，针对第二个因素。作者小A以一种更加容易辨识的主体出现，读者对小A的认识更立体化，并且可以产生交互，容易记忆。   </li>
<li>     Digg/Share/推荐，针对第三个因素。这里是最体现群体智慧的地方，三个臭皮匠能顶一个诸葛亮。大家都说好，那么它真好的可能性，应该会比某网站小E说好的可能性要大。   </li>
<li>     SNS，更强化了上面的第三个因素。如果是你的好朋友推荐的，那么你觉得好的可能行就更大了。   </li>
</ol>
<p> 据此，我个人简单分析一下最近国内热门的几个 Social Media 应用。</p>
<p> <a href="http://sr.ju690.com/" title="玩聚SR">玩聚SR</a>。一句话点评：个人认为是玩聚旗下感觉最对路的应用。<br /> <a href="http://www.flickr.com/photos/gwd/3192965489/"><img src="http://farm4.static.flickr.com/3105/3192965489_804d039736.jpg"></a><br /> 上图中底部的“分享者”一栏，目前看来用处不大，因为放眼望去这些分享者大多我不认识，不但不能增强阅读的信任感，反而是一种干扰：这些我不认识的人推荐出来的东西我要看吗？还不如像 digg 那样，只显示 digg 数字，放大数字带来的心理暗示：这么多人推荐，我也看看吧！<br /> 玩聚SR的页面，我个人感觉有些乱，会头晕。从用户体验角度看，可有可无的，最好不要。这个分享者列表，不如拿掉，在网页快照里面显示就好了。</p>
<p> 豆瓣<a href="http://9.douban.com/" title="新九点">新九点</a>。一句话点评：我是曾经的豆瓣一套的坚定拥护者，这次新九点终于把其融合了进来，很好。<br /> <a href="http://www.flickr.com/photos/gwd/3192952631/"><img src="http://farm4.static.flickr.com/3356/3192952631_121b2272f0.jpg"></a><br /> 上图中底部的“5人推荐”一栏，是个失败的设计。我看豆瓣的文章，首先看是谁推荐的，如果找到一个我非常认同的人，那么我必看，反而推荐人数并不是决定因素了。而豆瓣没有有效地利用这一点，导致和其他的阅读工具缺乏区别化。</p>
<p> 用户访问某个网站，是有心理预期的。<br /> 玩聚SR，我没想在上面找到多少我认识的人，而大部分分享者我都不认识的事实，也正强化了这个心理预期。因此分享者列表作用小，推荐数作用大。<br /> 豆瓣，是我熟悉的网站，这上面有我熟识的朋友。用户带着这样的惯性从豆瓣来到九点，朋友作用大，数字作用小。<br /> 定位你最希望服务的用户，设计产品。不该用的用了，该用的确却没用，可惜了。</p>
<p> 推荐继续阅读 <a href="http://www.douban.com/people/NullPointer/" title="NullPointer @ douban">NullPointer</a> 的两篇 blog：<br /> 
<ol>
<li>     <a href="http://npchen.blogspot.com/2008/01/sns.html" title="从豆瓣的推荐功能说起——SNS网站的内向和外向">从豆瓣的推荐功能说起——SNS网站的内向和外向</a></li>
<li><a href="http://npchen.blogspot.com/2008/04/blog-post_25.html" title="接着说豆瓣的推荐功能——社会化推荐的动力和阻力">接着说豆瓣的推荐功能——社会化推荐的动力和阻力</a></li>
</ol>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2009.<br/>
本文网址：<a href="http://www.guwendong.com/post/2009/social_media_sr_nine.html">http://www.guwendong.com/post/2009/social_media_sr_nine.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/douban" rel="tag">douban</a>, <a href="http://www.guwendong.com/post/tag/ju690" rel="tag">ju690</a> | <a href="http://www.guwendong.com/post/2009/social_media_sr_nine.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2009/social_media_sr_nine.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Digg 和 FriendFeed 的新动作</title>
		<link>http://www.guwendong.com/post/2008/digg_and_friendfreed.html</link>
		<comments>http://www.guwendong.com/post/2008/digg_and_friendfreed.html#comments</comments>
		<pubDate>Fri, 24 Oct 2008 11:22:29 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[三言两语]]></category>
		<category><![CDATA[digg]]></category>
		<category><![CDATA[friendfeed]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2008/digg_and_friendfreed.html</guid>
		<description><![CDATA[Digg 最近完成了新一轮的融资，总共 $28.7 million，不过目前国内关注 Digg 的人似乎已经不多了。在官方 blog 里吸引我的是他们提到的一些 new features，“&#8230; personalizing the Digg experience, enhancing the recommendation system across other areas of the site, creating deeper category &#8230;”。Personalization 越来越成为主流，这是个好事情！
 2008年6月底，Digg 终于放出了大家期待已久的 recommendation engine。在运行1个多月之后，他们公布了统计效果： 

用户活跃度显著提高：增长了40％。
运转的很好很强大：平均每个用户会得到200条推荐，这些推荐，平均来自于34个“像你”的用户；整个站点会产生54,000,000条推荐。 
友邻活动/添加友邻增长了24％。 
评论增长了11％。  

 　　  　　我不是 Digg 的深度用户，基本是在他们放出 recommendation engine 之后，才逐渐增加了 Digg 的使用频度，而且也还是断断续续的。但就简单体验来看，效果还是蛮不错的。如果你是 Digg 的忠实用户，非常欢迎到这里来讨论。
 另外，最近在使用各类 SNS 的过程中，被好友动态折腾到不行。而且清一色的流水帐布局，乱，没有效率，也缺乏新意。我简单地提了个小设想，“在好友范围内，统计一天里最 popular 的东西”。回头却发现，FriendFeed 早在8月份的时候就已经推出了这个 feature。最近基本上没怎么使用 [...]]]></description>
			<content:encoded><![CDATA[<p>Digg 最近完成了新一轮的融资，总共 <a href="http://blog.digg.com/?p=256" title="Big News: Expanding &amp; Growing Digg">$28.7 million</a>，不过目前国内关注 Digg 的人似乎已经不多了。在官方 blog 里吸引我的是他们提到的一些 new features，“&#8230; personalizing the Digg experience, enhancing the recommendation system across other areas of the site, creating deeper category &#8230;”。Personalization 越来越成为主流，这是个好事情！</p>
<p> 2008年6月底，Digg 终于放出了大家期待已久的 <a href="http://blog.digg.com/?p=127" title="Recommendation Engine rolling out this week!">recommendation engine</a>。在运行1个多月之后，他们公布了<a href="http://blog.digg.com/?p=136" title="Digg Recommendation Engine Updates">统计效果</a>：<br /> 
<ol>
<li>用户活跃度显著提高：增长了40％。</li>
<li>运转的很好很强大：平均每个用户会得到200条推荐，这些推荐，平均来自于34个“像你”的用户；整个站点会产生54,000,000条推荐。 </li>
<li>友邻活动/添加友邻增长了24％。 </li>
<li>评论增长了11％。  </li>
</ol>
<p> 　　 <br /> 　　我不是 Digg 的深度用户，基本是在他们放出 recommendation engine 之后，才逐渐增加了 Digg 的使用频度，而且也还是断断续续的。但就简单体验来看，效果还是蛮不错的。如果你是 Digg 的忠实用户，非常欢迎<a href="http://www.douban.com/group/topic/3930601/" title="邀Digg用户讨论一下digg recommendation的使用感受">到这里来讨论</a>。</p>
<p> 另外，最近在使用各类 SNS 的过程中，被好友动态折腾到不行。而且清一色的流水帐布局，乱，没有效率，也缺乏新意。我简单地提了个小设想，“<a href="http://www.douban.com/group/topic/4436353/" title="在我的友邻里，统计当日最popular的内容">在好友范围内，统计一天里最 popular 的东西</a>”。回头却发现，FriendFeed 早在8月份的时候就已经推出了<a href="http://blog.friendfeed.com/2008/08/preview-new-friendfeed-design.html" title="Preview the new FriendFeed design">这个 feature</a>。最近基本上没怎么使用 FriendFeed，疏忽了，看来接下来需要提高 FriendFeed 的使用频率，跟踪研究一下效果。</p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2008.<br/>
本文网址：<a href="http://www.guwendong.com/post/2008/digg_and_friendfreed.html">http://www.guwendong.com/post/2008/digg_and_friendfreed.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/digg" rel="tag">digg</a>, <a href="http://www.guwendong.com/post/tag/friendfeed" rel="tag">friendfeed</a> | <a href="http://www.guwendong.com/post/2008/digg_and_friendfreed.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2008/digg_and_friendfreed.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Twine Beta：盛名之下，其实难副</title>
		<link>http://www.guwendong.com/post/2008/twine_beta.html</link>
		<comments>http://www.guwendong.com/post/2008/twine_beta.html#comments</comments>
		<pubDate>Sat, 03 May 2008 04:48:06 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[三言两语]]></category>
		<category><![CDATA[semantic-web]]></category>
		<category><![CDATA[twine]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2008/twine_beta.html</guid>
		<description><![CDATA[等了很久之后，终于在4月26日拿到了 Twine Beta 的试用邀请。简单地玩儿了一下，发现用标题这句话形容它再合适不过了——盛名之下，其实难副！ 这就是传说中万人瞩目的“The First Mainstream Semantic Web App”？OMG！与 Freebase 的惊艳相比，Twine 差得简直太远了。
 用官方的话说，Twine 的核心是“Interest Networks“，又或者是之前更多被提到的“Knowledge Networks”。Twine is a Smartest Way To Organize, Share and Discover Information About Your Interests. You can use Twine alone, with friends, groups and communities, or even in your company. 但以其目前的 Beta 版来看，Twine 最多也就能算个稍微新型的 bookmark 应用而已。
 当然，可以看到 Twine 试图在做一些事情，我捡重要的说说。
 第一件事情，从网页里抽取实体。 [...]]]></description>
			<content:encoded><![CDATA[<p><img src="http://docs.google.com/File?id=ddjqwpms_229dsjbdsfc_b" style="margin:1em 1em 0pt 0pt;width:180px;height:98px;float:left">等了很久之后，终于在4月26日拿到了 <a href="http://www.twine.com/" title="Twine Beta">Twine Beta</a> 的试用邀请。简单地玩儿了一下，发现用标题这句话形容它再合适不过了——盛名之下，其实难副！<br /> 这就是传说中万人瞩目的“<a href="http://www.readwriteweb.com/archives/twine_first_mainstream_semantic_web_app.php" title="Twine: The First Mainstream Semantic Web App?">The First Mainstream Semantic Web App</a>”？OMG！与 <a href="http://www.freebase.com" title="Freebase">Freebase</a> 的惊艳相比，Twine 差得简直太远了。</p>
<p> 用官方的话说，Twine 的核心是“<b>Interest Networks</b>“，又或者是之前更多被提到的“<b>Knowledge Networks</b>”。Twine is a Smartest Way To Organize, Share and Discover Information About Your Interests. You can use Twine alone, with friends, groups and communities, or even in your company. 但以其目前的 Beta 版来看，Twine 最多也就能算个稍微新型的 bookmark 应用而已。</p>
<p> 当然，可以看到 Twine 试图在做一些事情，我捡重要的说说。</p>
<p> 第一件事情，从网页里抽取实体。<br /> 这事儿英文通常称为 Entity Extraction，Semantic Web 中叫做 Ontology Annotation。这个确实是 Sematic Web App 必须要解决地第一件事情。但在这件事情上，Twine 做得很烂。我总共试了 3 篇文章。<br /> 
<ol>
<li>第一篇是我的一个中文 blog，“<a href="http://www.guwendong.com/post/2008/site_mystrands_com.html" title="个性化站点：MyStrands">个性化站点：MyStrands</a>”。Twine This，结果是乱码！好吧，你可以说 Beta 对中文的支持还不好，可以容忍。</li>
<li>第二篇是我在 Google Reader 上 share 的一篇英文 blog，“<a href="http://blog.kiwitobes.com/?p=56" title="Slide decks from Web 2.0 talks">Slide decks from Web 2.0 talks</a>”，里面有两个很棒的 PPT。这次更离谱，完全没有定位准确正文，居然把 “Recent Comments” Panel 里的内容作为了网页正文！好吧，你可以说这篇文章的正文部分字数少，识别有难度，可以容忍。</li>
<li>第三篇是一个分析 Twine 的英文 blog，“<a href="http://radar.oreilly.com/archives/2007/10/web2summit-radar-networks-unwi.html" title="Web2Summit:  Radar Networks Unwinds twine.com">Web2Summit:  Radar Networks Unwinds twine.com</a>”，长篇大论，以免正文字数少又难倒了 Twine。这次总算顺利通过了，让我们赶紧来看一下 Twine 传说中的 Auto Tag 吧。“People”里加上了“Nova Spivack”，这个不错。“Organizations”里加入了“O&#39;Reilly”和“Radar Networks”，也不错，但有个“<a href="http://www.twine.com/search?annotation=radar%3A%2F%2Fztmcvvx-32">Directory Assistance</a>”非常诡异！点链接进去一看，search 结果里大量出现了“Network”这个词，而这篇文章里总共出现了3次“Network”，看来“Network”被当作了“Directory Assistance”的一个 Keyword。由此大概可以推断，对于 Entity Extraction，Twine 使用的是 <a href="http://en.wikipedia.org/wiki/Metadata_modeling" title="Meta Model">Meta Model</a>。但关键是此处的结果是有问题的，Network 在本文里是作为“Radar Networks”出现的，并不是本来的 Network，这里产生了歧义，但 Twine 的模型并没能解决这个问题。最后再来看“Other Tags”，“Semantic Edge”、“Semantic Web”和“Web 2.0”还算不错，但称不上好。通篇在评论的 Twine 应用本身，并没有出现在 Auto Tags 里面，但通过验证，其实“Twine”这个 Tag 是存在的。 </li>
</ol>
<p> 第二件事情，“Twine”的使用。<br /> 这里的“Twine”，不是 Twine.com，而是 Twine team 创造出来的一个概念，用来组织 Interest Networks。用大家都能理解的一个说法，“Twine”基本和我们常见的“频道”差不多，就是一堆相似的文章的集合。在我看来，“Twine”本身其实和 tag 没有本质的区别，不同就在于用作“Twine”的 tag 应该会得到一个比较高的 tag weight，并在 tag hierarchy 中占据更高层的位置。其实，tag weight 与 tag hierarchy，也是我一直在思考的一个问题。比如在使用 del.icio.us 时，我们会给网页打上不同的 tag，潜意识里，各个 tag 的 weight 应该是不同的，并且通常还会使用不同层次的概念。比如“<a href="http://radar.oreilly.com/archives/2007/10/web2summit-radar-networks-unwi.html" title="Web2Summit:  Radar Networks Unwinds twine.com">Web2Summit:  Radar Networks Unwinds twine.com</a>”这篇文章，Technorati Tags 就是“freebase, radarnetworks, SemanticWeb, web2.0, web20, web2summit”，其中 SemanticWeb 和 radarnetworks 应该 weight 高一些，而 freebase 是 SemanticWeb 和 web2.0 概念之下的一个应用。但常见的 tag 标注方法，是没有办法体现上述两项差别的。“Twine”的使用，似乎就意在 tag 上面再插入一层，定义出重要的 tag，建立 hierachy。如果 Twine 确实是这种思路的话，目前的产品设计至少也有一个问题。用户可以自由地创建 Twine，似乎并没有什么规则/规范。我可以建立一个“Film”的“Twine”，然后把“The Matrix”加进来，打上“Science fiction”的 tag；也可以建立一个“Science fiction”的“Twine”，然后把“The Matrix”加进来，打上“Film”的 tag。这会造成混乱。</p>
<p> Recommendation Panel， 是 Twine 上另外一个值得关注的功能，但由于我目前活动度不够，推荐给我的东西很少，留待下一步分析。</p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2008.<br/>
本文网址：<a href="http://www.guwendong.com/post/2008/twine_beta.html">http://www.guwendong.com/post/2008/twine_beta.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/semantic-web" rel="tag">semantic-web</a>, <a href="http://www.guwendong.com/post/tag/twine" rel="tag">twine</a> | <a href="http://www.guwendong.com/post/2008/twine_beta.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2008/twine_beta.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>隐私问题与个性化服务</title>
		<link>http://www.guwendong.com/post/2008/privacy_and_personalization.html</link>
		<comments>http://www.guwendong.com/post/2008/privacy_and_personalization.html#comments</comments>
		<pubDate>Wed, 27 Feb 2008 13:50:36 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[三言两语]]></category>
		<category><![CDATA[privacy]]></category>
		<category><![CDATA[resys]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2008/privacy_and_personalization.html</guid>
		<description><![CDATA[Web 上的隐私保护是个让人头疼的问题！已经有激进点儿的人在说，“Privacy is Dead: Get Over It”。确实，随着计算机存储容量的扩展，以及数据分析能力的提升，我们在 web 上的每个动作，都有可能会被保存下来，被进一步的加工，并被各种形式的应用所利用。
这些大数据的存在，有可能会造成严重的后果，即使初衷是好的。AOL Search Log 事件就是一个鲜活的例子。2006 年 6 月，AOL 实验室发布了一组数据 [1]，“500k User Queries Sampled Over 3 Months” （此乃镜像链接，AOL实验室的原始数据已经被删除了）。刚开始，学术界的人们都欢欣鼓舞，如此大量的数据公开出来确实难能可贵，毋庸置疑会有力地促进相关的学术研究 [2]。但没多久，就出现了一个大问题，AOL 数据集里面的第 4417749 号用户，被人还原出了真实的身份 [3]。一下子，舆论哗然，隐私保护组织也开始不遗余力地展开讨伐。最终，此事以 AOL 关闭实验室相关部门，CTO Maureen Govern 被 fire 掉才告一段落。隐私得到了保护，但世界失去了一次进步的机会 [4]！后面的 Netflix Prize 竞赛，也遭遇了类似的问题，但谢天谢地，这次的影响很小。
而另一方面，基于这些数据所得到的分析结果，无论对个人还是对服务提供商，都有益处。拿我来讲，经常在 Amazon 上面搜索书籍和打分，使得 Amazon 可以向我推销能吸引我的商品；启用了 Google 的搜索历史服务，使得 Google 可以向我提供适合我的搜索结果；向豆瓣贡献着打分数据，使得豆瓣可以帮我找到我会觉得好看的电影。而与此同时，Amazon、Google 甚至是豆瓣，通过大量收集这样的数据，已经建立起了非常高的进入壁垒。后来者由于缺乏这样的数据积累，在类似的服务上也很难再有所超越。
通常情况下，如果你严肃地探讨隐私保护的问题，大多数人也许会发现，这是一个虚幻的命题。大多数人并不见得能够清楚地说明到底在顾虑什么，往往，大家只是担忧而已，甚至仅仅是潜意识型的思维，“我只是不想让别人了解我”。但当我们把问题拉回到现实情况，我们会发现，隐私也许根本不是问题。你在地址栏里主动输入 amazon.com，在 Amazon 的网上超市里面选购商品，下订单并付款，然后给出评价完成交易。Amazon 为我们提供了一种体验很好的服务，我们乐意在 Amazon 上浏览，进行各种活动，看起来 [...]]]></description>
			<content:encoded><![CDATA[<p>Web 上的隐私保护是个让人头疼的问题！已经有激进点儿的人在说，“<a href="http://www.homelandstupidity.us/2006/11/27/privacy-is-dead-get-over-it/" title="Privacy is Dead: Get Over It">Privacy is Dead: Get Over It</a>”。确实，随着计算机存储容量的扩展，以及数据分析能力的提升，我们在 web 上的每个动作，都有可能会被保存下来，被进一步的加工，并被各种形式的应用所利用。</p>
<p>这些大数据的存在，有可能会造成严重的后果，即使初衷是好的。AOL Search Log 事件就是一个鲜活的例子。2006 年 6 月，AOL 实验室发布了一组数据 <a href="http://www.techcrunch.com/2006/08/06/aol-proudly-releases-massive-amounts-of-user-search-data/" title="AOL Proudly Releases Massive Amounts of Private Data">[1]</a>，“<a href="http://www.gregsadetsky.com/aol-data/" title="此乃镜像链接，AOL实验室的数据已经被删除了">500k User Queries Sampled Over 3 Months</a>” （此乃镜像链接，AOL实验室的原始数据已经被删除了）。刚开始，学术界的人们都欢欣鼓舞，如此大量的数据公开出来确实难能可贵，毋庸置疑会有力地促进相关的学术研究 <a href="http://www.nytimes.com/2006/08/23/technology/23search.html?pagewanted=1&amp;ei=5070&amp;en=bc33074f3f99ea1a&amp;ex=1183521600" title="Researchers Yearn to Use AOL Logs, but They Hesitate">[2]</a>。但没多久，就出现了一个大问题，AOL 数据集里面的第 4417749 号用户，被人还原出了真实的身份 <a href="http://www.nytimes.com/2006/08/09/technology/09aol.html?ex=1183521600&amp;en=6ba614ecb88cff46&amp;ei=5070" title="A Face Is Exposed for AOL Searcher No. 4417749">[3]</a>。一下子，舆论哗然，隐私保护组织也开始不遗余力地展开讨伐。最终，此事以 AOL 关闭实验室相关部门，CTO Maureen Govern 被 fire 掉才告一段落。隐私得到了保护，但世界失去了一次进步的机会 <a href="http://glinden.blogspot.com/2006/08/chance-to-play-with-big-data.html" title="a chance to play with big data">[4]</a>！后面的 Netflix Prize 竞赛，也遭遇了<a href="http://hunch.net/?p=303" title="The Netflix Crack">类似的问题</a>，但谢天谢地，这次的影响很小。</p>
<p>而另一方面，基于这些数据所得到的分析结果，无论对个人还是对服务提供商，都有益处。拿我来讲，经常在 Amazon 上面搜索书籍和打分，使得 Amazon 可以向我推销能吸引我的商品；启用了 Google 的搜索历史服务，使得 Google 可以向我提供适合我的搜索结果；向豆瓣贡献着打分数据，使得豆瓣可以帮我找到我会觉得好看的电影。而与此同时，Amazon、Google 甚至是豆瓣，通过大量收集这样的数据，已经建立起了非常高的进入壁垒。后来者由于缺乏这样的数据积累，在类似的服务上也很难再有所超越。</p>
<p>通常情况下，如果你严肃地探讨隐私保护的问题，大多数人也许会发现，这是一个虚幻的命题。大多数人并不见得能够清楚地说明到底在顾虑什么，往往，大家只是担忧而已，甚至仅仅是潜意识型的思维，“我只是不想让别人了解我”。但当我们把问题拉回到现实情况，我们会发现，隐私也许根本不是问题。你在地址栏里主动输入 amazon.com，在 Amazon 的网上超市里面选购商品，下订单并付款，然后给出评价完成交易。Amazon 为我们提供了一种体验很好的服务，我们乐意在 Amazon 上浏览，进行各种活动，看起来 Amazon 似乎有权利使用我们的这些行为数据，提升他们的服务，从而让我们更快乐的购物。因此，虽然 Amazon 记录了我们的一举一动，但并没有人抱怨隐私受到了侵犯。</p>
<p>个性化服务，已经被公认为是下一个十年中的 next big thing 之一，而隐私问题，却一直在困扰着个性化服务的发展。我个人认为，从业人士和相关部门，实在是有必要来共同关注和解决这个问题了。制定相应的行业规范，是非常有必要的，甚至是制定专门的法律都不为过。毕竟，这是一个价值超过10亿$的问题！</p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2008.<br/>
本文网址：<a href="http://www.guwendong.com/post/2008/privacy_and_personalization.html">http://www.guwendong.com/post/2008/privacy_and_personalization.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/privacy" rel="tag">privacy</a>, <a href="http://www.guwendong.com/post/tag/resys" rel="tag">resys</a> | <a href="http://www.guwendong.com/post/2008/privacy_and_personalization.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2008/privacy_and_personalization.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Social Graph 与 Semantic Web</title>
		<link>http://www.guwendong.com/post/2007/social_graph_and_semantic_web.html</link>
		<comments>http://www.guwendong.com/post/2007/social_graph_and_semantic_web.html#comments</comments>
		<pubDate>Sat, 08 Dec 2007 17:10:12 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[三言两语]]></category>
		<category><![CDATA[semantic-web]]></category>
		<category><![CDATA[social]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2007/social_graph_and_semantic_web.html</guid>
		<description><![CDATA[Social Graph，或者称之为 Social Network，最近很是热闹。这自然是拜 MS 与 Facebook 之间 2.4/150 亿美刀 的 big deal 所赐。美国人和中国人其实也没太大的区别，见了花花绿绿的美刀一样是趋之若鹜，拼了老命也要凑个热闹。看 ReadWriteWeb 上的文章，从 Myspace/5.8亿 到 Youtube/16亿 再到如今的 Facebook/150亿，随着价码的提升，热闹程度也在飞速的上升。没办法，谁不爱钱呢？我也爱钱，哈哈。
不过类似的文章读多了也难免审美疲劳，直到看到 Tim Berners-Lee 也出来说话了，才真正刺激我把与此相关的东西，细细地读了一下。收获有一些，但目前还有待梳理。不过，我倒是严重同意 Richard MacManus 对 TimBL 观点的总结，他将网络划分为三个层次：
&#8230; this is how Berners-Lee envisions the 3 levels (a.k.a. layers of abstraction):
1. The Internet: links computers 2. Web: links documents 3. Graph: links relationships between people [...]]]></description>
			<content:encoded><![CDATA[<p>Social Graph，或者称之为 Social Network，最近很是热闹。这自然是拜 MS 与 Facebook 之间 2.4/150 亿美刀 的 big deal 所赐。美国人和中国人其实也没太大的区别，见了花花绿绿的美刀一样是趋之若鹜，拼了老命也要凑个热闹。看 ReadWriteWeb 上的文章，从 Myspace/5.8亿 到 Youtube/16亿 再到如今的 Facebook/150亿，随着价码的提升，热闹程度也在飞速的上升。没办法，谁不爱钱呢？我也爱钱，哈哈。</p>
<p>不过类似的文章读多了也难免审美疲劳，直到看到 <a href="http://www.w3.org/People/Berners-Lee/" title="Tim Berners-Lee">Tim Berners-Lee</a> 也出来<a href="http://dig.csail.mit.edu/breadcrumbs/node/215" title="说话">说话</a>了，才真正刺激我把与此相关的东西，细细地读了一下。收获有一些，但目前还有待梳理。<br />不过，我倒是严重同意 <a href="http://www.readwriteweb.com/archives/social_graph_tim_berners-lee.php" title="Social Graph &amp; Beyond: Tim Berners-Lee&#39;s Graph is The Next Level">Richard MacManus</a> 对 TimBL 观点的总结，他将网络划分为<a href="http://www.w3.org/DesignIssues/Abstractions.html" title="Levels of Abstraction: Net, Web, Graph">三个层次</a>：<br />
<blockquote>&#8230; this is how Berners-Lee envisions the 3 levels (a.k.a. layers of abstraction):
<p>1. The Internet: links computers<br /> 2. Web: links documents<br /> 3. Graph: links relationships between people and/or documents &#8212; &quot;the things documents are about&quot; as Berners-Lee put it.</p>
</blockquote>
<p> 而我个人更倾向于把第 3 层即 Graph 层分开来，这样总共是 4 层。让我们来看一下：<br /> 
<ol>
<li>The Internet: link computers。这个时代诞生了曾经很伟大的 Natscape 公司。</li>
<li>Web: links documents。这个时代诞生了曾经很伟大的 Yahoo! 公司。</li>
<li>Graph: links relationships between documents。这个时代的目标还没有完全实现，但已经诞生了目前还是很伟大的 Google 公司。</li>
<li>Graph: links relationships between people。这个时代会是属于 Facebook 的吗？明白为什么仅仅 link 了 6000 万个用户 relations 的 Facebook 就已经价值 150 亿美刀了吧！他代表了未来的趋势。</li>
</ol>
<p> 当然，如果仅仅是“你 link 我，我 link 他”这样六度空间理论的简单应用，那绝对是远远不够的。每一个时代的每一个伟大的公司，无一例外都是技术上的集大成者！Natscape 开创了浏览器技术，将 HTTP/HTML 推向实用化，让网络漫游成为现实；Yahoo! 开创了基于分类目录的第一代搜索技术，将 Web 技术推向了大规模应用，让浏览网络资料变得非常方便；Google 开创了 以 PageRank 为核心的第二代搜索技术，让用户可以从浩瀚的海量数据中解脱出来，快速准确地检索信息。目前来看，Facebook 最成功的技术创新是通过其 Applicaiton Platform，将原本还局限于企业应用范畴之内的 SOA 技术带入了基于 Web 的新境界。这无疑是非常大的进步！但若仅是如此也许还是不够。正像之前诸如 Lycos、Infoseek 等搜索引擎公司，尽管都曾经非常辉煌过，但一旦 Google Search 这样 Killer 级别的搜索引擎技术出现之后，他们很快就被人淡忘了。Facebook 一样有这样的危险！在这个问题上，我同意 RWW 上 <a href="http://www.readwriteweb.com/archives/why_open_social_matters.php" title="R/WW Thanksgiving: Thank You Google for Open Social (Or, Why Open Social Really Matters)">Alex Iskold 的观点</a>：<br /> <br />
<blockquote>&#8230; The Facebook platform is what made Facebook into &quot;the company&quot; of 2007. If everyone has the platform and not a proprietary, but standard platform, then Facebook&#39;s value shrinks back to the size of its current audience. &#8230; There is a chance that it[Facebook] is going to play the Apple &quot;we are the best and closed&quot; card, but it is a rather small one. &#8230; Consumers are going to recognize that if their social graph is portable and if their attention information is portable in social networks, then it should be portable at large. People are going to demand that their Amazon purchasing history and Netflix rental history is accessible via open API. If that happens, we will effectively enter the age of the attention economy.</p></blockquote>
<p> 援引下面这段 TimBL 关于 Social Graph 与 Semantic Web 技术的总结。我认为，能够打败 Facebook 的，或者说可以使 Facebook 立于不败之地的，应该就是 Semantic Web 这样的技术。<br /> <br />
<blockquote>&#8230; if only we could express these relationships, such as my social graph, in a way that is above the level of documents, then we would get re-use. That&#39;s just what the graph does for us. We have the technology &#8212; it is Semantic Web technology, starting with RDF OWL and SPARQL. Not magic bullets, but the tools which allow us to break free of the document layer. &#8230; If a social network site uses a common format for expressing that I know Dan Brickley, then any other site or program (when access is allowed) can use that information to give me a better service.</p></blockquote>
<p> 毫无疑问，Google 的 <a href="http://code.google.com/apis/opensocial/" title="Open Social">Open Social</a> 是 Facebook 最有力的挑战者，尽管他目前看起来还很不成熟。一直以来，我比较关注 Google 在 Semantic Web 方面的动作，从 2003 年收购 <a href="http://www.appliedsemantics.com/" title="Applied Semantics">Applied Semantics</a>，到大师级人物 <a href="http://norvig.com/" title="Peter Norvig">Peter Norvig</a> 与 TimBL 在 2006 年 <a href="http://aaai.org/Conferences/AAAI/aaai06.php" rel="nofollow">AAAI</a> 会议上关于 Semantic Web 的<a href="http://www.zdnet.com.au/news/software/soa/Google-exec-challenges-Berners-Lee/0,130061733,139263931,00.htm" title="Google exec challenges Berners-Lee">碰撞</a>，再到 <a href="http://norvig.com/" title="Peter Norvig">Peter Norvig</a> 自己对“<a href="http://blogoscoped.com/archive/2005-01-18.html" title="Norvig on the Semantic Web">Semantice Web 可以做什么，不可以做什么</a>”的总结，无不在透露着 Google 一直在 Semantic Web 方面进行着试探。同 <a href="http://blog.donews.com/sayonly/archive/2005/10/28/605465.aspx" title="Google Home Base">Sayonly</a> 一样，我也认为 <a href="http://base.google.com/" title="Google Base">Google Base</a> 是 Google 在 Semantic Web 方向上的一次尝试。而 Open Social 很可能也是 Google 本在密谋着的又一个 Semantic Web 应用，只不过由于 Facebook 的出现打乱了 Google 自己的计划，迫使其不得不匆忙着推出来。</p>
<p> Facebook 与 Open Social 商业上的竞争倒也让人很感兴趣。利益作祟会让貌似强大的 Open Social 瓦解吗？如果 Open Social 真发展的有模有样，Facebook 会加入进来吗？比较极端的是下面这个<a href="http://radar.oreilly.com/archives/2007/11/opensocial_social_mashups.html" title="OpenSocial: It&#39;s the data, stupid">观点</a>，不过我同意！<br /> <br />
<blockquote>Set the data free! Allow social data mashups. That&#39;s what will be the trump card in building the winning social networking platform.</p></blockquote>
<p>罗列一下我个人比较感兴趣的 Social Graph 相关的文章：<br /> 
<ol>
<li>TimBL 的原文：<a href="http://dig.csail.mit.edu/breadcrumbs/node/215" title="Giant Global Graph">Giant Global Graph</a>。</li>
<li><a href="http://www.w3.org/DesignIssues/Abstractions.html" title="Levels of Abstraction: Net, Web, Graph">Levels of Abstraction: Net, Web, Graph</a>。</li>
<li><a href="http://blogs.talis.com/nodalities/2007/11/who_is_afraid_of_the_ggg.php" title="Who is afraid of the GGG?">Social Graph: Concepts and Issues</a>。</li>
<li><a href="http://bradfitz.com/social-graph-problem/" title="Thoughts on the Social Graph">Thoughts on the Social Graph</a>。</li>
<li> 由 TimBL 文章引发的讨论，大部分在这里都可以看到：<a href="http://blogs.talis.com/nodalities/2007/11/who_is_afraid_of_the_ggg.php" title="Who is afraid of the GGG?">Who is afraid of the GGG?</a>。</li>
<li>一个有意思的实验：<a href="http://www.openlinksw.com/blog/%7Ekidehen/?id=1237" title="Injecting Facebook Data into the Semantic Data Web">Injecting Facebook Data into the Semantic Data Web</a>。</li>
</ol>
<p>对 Semantic Web 感兴趣的朋友，可以看看我的《<a href="http://www.guwendong.com/catalog.asp?cate=3" title="Semantic Web系列">Semantic Web系列</a>》文章。</p>
<p> 还有一件可以肯定的事情，http://www.opensocial.com/，这个域名一定会很值钱！^_^</p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2007.<br/>
本文网址：<a href="http://www.guwendong.com/post/2007/social_graph_and_semantic_web.html">http://www.guwendong.com/post/2007/social_graph_and_semantic_web.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/semantic-web" rel="tag">semantic-web</a>, <a href="http://www.guwendong.com/post/tag/social" rel="tag">social</a> | <a href="http://www.guwendong.com/post/2007/social_graph_and_semantic_web.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2007/social_graph_and_semantic_web.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>豆瓣改版</title>
		<link>http://www.guwendong.com/post/2007/douban_new_version.html</link>
		<comments>http://www.guwendong.com/post/2007/douban_new_version.html#comments</comments>
		<pubDate>Tue, 20 Nov 2007 06:23:06 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[三言两语]]></category>
		<category><![CDATA[douban]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2007/douban_new_version.html</guid>
		<description><![CDATA[豆瓣最近比较热闹，首先是用户突破 100 万，接着就是豆瓣改版。而且，豆瓣改版这事儿折腾得还挺猛。作为一个非典型豆瓣用户，绝对意义上改版的好或差，我没法子妄加评论，只不过，实在不希望看到国内互联网常有的口水战污染到豆瓣里来。就我个人来讲，我没贡献过多少有价值的内容给豆瓣，对原来的导航条也没那么深的依赖，因此，我还会继续使用豆瓣。
豆瓣的改版有两点我认同。1、新的导航条相当有意义。当豆瓣用户突破 100 万时，大多数人都忽略了一个小细节——胖子纠正说，“准确的说法叫做豆瓣注册用户突破一百万”。是啊，要知道豆瓣还有大几百万或者上千万的潜水用户呢！改版前，豆瓣好些个特棒的功能都散布在各个功能页面，老豆友们用的是顺溜，可潜水用户却没法子全面了解豆瓣的好。豆瓣也要发展啊！现在这样，把以前藏起来的宝贝拿出来，放在显眼的地方，让大家都看得见，才有可能吸引更多的潜水用户变成注册用户。豆瓣一贯都在认真地为豆友们服务，改版的这点儿小私心，我是很可以理解的。2、将友邻调整到第一个相当正确。正像阿北发布改版消息时说的，我也认为“广播”大大提升了友邻的价值。正是在广播上线后，我突然发现我每天都要上上豆瓣了，不为别的，就为看看友邻们又推荐了哪些内容，或者又发现了什么好书、好电影或是好音乐。对我而言，之前总感觉豆瓣似乎缺乏那么一点儿黏性。我时不时总会有那么一段儿时间，想不起来上豆瓣。分析一下，大致可能是以下原因：对书不是很感兴趣，看过的都是俗不可耐的，:-)，所以豆瓣的书评不太能吸引我；特别喜欢看电影，但说实话，现在有个网站里面的电影资料可能更丰富，而且评论也不差，豆瓣的电影频道也不是我想当然的首选；音乐我倒是天天听，但听来听去，耐我听的总还是那些，比如齐秦。至于小组/论坛之类的，我从0.0到1.0再到2.0，始终都不感冒，只有mop倒是上过不短的一段儿时间，后来也发现没什么意思了，也许是老了。豆瓣广播促使我发生的这个变化，让我很是高兴了一下！今后，友邻作为人肉过滤器的巨大价值，以及9点一套的个性化阅读，将是吸引我每天来豆瓣看看的坚定动力。
豆瓣的两个苗头我认同。1、强化每个用户的个性化内容。豆瓣改版后，首页里的“最受欢迎的”，变成了现在的“你可能关心的”，这个一定要赞一下。倒不是具体的这个变动本身多么令人兴奋，是因为，看到豆瓣坚持不懈地在个性化技术方面进行着探索和实验，让我钦佩不已！在国内，经常可以听到“技术无用论”的调调。我也承认，技术不是万能的，但技术绝对不应该如此被低估。在 Windows 技术诞生前，没人能想到原来我们可以这么简单地使用计算机；在 Internet 技术诞生前，没人能想到原来我们可以这么方便地共享信息；在 Google 诞生之前，没人能想到原来我们可以这么高效地获取知识！不仅仅是在计算机领域，历史已经证明，每一次技术变革，一定伴随着产业的升级，伴随着一个巨大的全新的市场机遇的来临。驾驭不了技术的浪潮，就注定你永远只能随波逐流。我相信技术的力量，我坚信个性化技术是未来最重要的最具创新力的技术领域之一，豆瓣在这个领域的实践，不光对他们自己，对整个中国互联网界，都必将有着重要的意义。2、强化 SNS 的地位，或是转向 SNS 发展。刚在自己之前的 blog 里瞎嚷嚷了几句，“社会化网络，需要走到线下，需要落到实体上！”。没两天就看到了麦田说，
我在网上看到很多讨论社区或web2.0的文章，或长篇大论，或只言片语，但这些文章的作者都信心十足地谈论什么“引爆流行”，什么SNS。坦率的说，我认为这样的讨论和思考，比较肤浅，基本上是连问题都不知道在哪，就给出了“正确答案”。尤其是一些谈“商业模式”，谈“和线下结合”，谈“垂直行业”的文章，每次我看到，总想问问文字后面的那个人：你们知道什么是问题吗？
在这个问题上，被人鄙视了我倒也无所谓，毕竟在社区运营上我不专业，到不了麦田那样作理论研究的高度。我只说我作为使用者的理解。数了数自己在豆瓣上为数不多的几个友邻，还真是绝大多数都实际碰过面，或者至少在Gtalk/MSN上聊过，完全不了解的极少。不知道大家如何看，反正对我来说，加一堆我不了解的人到友邻里，我是认为没太大必要。对于社区，我还有另外一个想法。社区也许应该像钱柜KTV那样运营：大厅最重要的作用就是摆放站方统一提供的食物，让大家知道这里好东西不少；进包间关上门就是我们一小撮儿人独立的空间了，在这里唱歌、打牌、杀人游戏，完全悠游自在，不会互相干扰。这种模式最重要的问题就是我该如何找到适合我的包间呢？这时候，产品/运营都起不了决定作用，就得靠技术——个性化技术。
另外有两点我提点儿意见。1、让个性化来得更猛烈些吧！阿北说老的”一行菜单，两次滚屏”，已经是个不可能的任务。但我觉得未必。我不知道其他豆友在豆瓣上最经常的使用路径是怎样的，反正我个人现在基本上是：从友邻到九点；看评论基本上是第一屏再加上友邻推荐案的；突然关注某本书、某部电影的时候，基本直接使用搜索。这样看来，我只需要“友邻”和“去九点”两个菜单，再周到些，考虑上为豆瓣推广新功能预留一个菜单，3个菜单，完全可以满足我的使用要求。还是之前那样，“一行菜单”，足矣！对潜水用户，使用改版后这样的导航条；对注册用户，进行路径分析，提供个性化导航！想一想，我几乎从未点击过的音乐菜单，你放在那里干吗，当摆设啊，完全可以拿掉，等我有要求了，访问频繁之后，你再自动为我加上。这是个性化发挥效应多好的地方啊！别人我不妄想，豆瓣应该把个性化进行到底，渗入到骨子里！2、广播这个功能的设计，除了现在对于“我的广播”我可以选择“我想把下面这些放到我的广播里”之外，是否可以增加一个功能，让我选择“我想从友邻那里接收下面这些广播”。
最后，发自肺腑地，我要说，“还是把站标放到右边吧”！
无论如何，不断前进的豆瓣，才是更具价值的豆瓣！

© guwendong for Beyond Search, 2007.
本文网址：http://www.guwendong.com/post/2007/douban_new_version.html
tags: douban &#124; 参与讨论
]]></description>
			<content:encoded><![CDATA[<p><a href="http://douban.com/">豆瓣</a>最近比较热闹，首先是<a href="http://blog.douban.com/douban/2007/11/13/96/" title="100万个朋友在一起的豆瓣">用户突破 100 万</a>，接着就是<a href="http://blog.douban.com/douban/2007/11/15/97/" title="新导航，老豆瓣">豆瓣改版</a>。而且，豆瓣改版这事儿折腾得还挺猛。作为一个非典型豆瓣用户，绝对意义上改版的好或差，我没法子妄加评论，只不过，实在不希望看到国内互联网常有的口水战污染到豆瓣里来。就我个人来讲，我没贡献过多少有价值的内容给豆瓣，对原来的导航条也没那么深的依赖，因此，我还会继续使用豆瓣。</p>
<p>豆瓣的改版有两点我认同。<br />1、新的导航条相当有意义。<br />当豆瓣用户突破 100 万时，大多数人都忽略了一个小细节——<a href="http://www.douban.com/people/1000037/" title="胖子">胖子</a>纠正说，“准确的说法叫做豆瓣<b>注册用户</b>突破一百万”。是啊，要知道豆瓣还有大几百万或者上千万的潜水用户呢！改版前，豆瓣好些个特棒的功能都散布在各个功能页面，老豆友们用的是顺溜，可潜水用户却没法子全面了解豆瓣的好。豆瓣也要发展啊！现在这样，把以前藏起来的宝贝拿出来，放在显眼的地方，让大家都看得见，才有可能吸引更多的潜水用户变成注册用户。豆瓣一贯都在认真地为豆友们服务，改版的这点儿小私心，我是很可以理解的。<br />2、将友邻调整到第一个相当正确。<br />正像阿北发布改版消息时说的，我也认为“广播”大大提升了友邻的价值。正是在广播上线后，我突然发现我每天都要上上豆瓣了，不为别的，就为看看友邻们又推荐了哪些内容，或者又发现了什么好书、好电影或是好音乐。对我而言，之前总感觉豆瓣似乎缺乏那么一点儿黏性。我时不时总会有那么一段儿时间，想不起来上豆瓣。分析一下，大致可能是以下原因：对书不是很感兴趣，看过的都是俗不可耐的，:-)，所以豆瓣的书评不太能吸引我；特别喜欢看电影，但说实话，现在有个网站里面的电影资料可能更丰富，而且评论也不差，豆瓣的电影频道也不是我想当然的首选；音乐我倒是天天听，但听来听去，耐我听的总还是那些，比如齐秦。至于小组/论坛之类的，我从0.0到1.0再到2.0，始终都不感冒，只有mop倒是上过不短的一段儿时间，后来也发现没什么意思了，也许是老了。豆瓣广播促使我发生的这个变化，让我很是高兴了一下！今后，友邻作为人肉过滤器的巨大价值，以及9点一套的个性化阅读，将是吸引我每天来豆瓣看看的坚定动力。</p>
<p>豆瓣的两个苗头我认同。<br />1、强化每个用户的个性化内容。<br />豆瓣改版后，首页里的“最受欢迎的”，变成了现在的“你可能关心的”，这个一定要赞一下。倒不是具体的这个变动本身多么令人兴奋，是因为，看到豆瓣坚持不懈地在个性化技术方面进行着探索和实验，让我钦佩不已！在国内，经常可以听到“技术无用论”的调调。我也承认，技术不是万能的，但技术绝对不应该如此被低估。在 Windows 技术诞生前，没人能想到原来我们可以这么简单地使用计算机；在 Internet 技术诞生前，没人能想到原来我们可以这么方便地共享信息；在 Google 诞生之前，没人能想到原来我们可以这么高效地获取知识！不仅仅是在计算机领域，历史已经证明，每一次技术变革，一定伴随着产业的升级，伴随着一个巨大的全新的市场机遇的来临。驾驭不了技术的浪潮，就注定你永远只能随波逐流。我相信技术的力量，我坚信个性化技术是未来最重要的最具创新力的技术领域之一，豆瓣在这个领域的实践，不光对他们自己，对整个中国互联网界，都必将有着重要的意义。<br />2、强化 SNS 的地位，或是转向 SNS 发展。<br />刚在自己之前的 blog 里瞎嚷嚷了几句，“<a href="http://www.guwendong.com/post/2007/site_librarything_com.html" title="个性化站点：LibraryThing.com">社会化网络，需要走到线下，需要落到实体上！</a>”。没两天就看到了<a href="http://maitian.blog.techweb.com.cn/archives/2007/20071117172041.shtml" title="豆瓣改版引发热议的冷思考">麦田说</a>，
<div style="margin-left:40px">我在网上看到很多讨论社区或web2.0的文章，或长篇大论，或只言片语，但这些文章的作者都信心十足地谈论什么“引爆流行”，什么SNS。坦率的说，我认为这样的讨论和思考，比较肤浅，基本上是连问题都不知道在哪，就给出了“正确答案”。尤其是一些谈“商业模式”，谈“和线下结合”，谈“垂直行业”的文章，每次我看到，总想问问文字后面的那个人：你们知道什么是问题吗？</div>
<p>在这个问题上，被人鄙视了我倒也无所谓，毕竟在社区运营上我不专业，到不了麦田那样作理论研究的高度。我只说我作为使用者的理解。数了数自己在豆瓣上为数不多的几个友邻，还真是绝大多数都实际碰过面，或者至少在Gtalk/MSN上聊过，完全不了解的极少。不知道大家如何看，反正对我来说，加一堆我不了解的人到友邻里，我是认为没太大必要。对于社区，我还有另外一个想法。社区也许应该像钱柜KTV那样运营：大厅最重要的作用就是摆放站方统一提供的食物，让大家知道这里好东西不少；进包间关上门就是我们一小撮儿人独立的空间了，在这里唱歌、打牌、杀人游戏，完全悠游自在，不会互相干扰。这种模式最重要的问题就是我该如何找到适合我的包间呢？这时候，产品/运营都起不了决定作用，就得靠技术——个性化技术。</p>
<p>另外有两点我提点儿意见。<br />1、让个性化来得更猛烈些吧！<br />阿北说老的”一行菜单，两次滚屏”，已经是个<a href="http://www.douban.com/subject/1292484/">不可能的任务</a>。但我觉得未必。我不知道其他豆友在豆瓣上最经常的使用路径是怎样的，反正我个人现在基本上是：从友邻到九点；看评论基本上是第一屏再加上友邻推荐案的；突然关注某本书、某部电影的时候，基本直接使用搜索。这样看来，我只需要“友邻”和“去九点”两个菜单，再周到些，考虑上为豆瓣推广新功能预留一个菜单，3个菜单，完全可以满足我的使用要求。还是之前那样，“一行菜单”，足矣！对潜水用户，使用改版后这样的导航条；对注册用户，进行路径分析，提供个性化导航！想一想，我几乎从未点击过的音乐菜单，你放在那里干吗，当摆设啊，完全可以拿掉，等我有要求了，访问频繁之后，你再自动为我加上。这是个性化发挥效应多好的地方啊！别人我不妄想，豆瓣应该把个性化进行到底，渗入到骨子里！<br />2、广播这个功能的设计，除了现在对于“我的广播”我可以选择“我想把下面这些放到我的广播里”之外，是否可以增加一个功能，让我选择“我想从友邻那里接收下面这些广播”。</p>
<p>最后，发自肺腑地，我要说，“还是把站标放到右边吧”！</p>
<p>无论如何，不断前进的豆瓣，才是更具价值的豆瓣！</p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2007.<br/>
本文网址：<a href="http://www.guwendong.com/post/2007/douban_new_version.html">http://www.guwendong.com/post/2007/douban_new_version.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/douban" rel="tag">douban</a> | <a href="http://www.guwendong.com/post/2007/douban_new_version.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2007/douban_new_version.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
