<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Beyond Search</title>
	<atom:link href="http://www.guwendong.com/feed" rel="self" type="application/rss+xml" />
	<link>http://www.guwendong.com</link>
	<description>最好走的路越走越难，最难走的路越走越容易</description>
	<lastBuildDate>Fri, 30 Jul 2010 06:20:14 +0000</lastBuildDate>
	
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>让网络，更简单！</title>
		<link>http://www.guwendong.com/post/2010/cutt.html</link>
		<comments>http://www.guwendong.com/post/2010/cutt.html#comments</comments>
		<pubDate>Sun, 25 Jul 2010 15:45:47 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[未分类]]></category>
		<category><![CDATA[cutt]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/?p=358</guid>
		<description><![CDATA[
个性化，是解决信息过载问题的终极途径，但绝不是终南捷径，这条道路上的第一站应该是：信息过滤器。
 2009 年，美国电影与中国电影的总产量超过了 1000 部，刨去滥竽充数混水摸鱼的，怎么也还得有两三百部要挑一挑。在《疯狂的赛车》上映之前，一个电影达人朋友向我大肆鼓吹，我去看了，结果发现也就那么回事儿。大家是不是也经常遇到类似的状况？我想答案一定是肯定的。要给出高满意度的有效推荐，是很复杂的一件事情，这你懂的。但如果我们换一个角度，朋友告诉我，《谍海风云》是一颗雷，你千万不要踩，我通常就绝对不会再自找没趣了，这很有效。
 因此，我非常同意 Clay Shirky 的提法，“不是信息太多了，是过滤失效了”。
 互联网从根本上改变了信息流动的方式，使得围绕信息展开的互动更加具有效率。它从本质上是鼓励分享的，也就必然会引发信息生产的暴增。可以有很多角度解读互联网的发展历程，但依信息获取延展开的这条线路上，诞生了诸多伟大的公司，绝对不容忽视。起初是以 Yahoo 为代表的导航及门户，然后发展到以 Google 为代表的搜索引擎，再到目前最火热的以 Twitter 与 Facebook 为代表的社会化网络，互联网不断地在拓宽我们接触信息的视野，改变我们获取信息的方式。信息选择权向用户方转移，信息传递链条更趋直接，是这条线路的精髓。
 有一种观点认为，Twitter 引领的“关注/Follow”模型，帮助用户撇开了多余的羁绊，将核心直抵感兴趣的信息。这种设置，将信息选择权交给了用户，用户能看到哪些信息，完全取决于他关注了哪些人，或者抽象些讲就是，关注了哪些信息源。但是，这种方式也有明显的不足，新用户需要从一穷二白开始，手工的一个个筛选出他需要关注的对象，这个过程很杯具。即使对老用户而言，要扩展到一个新的兴趣领域，或者是寻找新的关注对象，也是相当费时费力的。
 在 Twitter 之前，RSS 也曾经被赋予厚望。Google Reader 确实做得很好了，但我作为一个重度用户，每天打开那个始终标着 1000+ 的列表，飞快地扫过标题，试图以最小的代价拣出那些我有兴趣阅读的条目，同时又忐忑不安地担心会漏掉点儿什么。这很崩溃，这绝对不是消费信息的正确体验。
 无论是 Twitter 的关注，还是 RSS 的订阅，一个共同的问题是信息组织的粒度太过粗旷。我虽然是个足球迷，但我是在李大眼停写中国足球之后，才订阅了他的博客和微博，如果他日后再又絮叨起中国足球这项名字虽然叫足球但却完全和足球没有一毛钱关系的令人闹心的运动，我立刻就会退掉他。
 截止目前，搜索引擎是获取信息最直接的工具，然而它仅是数据层面的一种组织，用 Tim Berners-Lee 的定义来讲就是“it links documents”，用户要，它才给，并且还无法知道给的“是什么”。下一代的信息处理引擎，必须具备理解语义的能力，“It&#8217;s not the documents &#8212; It&#8217;s the things”！这里的 things，针对的就是信息层面。我是基因方法的拥护者，比如 Pandora 的音乐基因工程，比如 Jinni 的电影基因工程。信息同样是具有基因的，核心基因是，“主题——在讲什么”。基因方法有诸多好处，像稳定性、可衍生性以及良好的可解释性，但我最看重的，它是一种令人激动的探险，尝试着让机器以模拟人类的方式去理解信息。这非常有挑战。
 根本需要，是兴趣。我不感兴趣的，就不要来纠缠我。我们希望有这样一种方式：你只需要表明自己的兴趣，然后通过群体智慧与机器运算，让信息找到你。


 让网络，更简单！我们还很小，我们还很简陋，我们才刚上路。

请朋友们猛给反馈：wendell.gu # gmail.com
如果愿意写 [...]]]></description>
			<content:encoded><![CDATA[<p>
<img id="mjk." src="http://docs.google.com/File?id=ddjqwpms_616gbt9vxds_b" style="float: right; height: 160px; margin-left: 1em; margin-right: 0px; width: 240px;">个性化，是解决信息过载问题的终极途径，但绝不是终南捷径，这条道路上的第一站应该是：信息过滤器。</p>
<p> 2009 年，美国电影与中国电影的总产量超过了 1000 部，刨去滥竽充数混水摸鱼的，怎么也还得有两三百部要挑一挑。在《疯狂的赛车》上映之前，一个电影达人朋友向我大肆鼓吹，我去看了，结果发现也就那么回事儿。大家是不是也经常遇到类似的状况？我想答案一定是肯定的。要给出高满意度的有效推荐，是很复杂的一件事情，这你懂的。但如果我们换一个角度，朋友告诉我，《谍海风云》是一颗雷，你千万不要踩，我通常就绝对不会再自找没趣了，这很有效。</p>
<p> 因此，我非常同意 <a href="http://web2expo.blip.tv/file/1277460/" target="_blank" id="gi9c" title="Web 2.0 Expo NY: Clay Shirky (shirky.com) It's Not Information Overload. It's Filter Failure.">Clay Shirky</a> 的提法，“不是信息太多了，是过滤失效了”。</p>
<p> 互联网从根本上改变了信息流动的方式，使得围绕信息展开的互动更加具有效率。它从本质上是鼓励分享的，也就必然会引发信息生产的暴增。可以有很多角度解读互联网的发展历程，但依信息获取延展开的这条线路上，诞生了诸多伟大的公司，绝对不容忽视。起初是以 Yahoo 为代表的导航及门户，然后发展到以 Google 为代表的搜索引擎，再到目前最火热的以 Twitter 与 Facebook 为代表的社会化网络，互联网不断地在拓宽我们接触信息的视野，改变我们获取信息的方式。信息选择权向用户方转移，信息传递链条更趋直接，是这条线路的精髓。</p>
<p> 有一种观点认为，Twitter 引领的“<b>关注/Follow</b>”模型，帮助用户撇开了多余的羁绊，将核心直抵感兴趣的信息。这种设置，将信息选择权交给了用户，用户能看到哪些信息，完全取决于他关注了哪些人，或者抽象些讲就是，关注了哪些信息源。但是，这种方式也有明显的不足，新用户需要从一穷二白开始，手工的一个个筛选出他需要关注的对象，这个过程很杯具。即使对老用户而言，要扩展到一个新的兴趣领域，或者是寻找新的关注对象，也是相当费时费力的。</p>
<p> 在 Twitter 之前，RSS 也曾经被赋予厚望。Google Reader 确实做得很好了，但我作为一个重度用户，每天打开那个始终标着 1000+ 的列表，飞快地扫过标题，试图以最小的代价拣出那些我有兴趣阅读的条目，同时又忐忑不安地担心会漏掉点儿什么。这很崩溃，这绝对不是消费信息的正确体验。</p>
<p> 无论是 Twitter 的关注，还是 RSS 的订阅，一个共同的问题是信息组织的粒度太过粗旷。我虽然是个足球迷，但我是在李大眼停写中国足球之后，才订阅了他的博客和微博，如果他日后再又絮叨起中国足球这项名字虽然叫足球但却完全和足球没有一毛钱关系的令人闹心的运动，我立刻就会退掉他。</p>
<p> 截止目前，搜索引擎是获取信息最直接的工具，然而它仅是数据层面的一种组织，用 <a href="http://www.w3.org/People/Berners-Lee/" id="ehpu" title="Tim Berners-Lee" target="_blank">Tim Berners-Lee</a> 的<a href="http://www.w3.org/DesignIssues/Abstractions.html" id="ptcp" title="Levels of Abstraction: Net, Web, Graph" target="_blank">定义</a>来讲就是“it links documents”，用户要，它才给，并且还无法知道给的“是什么”。下一代的信息处理引擎，必须具备理解语义的能力，“It&#8217;s not the documents &#8212; It&#8217;s the things”！这里的 things，针对的就是信息层面。我是基因方法的拥护者，比如 Pandora 的<a href="http://www.pandora.com/mgp.shtml" id="yx2:" title="Music Genome Project" target="_blank">音乐基因工程</a>，比如 Jinni 的<a href="http://www.jinni.com/movie-genome.html" id="tfij" title="Movie Genome Project" target="_blank">电影基因工程</a>。信息同样是具有基因的，核心基因是，“主题——在讲什么”。基因方法有诸多好处，像稳定性、可衍生性以及良好的可解释性，但我最看重的，它是一种令人激动的探险，尝试着让机器以模拟人类的方式去理解信息。这非常有挑战。</p>
<p> 根本需要，是兴趣。我不感兴趣的，就不要来纠缠我。我们希望有这样一种方式：你只需要表明自己的兴趣，然后通过群体智慧与机器运算，让信息找到你。</p>
<div id="i_-." style="text-align: left;"><a href="http://www.cutt.com/" target="_blank" title="简网"><img src="http://docs.google.com/File?id=ddjqwpms_629dnjzkfhq_b" style="height: 60px; width: 150px;" title="简网"></a></div>
<p>
 让网络，更简单！我们还很小，我们还很简陋，我们<a href="http://www.cutt.com/" id="i5j9" title="简网" target="_blank">才刚上路</a>。</p>
<hr />
<br />请朋友们猛给反馈：wendell.gu # gmail.com<br />
如果愿意写 blog 交流的朋友那就更欢迎了，你放心地写，我一定看得到！</p>
<p><b style="color: rgb(204, 0, 0);">感谢朋友支持：</b></p>
<ol>
<li>阿稳，<a href="http://www.wentrue.net/blog/?p=995" title="follow人，还是follow内容" target="_blank">follow人，还是follow内容</a>；</li>
<li>郑昀，<a href="http://www.cnblogs.com/zhengyun_ustc/archive/2010/07/27/cutt.html" title="关于Cutt.com关于Topic Engine" target="_blank">关于Cutt.com关于Topic Engine</a>；</li>
<li>项亮，<a href="http://xlvector.net/blog/?p=585" title="用TOPIC组织你的兴趣" target="_blank">用TOPIC组织你的兴趣</a>。</li>
</ol>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2010.<br/>
本文网址：<a href="http://www.guwendong.com/post/2010/cutt.html">http://www.guwendong.com/post/2010/cutt.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/cutt" rel="tag">cutt</a> | <a href="http://www.guwendong.com/post/2010/cutt.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2010/cutt.html/feed</wfw:commentRss>
		<slash:comments>33</slash:comments>
		</item>
		<item>
		<title>Google Matrix</title>
		<link>http://www.guwendong.com/post/2010/google_matrix.html</link>
		<comments>http://www.guwendong.com/post/2010/google_matrix.html#comments</comments>
		<pubDate>Tue, 27 Apr 2010 11:52:15 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[三言两语]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[personalization]]></category>
		<category><![CDATA[privacy]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/?p=354</guid>
		<description><![CDATA[Google 退出中国事件发生之后，来自木遥同学的一篇文字，让我不能同意更多！其中有这么一段，
这个「国家（指 Google）」是网络世界中的第一个霸权，它可以控制数据和知识的流通，影响人类的所见所闻乃至精神世界的每个方面；它握有大量个人隐私信息，并且具有无可撼动的垄断地位；它在许多场合起到的已经是近乎可以类比于公权力的作用。而另一方面，它只是一家私有公司，没有任何方式可以从外部对它合法的控制力进行监督和制约。它当然也许确实会始终尽量不干预搜索排名，小心翼翼地维护互联网的自由和公正，但这只是它自己的道义承诺而已，而我们甚至想不出什么办法来验证这一点。
木遥的整篇文字非常中肯，但若单独摘引这一段，则是典型的“断章取义”。同一段文字，放在木遥的全文里看与单独看此段，差不多会造成两种理解，作语义的同学想必对此有深刻体会，这就是 Context（上下文）的作用。
在 Personalization 方面，亦是如此 —— Context 非常重要！
 春节前，kuber 在 Resys Group 里发起了一个讨论，“基于SNS/Lifestream的推荐”，提到了 Google 近期的一些动作。其实长久以来，在个性化领域，Google 一直在下一盘很大的棋！看看他的布局吧。


Personalized new tab page
 这个是2009年1月 Google Toolbar 推出的一个 feature，当你打开 Firefox 时，不再只是看到一个空白 tab 页，Google 会根据你的浏览历史，为你定制一个个性化 tab，包含你最常用的一些站点或页面。这个已经是新一代浏览器的标配了。

Interested-based Ads
 传统的 Adsense 广告，是根据与网页内容的相关度进行展示的，与浏览者本身的兴趣无关。2009年3月 Google 推出了这种基于用户兴趣的广告，浏览者看到的不再仅是与内容相关的广告，而是与其本身兴趣相符的广告。至于用户兴趣哪里来的？抛开搜索记录不说，遍布互联网的 Analytics 和 Adsense 脚本本身，就能干不少事情了。

Personalized keyword-suggestions
 尽管这个搜索提示功能没少给谷歌找麻烦，但 Google 显然认为这个东东对用户是有益的，尤其是对登录之后的搜索用户。当用户登录了 Google 帐号，并启用了 Web History 功能之后，搜索提示会把你最近频繁使用的几个关键字显示给你，这对搜索到一半被打断回头又想继续的用户来说体验很好。当然了，谷歌用户自然是无缘使用的。

Google Reader by Personalized Ranking
 个性化的信息阅读，是用户长久以来的心声，久觅未果不少人甚至已经开始自己动手实现。2009年10月，Google [...]]]></description>
			<content:encoded><![CDATA[<p>Google 退出中国事件发生之后，来自<a href="http://blog.farmostwood.net/441.html" id="pla2" title="我们为什么信息 Google？">木遥</a>同学的一篇文字，让我不能同意更多！其中有这么一段，</p>
<blockquote><p>这个「国家（指 Google）」是网络世界中的第一个霸权，它可以控制数据和知识的流通，影响人类的所见所闻乃至精神世界的每个方面；它握有大量个人隐私信息，并且具有无可撼动的垄断地位；它在许多场合起到的已经是近乎可以类比于公权力的作用。而另一方面，它只是一家私有公司，没有任何方式可以从外部对它合法的控制力进行监督和制约。它当然也许确实会始终尽量不干预搜索排名，小心翼翼地维护互联网的自由和公正，但这只是它自己的道义承诺而已，而我们甚至想不出什么办法来验证这一点。</p></blockquote>
<p>木遥的整篇文字非常中肯，但若单独摘引这一段，则是典型的“断章取义”。同一段文字，放在木遥的全文里看与单独看此段，差不多会造成两种理解，作语义的同学想必对此有深刻体会，这就是 Context（上下文）的作用。</p>
<p><b>在 Personalization 方面，亦是如此 —— Context 非常重要！</b></p>
<p> 春节前，<a href="http://www.cnblogs.com/kuber" id="dak7" title="kuber">kuber</a> 在 <a href="http://groups.google.com.hk/group/resys/" id="bum2" title="Resys Group">Resys Group</a> 里发起了一个讨论，“<a href="http://groups.google.com.hk/group/resys/browse_thread/thread/59eb4cc3b0fe20f7#" id="al23" title="基于SNS/Lifestream的推荐">基于SNS/Lifestream的推荐</a>”，提到了 Google 近期的一些动作。其实长久以来，在个性化领域，Google 一直在下一盘很大的棋！看看他的布局吧。</p>
<p><img src="http://docs.google.com/File?id=ddjqwpms_590c6cg7ggb_b" style="float:right;height:240px;margin-left:1em;margin-right:0px;width:320px"></p>
<ol>
<li><a href="http://googleblog.blogspot.com/2009/01/google-toolbar-in-firefox-personalized.html" id="yq3z" title="Google Toolbar in Firefox: a personalized new tab page">Personalized new tab page</a><br />
 这个是2009年1月 Google Toolbar 推出的一个 feature，当你打开 Firefox 时，不再只是看到一个空白 tab 页，Google 会根据你的浏览历史，为你定制一个个性化 tab，包含你最常用的一些站点或页面。这个已经是新一代浏览器的标配了。</p>
</li>
<li><a href="http://googleblog.blogspot.com/2009/03/making-ads-more-interesting.html" id="cjc7" title="Making ads more interesting">Interested-based Ads</a><br />
 传统的 Adsense 广告，是根据与网页内容的相关度进行展示的，与浏览者本身的兴趣无关。2009年3月 Google 推出了这种基于用户兴趣的广告，浏览者看到的不再仅是与内容相关的广告，而是与其本身兴趣相符的广告。至于用户兴趣哪里来的？抛开搜索记录不说，遍布互联网的 Analytics 和 Adsense 脚本本身，就能干不少事情了。</p>
</li>
<li><a href="http://googleblog.blogspot.com/2009/05/faster-is-better-on-google-suggest.html" id="luua" title="Faster is better on Google Suggest">Personalized keyword-suggestions</a><br />
 尽管这个搜索提示功能没少给谷歌<a href="http://www.google.org.cn/posts/why-google-search-suggeest-shows-lots-of-porn-content.html" id="gtt:" title="转：为什么在 Google 搜索儿子，搜索建议会出现大量低俗内容">找麻烦</a>，但 Google 显然认为这个东东对用户是有益的，尤其是对登录之后的搜索用户。当用户登录了 Google 帐号，并启用了 Web History 功能之后，搜索提示会把你最近频繁使用的几个关键字显示给你，这对搜索到一半被打断回头又想继续的用户来说体验很好。当然了，<a href="http://www.google.org.cn/posts/google-china-music-using-windows-live-id-save-your-music-list.html" id="rddj" title="谷歌音乐杯具的可以用微软 Windows Live ID 账户登陆保存播放列表了">谷歌用户</a>自然是无缘使用的。</p>
</li>
<li><a href="http://googleblog.blogspot.com/2009/10/reading-gets-personal-with-popular.html" id="wrp2" title="Reading gets personal with Popular items and Personalized ranking">Google Reader by Personalized Ranking</a><br />
 个性化的信息阅读，是用户长久以来的心声，久觅未果不少人甚至已经开始自己<a href="http://www.guwendong.com/post/2009/greader_share.html" id="fja9" title="怎样利用 GReader Share 数据？">动手实现</a>。2009年10月，Google Reader 对在这方面的官方支持终于千呼万唤始出来。最吸引眼球的是新增的“Sort by magic”排序功能，它综合考虑用户的阅读历史，包括 Trends、Start、Share 以及 Like 等，将待阅读的内容进行个性化地排序。这对动辄 1000+ 未读条目的用户来讲，绝对是个福音，就我个人的使用体验来看，效果相当不错。</p>
</li>
<li><a href="http://glinden.blogspot.com/2009/10/google-ceo-on-personalized-news.html" id="rk3r" style="color:#551a8b" title="Google CEO on personalized news">Google News Personalization</a><br />
 2009年10月，Google CEO Eric Schmidt 在接受采访的时候说，“想像这样一个媒体：它知道你是谁，知道你喜欢什么，知道你看过哪些新闻，它能够评价你是否喜欢正在阅读的文章，还能够专门挑出你感兴趣的广告&#8230;”——科技是多么的伟大！但也有用户说了，“靠！这简直是阿鼻地狱啊，还是麻溜地不要再用 Google 服务了”，杯具啊！</p>
</li>
<li><a href="http://googleblog.blogspot.com/2009/12/personalized-search-for-everyone.html" id="y-lu" title="Personalized Search for everyone">Personalized Search</a><br />
 Google CEO&nbsp;<a href="http://www.techcrunch.com/2009/09/03/google-ceo-eric-schmidt-on-the-future-of-search-connect-it-straight-to-your-brain/" id="oo8x" title="Google CEO Eric Schmidt On The Future Of Search: “Connect It Straight To Your Brain”">Eric Schmidt</a>&nbsp;和<a href="http://www.daniweb.com/news/story220007.html" id="v-hf" style="color:#551a8b" title="Google's Mayer Predicts Personalization Is Key to Future Search">美女总裁</a>都说了，“搜索的未来要靠个性化”！目前，基于关键字的搜索，无疑已经成为帮助用户从信息海洋中寻找内容的重要手段，但互联网暴长的数据容量其实让 Google 也很头大。搜索引擎通过长期分析用户的搜索行为，可以感知用户的意图，从而在特定范围内完成搜索，有效地提高搜索效率，增强用户粘性。有关 Google 个性化搜索更详尽的资料，可以参考<a href="http://www.huomah.com/Search-Engines/Search-Engine-Optimization/The-SEO-guide-to-Google-personalized-search.html" id="s_3r" title="The SEO guide to Google personalized search">这里</a>，另外 Resys 里也有过一次热烈的<a href="http://groups.google.com.hk/group/resys/browse_thread/thread/9b8fdec17741cc26/21a2a8e9e0bec63e" id="x27o" title="多特征的推荐系统">讨论</a>。</p>
</li>
<li><a href="http://gmailblog.blogspot.com/2010/01/serving-better-ads-in-gmail.html" id="wl7l" title="Serving better ads in Gmail">Personalized Gmail Ads<br />
</a>从 Gmail 诞生的第一天，它就是贴着小广告的。这个事情之前差点犯了众怒，后来 Google 保证仅展示“Family-Safe”的广告，并<a href="http://mail.google.com/mail/help/intl/en_GB/more.html" id="h31-" title="More on Google Mail and privacy">许诺</a>说，“Ads and links to related pages <font class="Apple-style-span"><span class="Apple-style-span" style="background-color:#e06666">only</span></font> appear alongside the message that they are targeted to, and are&nbsp;<font class="Apple-style-span"><span class="Apple-style-span" style="background-color:#e06666">only</span></font> shown when the Google Mail user, whether sender or recipient, is viewing that particular message.”。现在，Google 在标红的“only”前面加入了一个“not”。<a href="http://www.guwendong.com/post/2008/privacy_and_personalization.html" id="i46j" title="隐私问题与个性化服务">隐私问题与个性化服务</a>的矛盾由来已久，这个事情我认为解决方案和 Google 退出中国的诉求是一致的，只要有法可依即可。关于 Gmail 里的广告，这里有一枚<a href="http://groups.google.com.hk/group/resys/browse_thread/thread/c7c223e79eb06afd" id="oj1g" title="杯具">杯具</a>，欢迎围观。</p>
</li>
<li><a href="http://googleblog.blogspot.com/2010/02/introducing-google-buzz.html" id="xm4l" title="Google Buzz">Google Buzz</a><br />
 Buzz 在这事儿上毫不含糊，直接就说了，“Buzz recommends interesting posts and weeds out ones you&#8217;re likely to skip.”。为了验证 Google 的这个说法，我正在戒推进行中，全力使用 Buzz，看它能不能给我带来什么惊喜。就目前的体验来讲，我基本上是可耻的失败鸟。</p>
</li>
<li><a href="http://googleblog.blogspot.com/2009/11/google-friend-connect-now-more.html" id="b58y" title="Google Friend Connect, now more personalized">Google Friend Connect</a><br />
 Boss 总是最后出场！但人生就像一个茶几，你永远不知道下一个被放上来的是哪枚杯具。Facebook 新近发布的&nbsp;<a href="http://blog.facebook.com/blog.php?post=383404517130" id="brbi" title="Building the Social Web Together">Open Graph</a>，有很大机会把擅长把别人搞成杯具的 Google 搞成彻头彻尾的杯具帝，让我们拭目以待吧！
</li>
</ol>
<p>
<img src="http://docs.google.com/File?id=ddjqwpms_587c9wcw9dj_b" style="height:443px;width:600px"><br />
 图片<a href="http://www.huomah.com/Search-Engines/Search-Engine-Optimization/The-SEO-guide-to-Google-personalized-search.html" id="sak1" title="The SEO guide to Google personalized search">来源</a></p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2010.<br/>
本文网址：<a href="http://www.guwendong.com/post/2010/google_matrix.html">http://www.guwendong.com/post/2010/google_matrix.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/google" rel="tag">google</a>, <a href="http://www.guwendong.com/post/tag/personalization" rel="tag">personalization</a>, <a href="http://www.guwendong.com/post/tag/privacy" rel="tag">privacy</a> | <a href="http://www.guwendong.com/post/2010/google_matrix.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2010/google_matrix.html/feed</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>又闻夜半翻墙声</title>
		<link>http://www.guwendong.com/post/2010/xi_xiang_plan.html</link>
		<comments>http://www.guwendong.com/post/2010/xi_xiang_plan.html#comments</comments>
		<pubDate>Thu, 11 Mar 2010 17:23:47 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[未分类]]></category>
		<category><![CDATA[fuckgfw]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/?p=347</guid>
		<description><![CDATA[《西厢记》是我国家喻户晓的古典戏剧名著，其主人公张生有一首著名的爱情诗：
月色溶溶夜，花阴寂寂春；
如何临皓魄，不见月中人？
张生夜半翻墙与莺莺小姐幽会，冲破封建礼教的禁锢追求自由恋爱，已成了千古佳话。
幸福与自由要靠我们每个人自己的行动。
要不，等到未来，后代会嘲笑我们这些没用的家伙，就象我们说别人“你怎么不反抗？”
参考资料：

http://xiaogaozi.blogspot.com/2010/03/ubuntu.html
http://blog.youxu.info/2010/03/14/west-chamber/
http://blog.devep.net/virushuo/2010/03/15/post_71.html


© guwendong for Beyond Search, 2010.
本文网址：http://www.guwendong.com/post/2010/xi_xiang_plan.html
tags: fuckgfw &#124; 参与讨论
]]></description>
			<content:encoded><![CDATA[<p>《西厢记》是我国家喻户晓的古典戏剧名著，其主人公张生有一首著名的爱情诗：</p>
<blockquote><p>月色溶溶夜，花阴寂寂春；</p>
<p>如何临皓魄，不见月中人？</p></blockquote>
<p>张生夜半翻墙与莺莺小姐幽会，冲破封建礼教的禁锢追求自由恋爱，已成了千古佳话。</p>
<p>幸福与自由要靠我们每个人自己的行动。</p>
<p><a title="西厢计划" href="http://gfwrev.blogspot.com/2010/03/blog-post.html" target="_blank">要不，等到未来，后代会嘲笑我们这些没用的家伙，就象我们说别人“你怎么不反抗？”</a></p>
<p>参考资料：</p>
<ol>
<li><a title="&quot;西厢计划&quot;Ubuntu安装配置指南" href="http://xiaogaozi.blogspot.com/2010/03/ubuntu.html" target="_blank">http://xiaogaozi.blogspot.com/2010/03/ubuntu.html</a></li>
<li><a title="“西厢计划”原理小解" href="http://blog.youxu.info/2010/03/14/west-chamber/" target="_blank">http://blog.youxu.info/2010/03/14/west-chamber/</a></li>
<li><a title="&quot;原理小解&quot;读后感" href="http://blog.devep.net/virushuo/2010/03/15/post_71.html" target="_blank">http://blog.devep.net/virushuo/2010/03/15/post_71.html</a></li>
</ol>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2010.<br/>
本文网址：<a href="http://www.guwendong.com/post/2010/xi_xiang_plan.html">http://www.guwendong.com/post/2010/xi_xiang_plan.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/fuckgfw" rel="tag">fuckgfw</a> | <a href="http://www.guwendong.com/post/2010/xi_xiang_plan.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2010/xi_xiang_plan.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Early Amazon: The first week</title>
		<link>http://www.guwendong.com/post/2010/early_amazon_1.html</link>
		<comments>http://www.guwendong.com/post/2010/early_amazon_1.html#comments</comments>
		<pubDate>Wed, 10 Mar 2010 15:17:10 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[好文收藏]]></category>
		<category><![CDATA[amazon]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/?p=342</guid>
		<description><![CDATA[原文链接：http://glinden.blogspot.com/2006/01/early-amazon-first-week.html
 原文作者 Greg Linden 毕业于华盛顿大学计算机学院，1997 年加入 Amazon，领导开发了享誉业界的 Amazon 推荐引擎。
 著名的 Item-based 推荐算法的提出者之一；Findory.com 创始人。
 其 Blog &#8211; Geeking with Greg 是个性化推荐领域最有影响力的博客（没有之一）。 

 1997 年初的亚马逊公司，邋遢、混沌、但令人兴奋。

 亚马逊公司位于美国西雅图市，办公室在第二大道的哥伦比亚大厦里，这是一座砖体结构的建筑物，已经有些年头了，离派克市场不远。从办公室的窗户望出去感觉 还不错，有一个本地的美沙酮诊所，还有一个贩卖怪诞假发的商店。你甚至隐约可以看见一些脱衣舞俱乐部，它们就藏在几个街区远的地方。插播八卦：派克市场有一个著名的 Athenian 餐厅，传世经典爱情影片《西雅图夜未眠》中，汤大哥就是在这里泡梅甜心的。
 当然了，我现在还只是一个眨巴着大眼睛的刚刚研究生毕业的菜鸟，还不敢奢望有这样一个靠窗的工位。
 我的工位在厨房。在亚马逊公司，空间从来都是一种奢侈，那个时候自然也是这样。报到的那天，我被领到我的办公室——一张安装在厨房角落里的牌桌，上面放着一台 PC。
 在厨房办公还是着实有些乐趣的。在亚马逊，我几乎什么人都不认识，大多数同事都沉浸在无聊的窃窃私语之中。不过，他们倒经常会到离我不远的柜台上去取茶和咖啡。我弄了一个糖果瓶——嗯，免费的——尽力和他们搞关系，以求套出些什么来。
 我的第一项任务是开始学习代码库。打开一个 shell 窗口，调出 emacs，然后开始阅读代码。我花了一些天来跟踪针对不同 URL 的分发器，研究 ol&#8217; obidos ——一个用来支持 Amazon 网站运转的大型 CGI 程序——是怎样漂亮地处理不同的请求，主页，书籍详情页，搜索，购物车，以及订单流转。至今，大多数亚马逊 URL 里面还包含着“/exec/obidos”。插播八卦：不用为不知道 Obidos 为何物而犯囧，哥只是个传说。这里是正解。

这个系列其实我早就想动手翻译了，一直拖着到现在才终于开工。与此类似的，还有一个 Doug Edwards 和 Ron Garret 撰写的 Early [...]]]></description>
			<content:encoded><![CDATA[<p>原文链接：<a href="http://glinden.blogspot.com/2006/01/early-amazon-first-week.html" id="w4bh" target="_blank" title="Early Amazon: The first week">http://glinden.blogspot.com/2006/01/early-amazon-first-week.html</a></p>
<blockquote><p> 原文作者 Greg Linden 毕业于华盛顿大学计算机学院，1997 年加入 Amazon，领导开发了享誉业界的 Amazon 推荐引擎。<br />
 著名的 Item-based 推荐算法的提出者之一；Findory.com 创始人。<br />
 其 Blog &#8211; <a href="http://glinden.blogspot.com/" id="aaqq" title="Geeking with Greg">Geeking with Greg</a> 是个性化推荐领域最有影响力的博客（没有之一）。 </p></blockquote>
<p>
 1997 年初的亚马逊公司，邋遢、混沌、但令人兴奋。<br />
<img src="http://docs.google.com/File?id=ddjqwpms_532fxhwfbdt_b" style="float:right;height:358px;margin-left:1em;margin-right:0pt;width:308px"><br />
 亚马逊公司位于美国西雅图市，办公室在第二大道的哥伦比亚大厦里，这是一座砖体结构的建筑物，已经有些年头了，离派克市场不远。从办公室的窗户望出去感觉 还不错，有一个本地的美沙酮诊所，还有一个贩卖怪诞假发的商店。你甚至隐约可以看见一些脱衣舞俱乐部，它们就藏在几个街区远的地方。<i>插播八卦：派克市场有一个著名的 Athenian 餐厅，传世经典爱情影片《西雅图夜未眠》中，汤大哥就是在这里泡梅甜心的。</i></p>
<p> 当然了，我现在还只是一个眨巴着大眼睛的刚刚研究生毕业的菜鸟，还不敢奢望有这样一个靠窗的工位。</p>
<p> 我的工位在厨房。在亚马逊公司，空间从来都是一种奢侈，那个时候自然也是这样。报到的那天，我被领到我的办公室——一张安装在厨房角落里的牌桌，上面放着一台 PC。</p>
<p> 在厨房办公还是着实有些乐趣的。在亚马逊，我几乎什么人都不认识，大多数同事都沉浸在无聊的窃窃私语之中。不过，他们倒经常会到离我不远的柜台上去取茶和咖啡。我弄了一个糖果瓶——嗯，免费的——尽力和他们搞关系，以求套出些什么来。</p>
<p> 我的第一项任务是开始学习代码库。打开一个 shell 窗口，调出 emacs，然后开始阅读代码。我花了一些天来跟踪针对不同 URL 的分发器，研究 ol&#8217; obidos ——一个用来支持 Amazon 网站运转的大型 CGI 程序——是怎样漂亮地处理不同的请求，主页，书籍详情页，搜索，购物车，以及订单流转。至今，大多数亚马逊 URL 里面还包含着“/exec/obidos”。<i>插播八卦：不用为不知道 Obidos 为何物而犯囧，哥只是个<a href="http://discuss.fogcreek.com/joelonsoftware/default.asp?cmd=show&amp;ixPost=48202" id="d3:a" target="_blank" title="What Exactly Are Obidos?">传说</a>。这里是<a href="http://en.wikipedia.org/wiki/Obidos_%28software%29" id="nwk3" target="_blank" title="正解">正解</a>。</i></p>
<hr />
这个系列其实我<a href="http://www.guwendong.com/post/2006/early_x.html" target="_blank">早</a>就想动手翻译了，一直拖着到现在才终于开工。与此类似的，还有一个 Doug Edwards 和 Ron Garret 撰写的 <a href="http://googlesystem.blogspot.com/2005/11/xooglers.html" target="_blank">Early Google</a> 系列，不过不知道什么时候已经被删掉了，Google fans 们有兴趣的话可以刨刨看。</p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2010.<br/>
本文网址：<a href="http://www.guwendong.com/post/2010/early_amazon_1.html">http://www.guwendong.com/post/2010/early_amazon_1.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/amazon" rel="tag">amazon</a> | <a href="http://www.guwendong.com/post/2010/early_amazon_1.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2010/early_amazon_1.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Resys China 创刊号</title>
		<link>http://www.guwendong.com/post/2010/resys_china.html</link>
		<comments>http://www.guwendong.com/post/2010/resys_china.html#comments</comments>
		<pubDate>Sun, 07 Mar 2010 17:37:43 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[推荐系统]]></category>
		<category><![CDATA[resys]]></category>
		<category><![CDATA[resyschina]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/?p=330</guid>
		<description><![CDATA[《Resys China》，是依托于 Resys Group 并专注于推荐系统领域的一份电子杂志。
下面是创刊号的内容目录。

业界新闻
学术动态

Workshop on Social Recommender Systems
Collaborative Filtering Over Time

精品推荐

YouTube&#8217;s Quest to Suggest More
Recommendation Systems: Increasing Profit by Long Tail
推荐系统五大问题

系列连载

Greg Linden，Early Amazon：The First Week

精彩应用

开源推荐框架 DUINE 概览

Resys 精华帖

大家觉得推荐系统和长尾的关系是什么
基于 SNS/Lifestream 的推荐

轻松一下

感谢 yoyo、gary wang及阿稳同学在内容编辑方面的大力协助，感谢百分点科技在 PDF 文件制作方面的鼎力支持。
现在网络阅读越来越倾向于浅阅读，希望这份人工精编的内容能够给大家带来一些思考和收获。
PDF 版本从这里下载：Resys China 创刊号
Resys China 创刊号
View more documents from gu wendong.


© guwendong for Beyond Search, 2010.
本文网址：http://www.guwendong.com/post/2010/resys_china.html
tags: resys, resyschina &#124; 参与讨论
]]></description>
			<content:encoded><![CDATA[<p>《Resys China》，是依托于 <a href="https://groups.google.com/group/resys" target="_blank">Resys Group</a> 并专注于推荐系统领域的一份电子杂志。</p>
<p>下面是创刊号的内容目录。</p>
<ol>
<li>业界新闻</li>
<li>学术动态</li>
<ul>
<li>Workshop on Social Recommender Systems</li>
<li>Collaborative Filtering Over Time</li>
</ul>
<li>精品推荐</li>
<ul>
<li>YouTube&#8217;s Quest to Suggest More</li>
<li>Recommendation Systems: Increasing Profit by Long Tail</li>
<li>推荐系统五大问题</li>
</ul>
<li>系列连载</li>
<ul>
<li>Greg Linden，Early Amazon：The First Week</li>
</ul>
<li>精彩应用</li>
<ul>
<li>开源推荐框架 DUINE 概览</li>
</ul>
<li>Resys 精华帖</li>
<ul>
<li>大家觉得推荐系统和长尾的关系是什么</li>
<li>基于 SNS/Lifestream 的推荐</li>
</ul>
<li>轻松一下</li>
</ol>
<p>感谢 <a href="http://twitter.com/gycheng" target="_blank">yoyo</a>、<a href="mailto:gary.wang1009@gmail.com">gary wang</a>及<a href="http://www.wentrue.net/blog/" target="_blank">阿稳</a>同学在内容编辑方面的大力协助，感谢<a href="http://www.baifendian.com/" target="_blank">百分点科技</a>在 PDF 文件制作方面的鼎力支持。<br />
现在网络阅读越来越倾向于浅阅读，希望这份人工精编的内容能够给大家带来一些思考和收获。<br />
PDF 版本从这里下载：<a href="http://www.slideshare.net/clickstone/resys-china" target="_blank">Resys China 创刊号</a></p>
<div style="width:477px" id="__ss_3358040"><strong style="display:block;margin:12px 0 4px"><a href="http://www.slideshare.net/clickstone/resys-china" title="Resys China 创刊号">Resys China 创刊号</a></strong><object width="477" height="510"><param name="movie" value="http://static.slidesharecdn.com/swf/ssplayerd.swf?doc=resys-100307110414-phpapp02&#038;rel=0&#038;stripped_title=resys-china" /><param name="allowFullScreen" value="true"/><param name="allowScriptAccess" value="always"/><embed src="http://static.slidesharecdn.com/swf/ssplayerd.swf?doc=resys-100307110414-phpapp02&#038;rel=0&#038;stripped_title=resys-china" type="application/x-shockwave-flash" allowscriptaccess="always" allowfullscreen="true" width="477" height="510"></embed></object>
<div style="padding:5px 0 12px">View more <a href="http://www.slideshare.net/">documents</a> from <a href="http://www.slideshare.net/clickstone">gu wendong</a>.</div>
</div>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2010.<br/>
本文网址：<a href="http://www.guwendong.com/post/2010/resys_china.html">http://www.guwendong.com/post/2010/resys_china.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/resys" rel="tag">resys</a>, <a href="http://www.guwendong.com/post/tag/resyschina" rel="tag">resyschina</a> | <a href="http://www.guwendong.com/post/2010/resys_china.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2010/resys_china.html/feed</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>迟来的感谢：Resys 豆瓣活动</title>
		<link>http://www.guwendong.com/post/2010/resys_douban.html</link>
		<comments>http://www.guwendong.com/post/2010/resys_douban.html#comments</comments>
		<pubDate>Mon, 01 Mar 2010 15:37:54 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[推荐系统]]></category>
		<category><![CDATA[douban]]></category>
		<category><![CDATA[resys]]></category>
		<category><![CDATA[resyschina]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/?p=325</guid>
		<description><![CDATA[感谢开放的豆瓣团队，感谢阿北和胖子，感谢阿稳同学为这次活动付出的巨大努力！
 感谢大家对 Resys 活动的支持，2010 咱们继续折腾！
 本文原发 2010年第2期《程序员》杂志，略有修改。也愿 CSDN 的质量节节高升。

 年关之际，不仅天气冷，互联网更冷，不过这些都无法熄灭思想的火花。2009年12月19日，国内推荐技术社区 Resys Group（https://groups.google.com/group/resys）的第三次线下活动，在豆瓣网的鼎力支持之下顺利举办。&#160;
Resys，取名自 Recommender System 的简写，社区的宗旨是搭建一个专注于推荐技术领域的讨论平台。截止目前，Resys Group 发展势头喜人，受到了国内推荐技术爱好者们的热情响应，线上讨论很是热烈，线下活动也已经成功进行了三次。&#160;
 本次活动由豆瓣网提供场地、点心饮料以及纪念品支持。豆瓣网在国内互联网行业美誉度很高，这是一家以帮助用户发现未知事物为己任的公司，他们在为用户的生活带来诸多乐趣的同时，也已经让自己变得足够有趣。“豆瓣猜”作为其标志性应用，一直以来倍受关注，在 Google 上搜索 “豆瓣猜”，有超过两百万条信息，热度可见一斑。
 本次活动上，豆瓣网团队首次公开分享了他们运营 “豆瓣猜”的经验，系统介绍了他们在推荐领域的实践探索，可以说是对豆瓣网的一个不同于以往角度的新颖解读。据介绍，豆瓣网的创始人阿北与算法负责人王守崑是多年的好友。在豆瓣网内部最初的定位，书籍、电影、音乐等这些应用是钉子，推荐引擎是锤子，阿北带队找钉子，王守崑负责造锤子，配合得相当合拍。后来，豆瓣网逐渐成长为了一座舞台，推荐技术也伴随着赢得了更大的施展空间。
 这次活动总共有三个主题，第一个是豆瓣网王守崑的《豆瓣在推荐系统领域的实践和思考》，第二个是迅捷英翔孙超与刘凯义的《推荐也是一种产品》，第三个是百度张栋博士的《大规模机器学习算法在互联网上的应用》。
 第一个主题，主讲人王守崑总结了豆瓣网在推荐应用领域的探索，包括三个方面的内容。
 首先，什么样的产品适合推荐？依据在图书、电影、音乐、文章、RSS源、社会网络等领域应用推荐技术的多年经验，王守崑先从定性的角度提出是“具有媒体性的产品 (Media Product)”，即选择多样、口味(taste)很重要、单位成本不重要，同时能够广泛传播 (Information Cascade)的产品；接着在对真实的数据集进行定量分析后，进一步得出，应该是条目增长相对稳定、能够快速获得用户反馈，数据稀疏性与条目多样性、时效性比较平衡的产品，才是适合推荐的产品。
 其次，王守崑分享了豆瓣网的推荐引擎如何应对高成长性的挑战，即通过算法优化与近似算法设计，来寻求推荐质量与计算资源消耗之间的平衡。
 最后，针对当前推荐系统面临的问题，王守崑把推荐系统分为 Prediction，Forecasting，Recommendation 三个阶段，并探讨了一种下一代推荐引擎的构想——基于用户行为模型的、有记忆的、可进化的系统。在演讲期间，主讲人也提出了一些开放性问题留给与会者思考，比如推荐能否拥有独立的产品形态？
 总结陈词，王守崑把在算法领域的长期实践提炼成一句话：“Algorithms should facilitate rather than replace social process”，点睛之笔，简洁有力，闪耀着智慧的光芒。
 第二个主题，是由迅捷英翔公司的孙超与刘凯义带来的《Recommendation Algorithm is a product》。他们从日常工作实践出发，抛出了一个问题：在一个成熟的商业系统里，
 1）可推荐的商品（比如彩铃）数量多、种类繁、差异大（比如二人转与交响乐）；
 2）用户数目众多且兴趣各异，不同的用户对不同的商品有着不同的偏好；
 3）每种推荐算法所擅长解决问题的角度是不同的，比如协同过滤易出惊喜，内容推荐善于举一反三，基因推荐更加人性化。
 那么，推荐引擎作为连接起用户与商品的枢纽，是否可以具备自学习的智能导航能力，依据系统反馈来自动为每一个用户优化算法配置呢？
 诚恳地讲，这是一个非常有探讨价值的话题。以电影推荐为例，它是推荐技术发源的领域之一，相关的实际应用也最为深入。比如，IMDB 以基于打分的协同过滤技术为主，Jinni 将电影基因体系作为推荐引擎核心，Nanocrowd 通过分析影评的相关度来作推荐，LivingSocial: [...]]]></description>
			<content:encoded><![CDATA[<blockquote><p>感谢开放的豆瓣团队，感谢阿北和胖子，感谢阿稳同学为这次活动付出的巨大努力！<br />
 感谢大家对 Resys 活动的支持，2010 咱们继续折腾！<br />
 本文原发 2010年第2期《程序员》杂志，略有修改。也愿 CSDN 的质量节节高升。</p></blockquote>
<p>
 年关之际，不仅天气冷，互联网更冷，不过这些都无法熄灭思想的火花。2009年12月19日，国内推荐技术社区 Resys Group（<a href="https://groups.google.com/group/resys" id="qsox" title="https://groups.google.com/group/resys">https://groups.google.com/group/resys</a>）的第三次线下活动，在豆瓣网的鼎力支持之下顺利举办。&nbsp;</p>
<p><a href="http://www.guwendong.com/post/2009/resys_group.html" id="lzry" title="重磅推荐：Resys Group">Resys</a>，取名自 Recommender System 的简写，社区的宗旨是搭建一个专注于推荐技术领域的讨论平台。截止目前，Resys Group 发展势头喜人，受到了国内推荐技术爱好者们的热情响应，线上讨论很是热烈，线下活动也已经成功进行了三次。&nbsp;</p>
<p> 本次活动由豆瓣网提供场地、点心饮料以及纪念品支持。豆瓣网在国内互联网行业美誉度很高，这是一家以帮助用户发现未知事物为己任的公司，他们在为用户的生活带来诸多乐趣的同时，也已经让自己变得足够有趣。“豆瓣猜”作为其标志性应用，一直以来倍受关注，在 Google 上搜索 “豆瓣猜”，有超过两百万条信息，热度可见一斑。</p>
<p> 本次活动上，豆瓣网团队首次公开分享了他们运营 “豆瓣猜”的经验，系统介绍了他们在推荐领域的实践探索，可以说是对豆瓣网的一个不同于以往角度的新颖解读。据介绍，豆瓣网的创始人阿北与算法负责人王守崑是多年的好友。在豆瓣网内部最初的定位，书籍、电影、音乐等这些应用是钉子，推荐引擎是锤子，阿北带队找钉子，王守崑负责造锤子，配合得相当合拍。后来，豆瓣网逐渐成长为了一座舞台，推荐技术也伴随着赢得了更大的施展空间。</p>
<p> 这次活动总共有三个主题，第一个是豆瓣网王守崑的《豆瓣在推荐系统领域的实践和思考》，第二个是迅捷英翔孙超与刘凯义的《推荐也是一种产品》，第三个是百度张栋博士的《大规模机器学习算法在互联网上的应用》。</p>
<p> 第一个主题，主讲人王守崑总结了豆瓣网在推荐应用领域的探索，包括三个方面的内容。<br />
 首先，什么样的产品适合推荐？依据在图书、电影、音乐、文章、RSS源、社会网络等领域应用推荐技术的多年经验，王守崑先从定性的角度提出是“具有媒体性的产品 (Media Product)”，即选择多样、口味(taste)很重要、单位成本不重要，同时能够广泛传播 (Information Cascade)的产品；接着在对真实的数据集进行定量分析后，进一步得出，应该是条目增长相对稳定、能够快速获得用户反馈，数据稀疏性与条目多样性、时效性比较平衡的产品，才是适合推荐的产品。<br />
 其次，王守崑分享了豆瓣网的推荐引擎如何应对高成长性的挑战，即通过算法优化与近似算法设计，来寻求推荐质量与计算资源消耗之间的平衡。<br />
 最后，针对当前推荐系统面临的问题，王守崑把推荐系统分为 Prediction，Forecasting，Recommendation 三个阶段，并探讨了一种下一代推荐引擎的构想——基于用户行为模型的、有记忆的、可进化的系统。在演讲期间，主讲人也提出了一些开放性问题留给与会者思考，比如推荐能否拥有独立的产品形态？</p>
<p> 总结陈词，王守崑把在算法领域的长期实践提炼成一句话：“<b>Algorithms should facilitate rather than replace social process</b>”，点睛之笔，简洁有力，闪耀着智慧的光芒。</p>
<p> 第二个主题，是由迅捷英翔公司的孙超与刘凯义带来的《Recommendation Algorithm is a product》。他们从日常工作实践出发，抛出了一个问题：在一个成熟的商业系统里，<br />
 1）可推荐的商品（比如彩铃）数量多、种类繁、差异大（比如二人转与交响乐）；<br />
 2）用户数目众多且兴趣各异，不同的用户对不同的商品有着不同的偏好；<br />
 3）每种推荐算法所擅长解决问题的角度是不同的，比如协同过滤易出惊喜，内容推荐善于举一反三，基因推荐更加人性化。<br />
 那么，推荐引擎作为连接起用户与商品的枢纽，是否可以具备自学习的智能导航能力，依据系统反馈来自动为每一个用户优化算法配置呢？</p>
<p> 诚恳地讲，这是一个非常有探讨价值的话题。以电影推荐为例，它是推荐技术发源的领域之一，相关的实际应用也最为深入。比如，IMDB 以基于打分的协同过滤技术为主，Jinni 将电影基因体系作为推荐引擎核心，Nanocrowd 通过分析影评的相关度来作推荐，LivingSocial: Movies 是 Facebook 上一款基于社会网络的电影推荐应用，最后还有号称要打败所有电影推荐引擎的 Clerkdogs，他们完全使用人工推荐电影。这些电影推荐引擎专注于不同的推荐维度，各有所长，国外已经有研究机构基于此开展工作，试图探索如何把不同的推荐方法更有效地组合起来。</p>
<p> 主题三为《Parallel Algorithms For Mining Large Scale Data》，主讲人张栋博士在大规模机器学习领域经验丰富，一开场就脉络清晰地理出了机器学习领域的发展路线，从神经网络（Neural network）到支持向量机（SVM）到图模型（Graphical Model），再到条件随机场（CRF）并最后回归到深度信任网络（DBNs），各流派之间不断竞争螺旋上升，整个过程高屋建瓴并且故事性十足。接下来的主要话题，包括围绕天涯问答的算法原理，基于社会网络的精准广告，以及 MPI 与 MapReduce 两种并行计算框架的实际案例对比，都让与会者获益匪浅。</p>
<p> 从张栋博士的报告中可以看到，顶级互联网公司对大规模计算极其重视，他们将传统的算法进行改造，使其能够适应互联网上的庞大数据量。目前业界云计算概念火热，抛开滥竽充数者，大规模数据计算能力绝对是评价云计算的硬指标之一。 Google 公司的研究总监 <a href="http://norvig.com/" id="x5hq" title="Peter Norvig">Peter Norvig</a> 先生有句名言，“Worry about the data first before you worry about the algorithm”，即是在说大规模数据对于解决问题非常重要。xlvector 同学的<a href="http://xlvector.net/blog/?p=357" id="qccn" title="感概">感概</a>，很让与会者共鸣，“评价一个（Research）工程师的指标不应该仅是懂多少种算法，还要看处理过多大规模的数据”。</p>
<p> 本次活动的与会者，有正在从事数据挖掘相关工作的工程师，有致力于在推荐系统方面有所作为的创业人员，有对这个方向感兴趣的投资人，另外还有不少高校里专注于此方向的研究人员。各个主题的间隙是自由讨论的时间，与会者们进行了自由开放的交流。相对来讲，第一个与第三个主题更加直观和吸引人一些，毕竟大家可以从中窥得成功的经验。但是，Resys Group 同样也真诚地欢迎第二组演讲人这样的做法，提出探讨式的开放性主题，提供数据，交流体会，无权威结论，这样更加能够引发听者的思考与辩论。互联网上不会存在永远的领先者，自由、开放与分享是互联网的本质，顺应这个潮流终究可以超越。逆势而为者，死路一条。</p>
<p> 本次活动各个主题的 PPT 文件，均可以从&nbsp;<a href="http://www.slideshare.net/clickstone/tag/resys" id="oiil" title="http://www.slideshare.net/clickstone/tag/resys">http://www.slideshare.net/clickstone/tag/resys</a>&nbsp;下载。其中王守崑的报告尤其受欢迎，并在 twitter 上引发了大量转推，PPT 上传到 slideshare 网站的当天，即因为关注度高而进入了网站的首页推荐。</p>
<p> 2010年，即将到来的 Resys Group 第四次线下活动，荣幸邀请到IBM CRL推荐技术研究团队作专场演讲，主题各个精彩，欢迎有兴趣的朋友保持关注。</p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2010.<br/>
本文网址：<a href="http://www.guwendong.com/post/2010/resys_douban.html">http://www.guwendong.com/post/2010/resys_douban.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/douban" rel="tag">douban</a>, <a href="http://www.guwendong.com/post/tag/resys" rel="tag">resys</a>, <a href="http://www.guwendong.com/post/tag/resyschina" rel="tag">resyschina</a> | <a href="http://www.guwendong.com/post/2010/resys_douban.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2010/resys_douban.html/feed</wfw:commentRss>
		<slash:comments>6</slash:comments>
		</item>
		<item>
		<title>朋友们，来相会！</title>
		<link>http://www.guwendong.com/post/2010/guwendong_com.html</link>
		<comments>http://www.guwendong.com/post/2010/guwendong_com.html#comments</comments>
		<pubDate>Mon, 01 Mar 2010 15:19:12 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[未分类]]></category>
		<category><![CDATA[blah]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/?p=317</guid>
		<description><![CDATA[各位同学们，我又在折腾了！ 
 2010年1月13日，在 Google 总部宣布退出中国的同一天，我使用了 2 年多的 guwendong.cn 域名，也被定点清除出中国了。这事儿我就不多说了，Google 看样子是要反悔了，不过我决心已定。对于 CNNIC 在那里瞎折腾，我等屁民无能为力。但，我有选择的权利。
某推很有意思：CNNIC，你让哥滚，哥滚了；你又让哥回来，哥滚远了。
 在国内使用 cn 域名架独立博客，绝对是彻头彻尾的杯具，切记，切忌！
我在 godaddy 注册了新域名 guwendong.com，在 Linode 买了 VPS。无需备案，还能翻墙。
自由的滋味非常甜美，不过 “Freedom is&#160;NOT free”！
原来我在 Feedsky 的地址还会继续维护，但没准儿不久的将来，Feedsky 也可能会变杯具。而且，即使 Feedsky 没问题，架不住我这个新地址没准儿哪天也会因某个名单而被墙掉。我已经有了足够的心理准备，即使被墙，也绝不会再回墙内。
下面列出我的一些永久地址，欢迎大家围观。

Blog:&#160;http://guwendong.com
Feed:&#160;http://feeds.feedburner.com/guwendong
Twitter:&#160;http://twitter.com/clickstone
Facebook: http://www.facebook.com/clickstone
Douban:&#160;http://www.douban.com/people/wdgu/



© guwendong for Beyond Search, 2010.
本文网址：http://www.guwendong.com/post/2010/guwendong_com.html
tags: blah &#124; 参与讨论
]]></description>
			<content:encoded><![CDATA[<p>各位同学们，我又在折腾了！ </p>
<p> 2010年1月13日，在 Google 总部宣布退出中国的同一天，我使用了 2 年多的 guwendong.cn 域名，也被定点清除出中国了。这事儿我就不多说了，Google 看样子是要反悔了，不过我决心已定。对于 CNNIC 在那里<a href="http://www.infzm.com/content/40622" id="tsf3" title="尊重个人 中国互联网产业才会腾飞">瞎折腾</a>，我等屁民无能为力。但，我有选择的权利。</p>
<blockquote><p>某推很有意思：CNNIC，你让哥滚，哥滚了；你又让哥回来，哥滚远了。</p></blockquote>
<p> 在国内使用 cn 域名架独立博客，绝对是彻头彻尾的杯具，切记，切忌！</p>
<p>我在 <a href="http://godaddy.com" id="vhgn" title="godaddy">godaddy</a> 注册了新域名 <a href="http://guwendong.com" id="k22l" title="guwendong.com">guwendong.com</a>，在 Linode 买了 <a href="http://linode.com" id="fmay" title="VPS">VPS</a>。无需备案，还能翻墙。<br />
自由的滋味非常甜美，不过 “Freedom is&nbsp;<a href="http://www.guwendong.com/about#linode" id="qo:t" title="NOT free">NOT free</a>”！</p>
<p>原来我在 Feedsky 的地址还会继续维护，但没准儿不久的将来，Feedsky 也可能会变杯具。而且，即使 Feedsky 没问题，架不住我这个新地址没准儿哪天也会因某个名单而被墙掉。我已经有了足够的心理准备，即使被墙，也绝不会再回墙内。</p>
<p>下面列出我的一些永久地址，欢迎大家围观。</p>
<ol>
<li>Blog:&nbsp;<a href="http://guwendong.com/" id="pabg" title="Beyond Search">http://guwendong.com</a></li>
<li>Feed:&nbsp;<a href="http://feeds.feedburner.com/guwendong" id="b01m" title="http://feeds.feedburner.com/guwendong">http://feeds.feedburner.com/guwendong</a></li>
<li>Twitter:&nbsp;<a href="http://twitter.com/clickstone" id="q9j1" title="http://twitter.com/clickstone">http://twitter.com/clickstone</a></li>
<li>Facebook: <a href="http://www.facebook.com/clickstone" id="oh0a" title="http://www.facebook.com/clickstone">http://www.facebook.com/clickstone</a></li>
<li>Douban:&nbsp;<a href="http://www.douban.com/people/wdgu/" id="fp:1" title="http://www.douban.com/people/wdgu/">http://www.douban.com/people/wdgu/</a></li>
</ol>
<p></p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2010.<br/>
本文网址：<a href="http://www.guwendong.com/post/2010/guwendong_com.html">http://www.guwendong.com/post/2010/guwendong_com.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/blah" rel="tag">blah</a> | <a href="http://www.guwendong.com/post/2010/guwendong_com.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2010/guwendong_com.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>购物车推荐</title>
		<link>http://www.guwendong.com/post/2009/shopping_cart.html</link>
		<comments>http://www.guwendong.com/post/2009/shopping_cart.html#comments</comments>
		<pubDate>Sat, 07 Nov 2009 14:52:21 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[推荐系统]]></category>
		<category><![CDATA[e-commerce]]></category>
		<category><![CDATA[resys]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2009/shopping_cart.html</guid>
		<description><![CDATA[
忘记在哪里看到了这么一个说法，“在结算的时候如果有太多交叉销售的选择的话，可能会让客户迷惑，反而放弃订单”。这句话涉及到电子商务领域的一个重要问题，如此定性的结论显然是不太负责任的，比如何为“太多”。遂在 twitter 上发问。＠imrchen 回复说，
只要有“太多&#8221;選擇，消費者就會卻步，不論這些選擇是怎麼來的。Barry Schwartz 的 The Paradox of Choice 就很強調 Less is More 這件事。
那么，对待交叉销售问题，业界到底是怎么做的呢？让我们一探究竟。
我选了两本书进行实验：《末日之书》，这个来自豆瓣友邻推荐；《时间旅行者的妻子》，这个是因为我很想看同名电影。
第一站，当当
1）进入购物车之前

搜索书名，居然没有输入提示！
意见：太 out 了，这个应该算是标配了吧。
点击搜索结果里面的对应条目，弹出新窗口进入详细信息页面。
意见：虽然弹出新窗口基本上已经是中国网民最喜闻乐见的体验了，但我认为也不能乱用。我已经找到了我要的东西了，你还留着这个结果页面搞球啊，我还得费劲把它关了。当然了，我这里是基于使用精确搜索的场景得出上面的结论。使用模糊搜索的场景，保留结果列表页是说得过去的，但我觉得还是需要分析下搜索数据，看哪种比例高。当当购书整体走下来，最突出的问题就是弹出的新窗口太多了。
在书籍详细信息页面里，点击“购买”，又弹出了一个新窗口进入购物车。好吧，我忍了。

2）购物车内

上图是当当的购物车推荐区域，标题是“根据您挑选的商品，当当为您推荐”。

位置，横在页面上部。
意见：放在这里应该是觉得它比较重要，但在设计上与下面的“已购商品”产生对比，被弱化了很多。
每个推荐商品，显示名称/市场价/当当价，共 3 项信息。
名称有显示不完整的，鼠标放在链接上会提示完整名。
意见：不能够直接显示完整商品名，感觉不太好。
推测当当应该是认为，市场价/当当价对比，是用户购书关注的一大指标。
推荐条目总共 8 条。
问题：数目是怎么确定的？


上图是当当的已购商品区域。

位置，无论视觉上，还是设计上，这个区域都是中心。
显示商品名/单品积分/市场价/当当价/优惠/数量/共节省/共获积分/总金额，共 9 项信息。
灰掉了“积分/市场价”，应该是想强调一下“当当价”。
问题：如果认为灰掉的两项不重要，是否有更好的处理？
变换颜色强调了“共节省/积分”，特别突出的是“总金额”。
提示并进行了“图书促销区”活动的导航。
可以修改商品数量，以及删除商品。


上图是特惠区的促销信息。

位置在页面最下面，一般很难看到。我个人持保留意见，放在此时此地能有用吗？

3）个人看法

要赞一下当当的推荐算法团队，有功力，购物车推荐的相关性不错，多样性也照顾到了。
要搞清楚一个重要问题，基于当当目前的情况，购物车的首要目标是什么：刺激交叉销售，提高单个订单的总金额？还是尽量减少对结算的干扰，以保证订单地完成率？
不了解设计初衷，但感觉购物车推荐部分的产品设计还有提升空间。套个专业术语，信息架构没整明白。

第二站，卓越亚马逊
1）进入购物车之前

搜索书名，Bingo，有输入提示！看来 Amazon 代表了先进生产力啊。
点击搜索结果里面的对应条目，当前页转入详细信息页面。
问题：是否能够说明在卓越亚马逊这里，使用精确搜索的用户是占大多数的？
在书籍详细信息页面里，点击“购买”，当前页转入购物车。好吧，我承认我是 Amazon 的拥趸。

2）购物车内

根据最近加入购物车的一个商品，在购买操作维度给出的推荐。总共 6 条。



根据最近加入购物车的一个商品，在浏览操作维度给出的推荐。总共 3 条。

根据购物车内的其它商品，在购买操作维度给出的推荐。总共 3 条。
上面三个图片是 Amazon 购物车推荐的三个区域，标题是我们喜闻乐见的“买了&#8230; 还买了&#8230;”的经典句式。

Amazon 清晰地传递了它的理念：购物车的核心目标是，使用交叉销售帮助用户完成更多地购买。
购物车推荐区域基本上进行了满屏显示，无论视觉上，设计上，还是事实上，这里都是中心。
每个推荐商品，显示图片/名称/卓越价/打星/评论数，共 5 项信息。商品名称全部完整显示。
相比文字，图片能够更加有效地传递信息。
三个推荐区域的条目数分别是 6/3/3，总共 12 条。


上图是已购商品区域。

位置，在页面的右上部的独立区域。通过区别于其他的色块设计，使其也足够突出。
显示商品名/作者/包装/卓越价/数量/总金额，共 6 项信息。
突出了商品的卓越价及订单总价。
不能直接修改商品数据，也不能直接删除商品。
有一句看似很多余的提示语，“购物车中的商品价格与该商品页面显示的最新价格一致”。

3）个人看法

卓越亚马逊显然用的是 Amazon 总部的推荐技术，效果毋庸置疑。
细节上仍有待注意，推荐区域稍嫌散乱，且时常可以见到商品图片无法显示的情况。

关于购物推荐
用户购买一件商品，有两个阶段：首先是要知道有这么一个东西；然后评价一下是否需要购买，做出决定。
当当的推荐完成了第一个阶段，能够把相关性比较好的东西自动推给用户，但基本上到此就停住了，在帮助用户作决定这个阶段几乎没有作为。
细节处见真章。可以看到 Amazon 对推荐这件事情的理解的确更加到位。通过给出“打星”与“评论数”，为用户做出决定提供了一些参考。但请注意，我说的不是卓越亚马逊，他抄都没抄明白，Amazon 在同样的地方，还另外给出了书籍的作者，而卓越似乎是自作主张地去掉了。要知道，作者可是用户决定购买一本书的重要因素！
结论
内容写着写着就有点儿发散了。
转回头来，开篇的那句话，其实说的是“Shopping Cart Abandonment Rate”，它是电子商务领域的一个核心问题。它非常重要，因为可以抛开其他所有因素，只需要单纯把这个比例降低，销售收入就能够增加。但也正因为如此，一般的电子商务网站对待购物车都是格外的小心翼翼。这个事情的做法上，没有绝对的正误，一定要数据说话。
但评定标准绝对只有一条。搞清楚我之前提到的那个问题：

刺激交叉销售，提高单个订单的总金额；
尽量减少对结算的干扰，以保证订单地完成率。

哪一个能够提升最终的销售收入，哪一个就是你当前的最佳选择。
Update: 开篇的那句话来自 Tangos 的“支付结算页面造成客户流失的常见问题”这篇文章。非常抱歉，我误解了 [...]]]></description>
			<content:encoded><![CDATA[<div>
<p>忘记在哪里看到了这么一个说法，“在结算的时候如果有太多交叉销售的选择的话，可能会让客户迷惑，反而放弃订单”。这句话涉及到电子商务领域的一个重要问题，如此定性的结论显然是不太负责任的，比如何为“太多”。遂在 twitter 上发问。<a title="＠imrchen" href="http://twitter.com/imrchen">＠imrchen</a> 回复说，</p>
<blockquote><p>只要有“太多&#8221;選擇，消費者就會卻步，不論這些選擇是怎麼來的。Barry Schwartz 的 The Paradox of Choice 就很強調 Less is More 這件事。</p></blockquote>
<p>那么，对待交叉销售问题，业界到底是怎么做的呢？让我们一探究竟。</p>
<p>我选了两本书进行实验：《<a title="末日之书" href="http://www.douban.com/subject/4025049/">末日之书</a>》，这个来自豆瓣友邻推荐；《<a title="时间旅行者的妻子" href="http://www.douban.com/subject/2056749/">时间旅行者的妻子</a>》，这个是因为我很想看<a title="同名电影" href="http://www.douban.com/subject/1885124/">同名电影</a>。</p>
<p><strong>第一站，当当</strong></p>
<p>1）进入购物车之前</p>
<ul>
<li>搜索书名，居然没有输入提示！<br />
意见：太 out 了，这个应该算是标配了吧。</li>
<li>点击搜索结果里面的对应条目，弹出新窗口进入详细信息页面。<br />
意见：虽然弹出新窗口基本上已经是中国网民最喜闻乐见的体验了，但我认为也不能乱用。我已经找到了我要的东西了，你还留着这个结果页面搞球啊，我还得费劲把它关了。当然了，我这里是基于使用精确搜索的场景得出上面的结论。使用模糊搜索的场景，保留结果列表页是说得过去的，但我觉得还是需要分析下搜索数据，看哪种比例高。当当购书整体走下来，最突出的问题就是弹出的新窗口太多了。</li>
<li>在书籍详细信息页面里，点击“购买”，又弹出了一个新窗口进入购物车。好吧，我忍了。</li>
</ul>
<p>2）购物车内</p>
<div style="text-align: left;"><img style="width: 648px; height: 109.009px;" src="http://docs.google.com/File?id=ddjqwpms_515fmwrqnnc_b" alt="" /></div>
<p>上图是当当的购物车推荐区域，标题是“根据您挑选的商品，当当为您推荐”。</p>
<ul>
<li>位置，横在页面上部。<br />
意见：放在这里应该是觉得它比较重要，但在设计上与下面的“已购商品”产生对比，被弱化了很多。</li>
<li>每个推荐商品，显示名称/市场价/当当价，共 3 项信息。</li>
<li>名称有显示不完整的，鼠标放在链接上会提示完整名。<br />
意见：不能够直接显示完整商品名，感觉不太好。</li>
<li>推测当当应该是认为，市场价/当当价对比，是用户购书关注的一大指标。</li>
<li>推荐条目总共 8 条。<br />
问题：数目是怎么确定的？</li>
</ul>
<div style="text-align: left;"><img style="width: 648px; height: 148.191px;" src="http://docs.google.com/File?id=ddjqwpms_517fb3kkbgs_b" alt="" /></div>
<p>上图是当当的已购商品区域。</p>
<ul>
<li>位置，无论视觉上，还是设计上，这个区域都是中心。</li>
<li>显示商品名/单品积分/市场价/当当价/优惠/数量/共节省/共获积分/总金额，共 9 项信息。</li>
<li>灰掉了“积分/市场价”，应该是想强调一下“当当价”。<br />
问题：如果认为灰掉的两项不重要，是否有更好的处理？</li>
<li>变换颜色强调了“共节省/积分”，特别突出的是“总金额”。</li>
<li>提示并进行了“图书促销区”活动的导航。</li>
<li>可以修改商品数量，以及删除商品。</li>
</ul>
<div style="text-align: left;"><img style="width: 648px; height: 44.0586px;" src="http://docs.google.com/File?id=ddjqwpms_518hswzg6f2_b" alt="" /></div>
<p>上图是特惠区的促销信息。</p>
<ul>
<li>位置在页面最下面，一般很难看到。我个人持保留意见，放在此时此地能有用吗？</li>
</ul>
<p>3）个人看法</p>
<ul>
<li>要赞一下当当的推荐算法团队，有功力，购物车推荐的相关性不错，多样性也照顾到了。</li>
<li>要搞清楚一个重要问题，基于当当目前的情况，购物车的首要目标是什么：刺激交叉销售，提高单个订单的总金额？还是尽量减少对结算的干扰，以保证订单地完成率？</li>
<li>不了解设计初衷，但感觉购物车推荐部分的产品设计还有提升空间。套个专业术语，信息架构没整明白。</li>
</ul>
<p><strong>第二站，卓越亚马逊</strong></p>
<p>1）进入购物车之前</p>
<ul>
<li>搜索书名，Bingo，有输入提示！看来 Amazon 代表了先进生产力啊。</li>
<li>点击搜索结果里面的对应条目，当前页转入详细信息页面。<br />
问题：是否能够说明在卓越亚马逊这里，使用精确搜索的用户是占大多数的？</li>
<li>在书籍详细信息页面里，点击“购买”，当前页转入购物车。好吧，我承认我是 Amazon 的拥趸。</li>
</ul>
<p>2）购物车内</p>
<div style="text-align: left;"><img style="width: 648px; height: 251.809px;" src="http://docs.google.com/File?id=ddjqwpms_519cr8w7bg4_b" alt="" /></div>
<p>根据最近加入购物车的一个商品，在购买操作维度给出的推荐。总共 6 条。</p>
</div>
<div>
<div style="text-align: left;"><img style="width: 648px; height: 246.54px;" src="http://docs.google.com/File?id=ddjqwpms_520fwqf3qcf_b" alt="" /></div>
<p>根据最近加入购物车的一个商品，在浏览操作维度给出的推荐。总共 3 条。</p>
<div style="text-align: left;"><img style="width: 648px; height: 256.625px;" src="http://docs.google.com/File?id=ddjqwpms_521ccwjdndg_b" alt="" /></div>
<p>根据购物车内的其它商品，在购买操作维度给出的推荐。总共 3 条。</p>
<p>上面三个图片是 Amazon 购物车推荐的三个区域，标题是我们喜闻乐见的“买了&#8230; 还买了&#8230;”的经典句式。</p>
<ul>
<li>Amazon 清晰地传递了它的理念：购物车的核心目标是，使用交叉销售帮助用户完成更多地购买。</li>
<li>购物车推荐区域基本上进行了满屏显示，无论视觉上，设计上，还是事实上，这里都是中心。</li>
<li>每个推荐商品，显示图片/名称/卓越价/打星/评论数，共 5 项信息。商品名称全部完整显示。</li>
<li>相比文字，图片能够更加有效地传递信息。</li>
<li>三个推荐区域的条目数分别是 6/3/3，总共 12 条。</li>
</ul>
<div style="text-align: left;"><img style="width: 225px; height: 431px;" src="http://docs.google.com/File?id=ddjqwpms_522h2mt7dhs_b" alt="" /></div>
<p>上图是已购商品区域。</p>
<ul>
<li>位置，在页面的右上部的独立区域。通过区别于其他的色块设计，使其也足够突出。</li>
<li>显示商品名/作者/包装/卓越价/数量/总金额，共 6 项信息。</li>
<li>突出了商品的卓越价及订单总价。</li>
<li>不能直接修改商品数据，也不能直接删除商品。</li>
<li>有一句看似很多余的提示语，“购物车中的商品价格与该商品页面显示的最新价格一致”。</li>
</ul>
<p>3）个人看法</p>
<ul>
<li>卓越亚马逊显然用的是 Amazon 总部的推荐技术，效果毋庸置疑。</li>
<li>细节上仍有待注意，推荐区域稍嫌散乱，且时常可以见到商品图片无法显示的情况。</li>
</ul>
<p><strong>关于购物推荐</strong></p>
<p>用户购买一件商品，有两个阶段：首先是要知道有这么一个东西；然后评价一下是否需要购买，做出决定。<br />
当当的推荐完成了第一个阶段，能够把相关性比较好的东西自动推给用户，但基本上到此就停住了，在帮助用户作决定这个阶段几乎没有作为。<br />
细节处见真章。可以看到 Amazon 对推荐这件事情的理解的确更加到位。通过给出“打星”与“评论数”，为用户做出决定提供了一些参考。但请注意，我说的不是卓越亚马逊，他抄都没抄明白，Amazon 在同样的地方，还另外给出了书籍的作者，而卓越似乎是自作主张地去掉了。要知道，作者可是用户决定购买一本书的重要因素！</p>
<p><strong>结论</strong></p>
<p>内容写着写着就有点儿发散了。<br />
转回头来，开篇的那句话，其实说的是“Shopping Cart Abandonment Rate”，它是电子商务领域的一个核心问题。它非常重要，因为可以抛开其他所有因素，只需要单纯把这个比例降低，销售收入就能够增加。但也正因为如此，一般的电子商务网站对待购物车都是格外的小心翼翼。这个事情的做法上，没有绝对的正误，一定要数据说话。<br />
但评定标准绝对只有一条。搞清楚我之前提到的那个问题：</p>
<ol>
<li>刺激交叉销售，提高单个订单的总金额；</li>
<li>尽量减少对结算的干扰，以保证订单地完成率。</li>
</ol>
<p>哪一个能够提升最终的销售收入，哪一个就是你当前的最佳选择。</p>
<p><strong>Update:</strong> 开篇的那句话来自 Tangos 的“<a href="http://blog.tangoschan.com/archives/checkout/">支付结算页面造成客户流失的常见问题</a>”这篇文章。非常抱歉，我误解了 Tangos 的原意，他说的是“支付结算页”，而不是购物车页面。一旦进入结算流程，现在业内应该已经是统一的做法了，不做任何其他产品的推荐，甚至连导航栏都全部去掉，不让任何因素影响结算完成。虽然跑了题，但这篇文章的内容应该还是具备参考价值的。</p>
</div>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2009.<br/>
本文网址：<a href="http://www.guwendong.com/post/2009/shopping_cart.html">http://www.guwendong.com/post/2009/shopping_cart.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/e-commerce" rel="tag">e-commerce</a>, <a href="http://www.guwendong.com/post/tag/resys" rel="tag">resys</a> | <a href="http://www.guwendong.com/post/2009/shopping_cart.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2009/shopping_cart.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>啤酒和尿布的故事</title>
		<link>http://www.guwendong.com/post/2009/beer_and_nappies.html</link>
		<comments>http://www.guwendong.com/post/2009/beer_and_nappies.html#comments</comments>
		<pubDate>Wed, 28 Oct 2009 16:55:41 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[推荐系统]]></category>
		<category><![CDATA[association-rule]]></category>
		<category><![CDATA[resys]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2009/beer_and_nappies.html</guid>
		<description><![CDATA[因 Resys Group 里的这个讨论而起，又有朋友找我问起了啤酒和尿布的故事～
Long long ago，有这么一个故事。
在一家超市里，有一个有趣的现象：尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话，而是发生在美国沃尔玛连锁店超市的真实案例，并一直为商家所津津乐道。原来，美国的妇女们经常会嘱咐她们的丈夫下班以后要为孩子买尿布，而丈夫在买完尿布之后又要顺手买回自己爱喝的啤酒。
第一次听到这个故事，是在研一的数据挖掘课程上。当时导师讲完之后，我感觉这是个非常神奇的事情。
这之前我最崇拜的是一位名叫泰勒的大哥，此人左手一个小本，右手一支铅笔，脖子上挂着个秒表，没日没夜地，站在那里观察啊，观察啊，观察啊……观察什么啊？挖煤。对，确实是挖煤。就是这个办法，他凭借一己之力，开创了对工业界，尤其是对日本工业界影响深远的时间动作研究，被后人尊称为工业工程之父。
仰望着泰勒，我想，我要是也用泰勒大师的办法，是不是也能搞一个购物动作研究，成为超级市场之父呢？我为自己的灵光乍现而欢呼雀跃，I fucking couldn&#8217;t be happier！可转念又一想，那我得写秃多少支铅笔，按坏多少个秒表啊。我没有风险投资，这事儿干不了。
下课回到宿舍，我是埋头狂啃了几天关联规则算法。在自认为得道成仙之后，我便开始四处招摇，逢人便问。
我：你认识“啤酒兄”吗？
～摇头～
我：哦，不认识。
我：那你认识“尿布兄”吗？
～继续摇头～
我：什么，这个也不认识！
我：那算了，你还是回火星去吧。
时间长了，问得多了，我才弄明白，原来“啤酒兄”和“尿布兄”才是真正的火星人，在时间回旋里面，一时半会儿到不了地球，很不靠谱。
现在这事儿靠谱了，都有人专门为这两位仁兄著书立传了。等地球人都认识了他们，数据挖掘从业者的春天就真来了。
其实当年在课上，导师已经和我们说了，这个故事多半是有一些些杜撰的成分在里面的，并且这个故事其实是有多个版本的。但数据挖掘技术需要发展，需要进入业界，需要产业化，就必须有一个简单易懂的故事。就好像一提到进行诚实教育，大家自然就会想到“狼来了”，它通俗、易懂、好接受、容易记忆。故事不一定真实，但结论足够说明问题。
我有一位朋友，01 年本科毕业去了 IBM。在他给 IBM 的求职信上，有一段话让我印象深刻。原话记不住了，大约是这样：
“我喜欢写程序。
当我的同学们在浩渺的星际争霸战场上鏖战，或者围坐在饭岛爱老师身边激昂人生的时候，我却孤独地在 MFC 中深入浅出，每一行优雅的代码，都仿佛美丽的音符一般，让我深陷其中无法自拔。
学习就像太空冒险，越是深入，越能体会到他的博大精深。”
让我们共勉。

© guwendong for Beyond Search, 2009.
本文网址：http://www.guwendong.com/post/2009/beer_and_nappies.html
tags: association-rule, resys &#124; 参与讨论
]]></description>
			<content:encoded><![CDATA[<p>因 <a title="Resys Group" href="https://groups.google.com/group/resys">Resys Group</a> 里的这个<a title="mazon的推荐，想不通" href="https://groups.google.com/group/resys/browse_thread/thread/e76205f7cf683926#">讨论</a>而起，又有朋友找我问起了啤酒和尿布的故事～</p>
<p>Long long ago，有这么一个故事。<br />
在一家超市里，有一个有趣的现象：尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话，而是发生在美国沃尔玛连锁店超市的真实案例，并一直为商家所津津乐道。原来，美国的妇女们经常会嘱咐她们的丈夫下班以后要为孩子买尿布，而丈夫在买完尿布之后又要顺手买回自己爱喝的啤酒。</p>
<p>第一次听到这个故事，是在研一的数据挖掘课程上。当时导师讲完之后，我感觉这是个非常神奇的事情。</p>
<p>这之前我最崇拜的是一位名叫<a title="F. W. Taylor" href="http://en.wikipedia.org/wiki/Frederick_Winslow_Taylor">泰勒</a>的大哥，此人左手一个小本，右手一支铅笔，脖子上挂着个秒表，没日没夜地，站在那里观察啊，观察啊，观察啊……观察什么啊？挖煤。对，确实是挖煤。就是这个办法，他凭借一己之力，开创了对工业界，尤其是对日本工业界影响深远的时间动作研究，被后人尊称为工业工程之父。</p>
<p>仰望着泰勒，我想，我要是也用泰勒大师的办法，是不是也能搞一个购物动作研究，成为超级市场之父呢？我为自己的灵光乍现而欢呼雀跃，<a title="“F”家族口语禁忌语之完美诠释" href="http://www.yeeyan.com/articles/view/96632/64989">I fucking couldn&#8217;t be happier</a>！可转念又一想，那我得写秃多少支铅笔，按坏多少个秒表啊。我没有风险投资，这事儿干不了。</p>
<p>下课回到宿舍，我是埋头狂啃了几天<a href="http://www.guwendong.com/post/2007/association_rule.html" title="关联规则">关联规则</a>算法。在自认为得道成仙之后，我便开始四处招摇，逢人便问。<br />
我：你认识“啤酒兄”吗？<br />
～摇头～<br />
我：哦，不认识。<br />
我：那你认识“尿布兄”吗？<br />
～继续摇头～<br />
我：什么，这个也不认识！<br />
我：那算了，你还是回火星去吧。<br />
时间长了，问得多了，我才弄明白，原来“啤酒兄”和“尿布兄”才是真正的火星人，在<a href="http://www.douban.com/subject/3041463/" title="时间回旋">时间回旋</a>里面，一时半会儿到不了地球，很不靠谱。</p>
<p>现在这事儿靠谱了，都有人专门为这两位仁兄<a href="http://www.douban.com/subject/3283973/" title="著书立传">著书立传</a>了。等地球人都认识了他们，数据挖掘从业者的春天就真来了。</p>
<p>其实当年在课上，导师已经和我们说了，<a title="这个故事" href="http://www.google.com/search?hl=en&amp;q=beer+and+nappies">这个故事</a>多半是有一些些杜撰的成分在里面的，并且这个故事其实是有多个版本的。但数据挖掘技术需要发展，需要进入业界，需要产业化，就必须有一个简单易懂的故事。就好像一提到进行诚实教育，大家自然就会想到“狼来了”，它通俗、易懂、好接受、容易记忆。故事不一定真实，但结论足够说明问题。</p>
<p>我有一位朋友，01 年本科毕业去了 IBM。在他给 IBM 的求职信上，有一段话让我印象深刻。原话记不住了，大约是这样：<br />
“我喜欢写程序。<br />
当我的同学们在浩渺的星际争霸战场上鏖战，或者围坐在饭岛爱老师身边激昂人生的时候，我却孤独地在 MFC 中深入浅出，每一行优雅的代码，都仿佛美丽的音符一般，让我深陷其中无法自拔。<br />
学习就像太空冒险，越是深入，越能体会到他的博大精深。”</p>
<p>让我们共勉。</p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2009.<br/>
本文网址：<a href="http://www.guwendong.com/post/2009/beer_and_nappies.html">http://www.guwendong.com/post/2009/beer_and_nappies.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/association-rule" rel="tag">association-rule</a>, <a href="http://www.guwendong.com/post/tag/resys" rel="tag">resys</a> | <a href="http://www.guwendong.com/post/2009/beer_and_nappies.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2009/beer_and_nappies.html/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>转载：推薦系統與長尾</title>
		<link>http://www.guwendong.com/post/2009/longtail_roger.html</link>
		<comments>http://www.guwendong.com/post/2009/longtail_roger.html#comments</comments>
		<pubDate>Tue, 13 Oct 2009 16:04:07 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[好文收藏]]></category>
		<category><![CDATA[longtail]]></category>
		<category><![CDATA[resys]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2009/longtail_roger.html</guid>
		<description><![CDATA[非常令人高兴，我抛出了砖，引到了玉。Roger 早在 2007 年，就针对推荐系统与长尾的关系，发表了下面这篇精彩的文章。他的 blog 在 blogspot 上，由于众所周知的原因不太容易访问了。为了方便大家阅读，经 Roger 本人同意，转载在此。
我这里稍稍抱怨一下 Roger，不能总是拿 Daily Murmur 打发我们啊，下面这样的好文章实在应该多写一些啊。最后再说一句，Roger 的 twitter 帐号是 @imrchen。


推薦系統與長尾
原文作者：Roger
原文地址：http://blurkerlab.blogspot.com/2007/10/blog-post_12.html
我們已經談過推薦系統的架構和技術分類，接著我們來觀察推薦系統的目標和成果，是否如研究者或經營者所預期的那麼美好。推薦系統的研究在學界雖然不是紅得發紫，但是一直受到相當程度的關注， Netflix Prize 的話題一開，更受人注目。在如何建構一個「更好的」推薦系統這個題目上，過去產、學二界攜手的成果，是有目共睹的。
但是我們對於推薦系對銷售究竟有什麼影響，它是如何影響消費者的行為，是否真的達到原先建設推薦系統的目的，則是所知甚少，沒有足夠多的研究可以證實我們的觀點（不管這個觀點的內容是什麼）。
第一種觀點：推薦系統促成長尾
過去對於推薦系統成效，有兩種截然不同的看法，第一種觀點，可能也是目前較佔上風的觀點，認為推薦系統強化了長尾（Long Tail）的實現，讓銷售方和購買方都得到更多選擇與便利。比如說 The Long Tail 的作者，就直接了當在書中宣稱我們從資訊時代進入「推薦」時代─We are leaving the Information Age and entering the Recommendation Age（讀者可參考「長尾」在英國出版宣傳時作的 Exclusive Extract ，請看第 24 頁）。
這兒有一個學院派的例子，MIT Sloan Management Review 在2006年夏天出版了一篇由三位名校（MIT/Purdue/Carnegie Mellon）教授共同執筆的 From Niches to Riches: The Anatomy of the Long [...]]]></description>
			<content:encoded><![CDATA[<p>非常令人高兴，我<a title="长尾效应，有没有，有没有？" href="http://www.guwendong.com/post/2009/longtail_netflix.html">抛出了砖</a>，引到了玉。<a title="Roger-漂流手記" href="http://blurkerlab.blogspot.com/">Roger</a> 早在 2007 年，就针对推荐系统与长尾的关系，发表了下面这篇精彩的文章。他的 blog 在 blogspot 上，由于众所周知的原因不太容易访问了。为了方便大家阅读，经 Roger 本人同意，转载在此。<br />
我这里稍稍抱怨一下 Roger，不能总是拿 Daily Murmur 打发我们啊，下面这样的好文章实在应该多写一些啊。最后再说一句，Roger 的 twitter 帐号是 <a title="@imrchen" href="http://twitter.com/imrchen">@imrchen</a>。</p>
<hr size="2">
<br />
<b>推薦系統與長尾<br />
</b>原文作者<b>：</b>Roger<br />
原文地址：<a title="Roger&#39;s Blog - Ramblings on Life and Lab: 推薦系統與長尾" href="http://blurkerlab.blogspot.com/2007/10/blog-post_12.html">http://blurkerlab.blogspot.com/2007/10/blog-post_12.html</a></p>
<p>我們已經談過推薦系統的<a href="http://blurkerlab.blogspot.com/2007/10/netflix-prize.html" title="從 Netlix Prize 滿周歲看推薦系統的數學模型">架構</a>和<a href="http://blurkerlab.blogspot.com/2007/10/blog-post_08.html" title="推薦系統的分類">技術分類</a>，接著我們來觀察推薦系統的目標和成果，是否如研究者或經營者所預期的那麼美好。推薦系統的研究在學界雖然不是紅得發紫，但是一直受到相當程度的關注， <a href="http://blurkerlab.blogspot.com/2007/06/netflix-recommender-prize.html" title="The unusual contest - Netflix Prize">Netflix Prize</a> 的話題一開，更受人注目。在如何建構一個「<b>更好的</b>」推薦系統這個題目上，過去產、學二界攜手的成果，是有目共睹的。</p>
<p>但是我們對於推薦系對銷售究竟有什麼影響，它是如何影響消費者的行為，是否真的達到原先建設推薦系統的目的，則是<span style="color:rgb(204, 0, 0)"><b>所知甚少</b></span>，沒有足夠多的研究可以證實我們的觀點（不管這個觀點的內容是什麼）。</p>
<p><b>第一種觀點：推薦系統促成長尾</b></p>
<p>過去對於推薦系統成效，有兩種截然不同的看法，第一種觀點，可能也是目前較佔上風的觀點，認為推薦系統強化了長尾（Long Tail）的實現，讓銷售方和購買方都得到更多選擇與便利。比如說 <a href="http://www.anobii.com/books/The_Long_Tail/9781401308605/018d825b5011f600cf/" title="網路書櫃 anobii 的書籍介紹">The Long Tail</a> 的作者，就直接了當在書中宣稱我們從資訊時代進入「推薦」時代─We are leaving the Information Age and entering the Recommendation Age（讀者可參考「長尾」在英國出版宣傳時作的 <a href="http://http//64.13.209.91/longtail/LongTail_exclusiveExtract.pdf">Exclusive Extract</a> ，請看第 24 頁）。</p>
<p>這兒有一個學院派的例子，MIT Sloan Management Review 在2006年夏天出版了一篇由三位名校（MIT/Purdue/Carnegie Mellon）教授共同執筆的 <a href="http://sloanreview.mit.edu/smr/issue/2006/summer/13/">From Niches to Riches: The Anatomy of the Long Tail </a>（下載<a href="http://www.heinz.cmu.edu/%7Emds/smr.pdf">PDF</a>）。在這篇文章裡，作者們肯定地說：</p>
<blockquote><p>Our<br />
research suggests that search tools can also be very effective in<br />
allowing consumers to discover and purchase products they otherwise<br />
would not have considered, <b>resulting in changes in sales distribution among a company&#8217;s products.</b></p></blockquote>
<p>作者群在另外一份<a href="http://papers.ssrn.com/sol3/papers.cfm?abstract_id=953587" title="SSRN - Goodbye Pareto Principle, Hello Long Tail: The Effect of Search Costs on the Concentration of Product Sales">論文</a>（Goodbye<br />
Pareto Principle, Hello Long Tail: The Effect of Search Costs on the<br />
Concentration of Product<br />
Sales）裡表示，在他們的研究裡，經由網際網路通路購買產品的消費者，傾向於購買不暢銷或不是很有名的產品（他們用 obscure<br />
這個字眼）。換句話說，作者認為：<u>IT 科技（當然包括了推薦系統）促成了長尾的實現</u>。</p>
<blockquote><p>We<br />
find evidence that Internet purchases made by consumers with prior<br />
experience are more skewed toward obscure products, compared with<br />
consumers who have no such experience.</p></blockquote>
<p><b>第二種觀點：推薦系統錦上添花，結果是強者愈強</b></p>
<p>另外一種看法則和前一種觀點大相逕庭，第二種看法則認為推薦機制（和目前常見的各種行銷手段）只是強化原先銷售成績就出色的前段班產品，對於銷售多元化（diversity）一點幫助也沒有。我們來看個國內的例子：</p>
<p>十月初，<a href="http://b-oo-k.net/blog/">老貓學出版</a>發表的<a href="http://b-oo-k.net/blog/blog.php/2007/288">「好書會自動販賣時代」之消逝</a>一文，談到網路時代的行銷活動與長尾（Long Tail）的關係，顯然老貓認為網路不僅沒有促成長尾，反而讓強者愈強，銷售的模式的錦上添花而不是百花齊放（先說聲抱歉，引文有點長，粗體字和紅字是我加上去的，與原文無關）。&#8230;..</p>
<blockquote><p>&#8230;..<br />
新書區的替換率太快，促使出版社和書店必須做點什麼，以便幫助讀者過濾新書。<b>推薦機制</b>、特價、預購、首賣、獨家封面、落地陳列、贈品、活動、試讀本，所有異於正常發行的動作，都有助於爭取讀者的眼球，讓讀者在茫茫書海中先一步辨認出我的書來。<br />
&#8230;..<br />
過去我們以為網路世界可以為我們帶來可貴的<b>長尾</b>，現在事實證明，<b>網路加速了短頭的極端化</b>。<span style="color:rgb(255, 0, 0)">好賣的書，賣得比過去更好，而沒有行銷資源挹注的書種，賣得比過去更差</span>。（如果有人在博客來上班的話，請別誤會，我的描述並不帶評價，事實上我也不認為虛擬通路無差別地秀出每月兩千種新書的書單會有什麼好處。此外今天這個這個結果也是出版社和通路攜手製造出來的。</p></blockquote>
<p><b>最新的研究</b></p>
<p>線上推薦系統（online recommenders）比起傳統的暢銷排行榜（best-seller lists），的確是一大進步，對於銷售方和消費者都帶來非常大的便利和福祉，這是無庸置疑的。但是<b>推薦系統<span style="color:rgb(255, 0, 0)">是不是</span>真的能帶來銷售的多元化</b> (diversity)，目前並沒有足夠多的研究和討論來支持任何一方的論點。</p>
<p>最近兩位賓州大學<a href="http://www.wharton.upenn.edu/">華頓商學院</a>的學者（Daniel M. Fleder and <a href="http://opim.wharton.upenn.edu/%7Ekartikh/">Kartik Kosenagar</a>）針對上文所描述的爭論，發表了相關的<a href="http://papers.ssrn.com/sol3/papers.cfm?abstract_id=955984" title="Blockbuster Culture&#39;s Next Rise or Fall: The Impact of Recommender Systems on Sales Diversity">研究</a>，兩位作者認為這篇論文是第一個嘗試調和不同論點的研究，論文有<a href="http://papers.ssrn.com/sol3/papers.cfm?abstract_id=955984" title="Blockbuster Culture&#39;s Next Rise or Fall: The Impact of Recommender Systems on Sales Diversity">長</a>、<a href="http://portal.acm.org/citation.cfm?id=1250910.1250939" title="">短</a>兩個版本可以下載，個人認為華頓的線上刊物 <a href="http://knowledge.wharton.upenn.edu/">Knowledge@Wharton</a> 對於這個研究的介紹 ─  <a href="http://knowledge.wharton.upenn.edu/article.cfm?articleid=1818&amp;jsessionid=9a30a2ff46b674337664">&#8216;Reinforcing the Blockbuster Nature of Media&#8217;: The Impact of Online Recommenders</a> 最具參考價值，文章精簡，說明不失深度，而且可以下載 <a href="http://knowledge.wharton.upenn.edu/templates/images/download_audio.gif">Podcast</a> 慢慢聽。Read/Write Web 對這篇論文的<a href="http://www.readwriteweb.com/archives/recommendation_longtail.php" title="Are Recommendation Engines a Threat to the Long Tail?">報導</a>，也值得一讀，這篇報導的讀者回應相當精采，如果時間允許，也不妨看看（Yes, I know. 人一天只有24小時）。</p>
<p>從 <u><b>Reinforcing</b> the Blockuster Nature</u> 的標題，我們可以想見，這個研究認為，推薦系統的確會讓原本的暢銷產品銷售益發興旺，不是豪無保留的認為<b>推薦系統與長尾</b>應該劃上等號的。這篇論文的焦點，是推薦系統與銷售多元發散（diversity才能促成長尾）間的關係，主要觀點如下：</p>
<ul>
<li>有些推薦系統，的確會產生<b> rich-get-richer </b>的現象，使得銷售品項和數量集中，而非多元發展。 </li>
<li>作者強調縱然個別消費者可能透過推薦系統發掘他們原本不熟悉的產品，但是所有消費者加總（aggregate）的結果，是降低而非增加銷售的多方發展。I </li>
<li>推薦系統的設計會影響結果，有些推薦系統會造成長尾效果，有些則會得到相反結果，所以公司的經理人應該考慮自身需求來決定設計的方向。
</li>
</ul>
<p><b>不同的聲音</b></p>
<p>推薦系統研究的開路先鋒 <a href="http://www.si.umich.edu/%7Epresnick/">Paul Resnick</a> 教授， 在部落格<a href="http://presnick.livejournal.com/17768.html">評論</a>上面所提到的研究時，認為 discovery 和 reinforcement 是推薦系統最重要的兩個目的。</p>
<blockquote><p>There are actually two effects that we should expect from recommenders. One is <u>discovery-</u>-<br />
once one person discovers an item, some other people with similar<br />
tastes who would not have found that item do find it. The other is <u>reinforcement</u>&#8211; an item that many people have sampled will be more likely to get recommended.</p></blockquote>
<p>華頓的學者在寫作論文時，和著名的部落客（博客）<a href="http://glinden.blogspot.com/2007/10/recommender-systems-and-diversity.html" title="Recommender systems and diversity">Greg Linden</a> ─ 他在1997-2002 間是 <a href="http://www.amazon.com/">Amazon</a> 員工，負責開發推薦系統 ─ 以電子郵件交換意見。Greg 認為，如果沒有線上推薦系統，消費者只能使用更粗糙的、傳統模式的暢銷排行榜名單來尋找產品，這種情況更加降低銷售的多元化，不可能促成長尾。同時他還表達，推薦系統可藉著調整演算法達到長尾的目的 ─ <span style="color:rgb(204, 0, 0)">Recommendation algorithms easily can be tuned to favor the back catalog &#8212; the long tail &#8212; as Netflix does.</span>。</p>
<p><b>這還不是結論</b></p>
<p>Daniel M. Fleder and <a href="http://opim.wharton.upenn.edu/%7Ekartikh/">Kartik Kosenagar</a> 在文中建構的簡單（two-item, two-player, two-urn model ）模型，是否真的足以完整、正確的模擬消費者行為，還是個開放命題。所以這個方向的研究，絕對不是劃上句點，而是才剛開始而已。</p>
<p>從台灣的觀點來看，本地的網際網路產業，還沒有出現一個品質和 Amazon 、Netflix 比肩的推薦系統，若是真的要討論推薦系統對消費行為的影響，恐怕產生不了足夠堅實的論證，要談本土觀點，恐怕還嫌早了點（sigh）。</p>
<p><b>延伸閱讀：<br />
</b></p>
<ul>
<li><a href="http://blurkerlab.blogspot.com/2007/06/netflix-recommender-prize.html">Netflix Recommender Prize</a> （介紹  Netflix contest）</li>
<li><a href="http://blurkerlab.blogspot.com/2007/10/netflix-prize.html">Netflix 滿週年了</a>（推薦系統的理論模型）</li>
<li><a href="http://blurkerlab.blogspot.com/2007/10/blog-post_08.html">推薦系統的分類</a>
</li>
<li><a href="http://www.netflixprize.com//leaderboard">Netflix Prize 排行榜</a></li>
<li><a href="http://www.readwriteweb.com/archives/recommendation_longtail.php">Are Recommendation Engines a Threat to the Long Tail?</a></li>
<li><a href="http://glinden.blogspot.com/2007/10/recommender-systems-and-diversity.html">Recommender system and diversity</a></li>
<li><a href="http://www.buzzmachine.com/2007/10/09/recommending-the-tail">Recommending the tail</a></li>
</ul>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2009.<br/>
本文网址：<a href="http://www.guwendong.com/post/2009/longtail_roger.html">http://www.guwendong.com/post/2009/longtail_roger.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/longtail" rel="tag">longtail</a>, <a href="http://www.guwendong.com/post/tag/resys" rel="tag">resys</a> | <a href="http://www.guwendong.com/post/2009/longtail_roger.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2009/longtail_roger.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
