<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Beyond Search &#187; social</title>
	<atom:link href="http://www.guwendong.com/post/tag/social/feed" rel="self" type="application/rss+xml" />
	<link>http://www.guwendong.com</link>
	<description>最好走的路越走越难，最难走的路越走越容易</description>
	<lastBuildDate>Wed, 11 Aug 2010 16:43:41 +0000</lastBuildDate>
	
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Social Media Algorithm: StumbleUpon</title>
		<link>http://www.guwendong.com/post/2009/social_media_algorithm_stumbleupon.html</link>
		<comments>http://www.guwendong.com/post/2009/social_media_algorithm_stumbleupon.html#comments</comments>
		<pubDate>Sat, 05 Sep 2009 12:40:32 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[技术研究]]></category>
		<category><![CDATA[algorithm]]></category>
		<category><![CDATA[social]]></category>
		<category><![CDATA[stumbleupon]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2009/social_media_algorithm_stumbleupon.html</guid>
		<description><![CDATA[StumbleUpon 是目前互联网上最老牌也最成功的个性化推荐服务。它创办于 2002 年初，目标很简单，“help people discover interesting or informative web content that they wouldn&#8217;t have thought to search for.”这里面直接突出了“search”和“discover”的区别，这点我非常同意，当你明确自己需要什么的时候，search 有用，但当你漫无目的的游逛的时候，你需要的是 discover。最近正好看到一篇不错的文章，也是在说这个问题，“Finding, Locating, Discovering”。
在 StumbleUpon 身上有一段儿传奇的经历。2007年5月，eBay 花了 75 个 million 的美刀把 StumbleUpon 收入囊中，而且据说当时 Google 对它也很有兴趣。但在归入 eBay 旗下之后，StumbleUpon 并没有取得预期的更大的发展，反而星光暗淡停滞不前了。其实这倒也没什么，要知道绝大多数类似的收购案例都是差不多的结局。但令人意外的是，差不多一年半以后，StumbleUpon 的两位创始人 Garrett Camp 与 Geoff Smith 又把它从 eBay 手里买了回来！算是拯救自己的孩子于水火了。无独有偶，据报道，eBay 刚刚把它2005年收购的 Skype 又给卖了出去。eBay 不好好搞自己的拍卖，当起了高科技二道贩子，让人无语啊。
好了，言归正传，说说 StumbleUpon 的算法吧。毋庸置疑，算法绝对是 StumbleUpon 的 top [...]]]></description>
			<content:encoded><![CDATA[<p><img style="width:188px;height:45px;float:left;margin-left:0pt;margin-right:1em" src="http://docs.google.com/File?id=ddjqwpms_49388qkwxcx_b">StumbleUpon 是目前互联网上最老牌也最成功的个性化推荐服务。它创办于 2002 年初，目标很简单，“help people discover interesting or informative web content that they wouldn&#8217;t have thought to search for.”这里面直接突出了“search”和“discover”的区别，这点我非常同意，当你明确自己需要什么的时候，search 有用，但当你漫无目的的游逛的时候，你需要的是 discover。最近正好看到一篇不错的文章，也是在说这个问题，“<a title="Finding, Locating, Discovering" href="http://thenoisychannel.com/2009/08/31/finding-locating-discovering/">Finding, Locating, Discovering</a>”。</p>
<p>在 StumbleUpon 身上有一段儿传奇的经历。2007年5月，eBay 花了 75 个 million 的美刀把 StumbleUpon 收入囊中，而且据说当时 Google 对它也很有兴趣。但在归入 eBay 旗下之后，StumbleUpon 并没有取得预期的更大的发展，反而星光暗淡停滞不前了。其实这倒也没什么，要知道绝大多数类似的收购案例都是差不多的结局。但令人意外的是，差不多一年半以后，StumbleUpon 的两位创始人 Garrett Camp 与 Geoff Smith 又把它从 eBay 手里买了回来！算是拯救自己的孩子于水火了。无独有偶，据<a title="Confirmed: eBay Sells Skype In Deal Valuing It At $2.75 Billion" href="http://www.techcrunch.com/2009/09/01/confirmed-ebay-sells-skype/">报道</a>，eBay 刚刚把它2005年收购的 Skype 又给卖了出去。eBay 不好好搞自己的拍卖，当起了高科技二道贩子，让人无语啊。</p>
<p>好了，言归正传，说说 StumbleUpon 的算法吧。毋庸置疑，算法绝对是 StumbleUpon 的 top secret，外人是不可能知道确切情况的。所以我这里给出的，只是<a title="Stumbleupon mathematics for stumblers" href="http://blog.venture-skills.co.uk/2007/09/19/stumbleupon-mathematics-for-stumblers/">某位高人</a>经过不断实验得到的推测。</p>
<p>具体的推理过程大家可以看那篇 blog，我这里直接给出结果：用来衡量一篇文章在 StumbleUpon 系统内得分的公式。假设 stumbler a 提交了一篇文章 d，d 属于 domain D。</p>
<div style="text-align:left">
<div style="text-align:left">
<div style="text-align:left"><img style="width:609px;height:61px" src="http://docs.google.com/File?id=ddjqwpms_496gzcxpbdn_b"></div>
</div>
</div>
<p>这里面最重要的一个参数，就是 A -“stumbler audience”。stumbler 指的就是使用 StumbleUpon 的用户，所以顾名思义，stumbler audience 大概说的就是一个 stumbler 在 StumbleUpon 系统内的权重，它由下面三个主要因素构成，</p>
<ul>
<li>Number of fans</li>
<li>Number of thumbs up and down you have given</li>
<li>Stumble thumb bonus – increase to score based on number of thumbs received on a page.</li>
</ul>
<p>
这个公式的大意可以理解为，文章 d 的权重，等于最初的提交者贡献的得分，加上后续 stumble up 用户贡献的得分，再减去后续 stumble down 用户带来的负面影响。<br />
公式具体的解释如下，<br />
1）第一个加号之前的部分，表示 a 的权重，除以 a 在 domain D 内总共提交的文章数。<br />
2）第一个求和部分，表示后续的 stumble up 用户做出的总体贡献。alpha 是 stumble up 操作的调和参数。gamma 表示“organic bonus”，是一个预设值，是对使用了 StumbleUpon Toolbar 的额外加分。delta 表示“nonfriend”惩罚因子，用来减弱无/少 friends 用户的影响力。<br />
3）第二个求和部分与前面这个类似，表示后续的 stumble down 用户对总体得分造成的影响。<br />
5）N，比较奇怪，高人文章里说是一个随机数，不过我没太搞明白为什么要加这么一个参数。</p>
<p>不知道是高人的英文写作水平有问题，还是我的英文阅读能力不行，反正高人的这篇文章看起来非常晦涩，如果我这里的理解有什么问题的话，大家一定帮忙指出来。</p>
<p>延伸阅读：<a title="Social Media排序算法的四种模式" href="http://blog.csdn.net/zhengyun_ustc/archive/2009/09/06/4523916.aspx">Social Media排序算法的四种模式</a>，旁观者 &#8211; 郑昀</p>
<p>最后插一句，汪峰的新专辑<a title="《信仰在空中飘摇》" href="http://www.douban.com/subject/3843530/">《信仰在空中飘摇》</a>，非常之好听，强烈推荐！</p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2009.<br/>
本文网址：<a href="http://www.guwendong.com/post/2009/social_media_algorithm_stumbleupon.html">http://www.guwendong.com/post/2009/social_media_algorithm_stumbleupon.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/algorithm" rel="tag">algorithm</a>, <a href="http://www.guwendong.com/post/tag/social" rel="tag">social</a>, <a href="http://www.guwendong.com/post/tag/stumbleupon" rel="tag">stumbleupon</a> | <a href="http://www.guwendong.com/post/2009/social_media_algorithm_stumbleupon.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2009/social_media_algorithm_stumbleupon.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Social Media Algorithm: Hacker News</title>
		<link>http://www.guwendong.com/post/2009/social_media_algorithm_hackernews.html</link>
		<comments>http://www.guwendong.com/post/2009/social_media_algorithm_hackernews.html#comments</comments>
		<pubDate>Wed, 18 Feb 2009 19:21:27 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[技术研究]]></category>
		<category><![CDATA[algorithm]]></category>
		<category><![CDATA[social]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2009/social_media_algorithm_hackernews.html</guid>
		<description><![CDATA[我发现 Hacker News 是因为 reddit 的缘故。Hacker News 所属的 Y Combinator 是 reddit 的种子投资公司，后来 reddit 卖给了 Condé Nast，两个团队都赚了一票。
 Y Combinator 只关注于最早期的创业团队，在创业团队的起步阶段介入并提供相应的帮助。Y Combinator 会定期举行 Funding Application 的活动，接受创业团队提交的项目资料。项目如果评审通过的话，Y Combinator 会提供一种“$5000 + $5000n”模式的投资，其中 n 指的是愿意参与此项目投资的 Y Combinator 合伙人的人数。比如，如果有 2 个合伙人愿意投资，那么最终的投资额度是 $15000；如果有 3 个的话就是 $20000。作为回报，Y Combinator 将占有创业团队 2% 到 10% 的股份，通常是 6%。钱虽然不多，但在现今创业公司大量使用 open source，AWS 或者 GAE 的情况下，这些钱也确实够展开工作了。
 据说 Y Combinator [...]]]></description>
			<content:encoded><![CDATA[<p>我发现 <a href="http://news.ycombinator.com/" title="Hacker News">Hacker News</a> 是因为 reddit 的缘故。Hacker News 所属的 <a href="http://ycombinator.com/" title="Y Combinator">Y Combinator</a> 是 reddit 的种子投资公司，后来 reddit <a href="http://www.guwendong.com/post/2006/reddit_acquied.html" title="Reddit被收购了">卖给</a>了 Condé Nast，两个团队都赚了一票。</p>
<p> Y Combinator 只关注于最早期的创业团队，在创业团队的起步阶段介入并提供相应的帮助。Y Combinator 会定期举行 Funding Application 的活动，接受创业团队提交的项目资料。项目如果评审通过的话，Y Combinator 会提供一种“$5000 + $5000n”模式的投资，其中 n 指的是愿意参与此项目投资的 Y Combinator 合伙人的人数。比如，如果有 2 个合伙人愿意投资，那么最终的投资额度是 $15000；如果有 3 个的话就是 $20000。作为回报，Y Combinator 将占有创业团队 2% 到 10% 的股份，通常是 6%。钱虽然不多，但在现今创业公司大量使用 open source，AWS 或者 GAE 的情况下，这些钱也确实够展开工作了。</p>
<p> 据说 Y Combinator 已经累计投资了 80 多个创业项目，除 reddit 之外，我还算熟悉的另外一个是 <a href="http://www.scribd.com" title="Scribd">Scribd</a> ——“YouTube for Documents”。Y Combinator 最初总共为 Scribd 提供了 $12000 的投资。Scribd 在 2007 年 5 月正式上线，随即就是飞速地增长，上线一个月之后就完成了 <a href="http://www.techcrunch.com/2007/06/04/scribd-banks-35-million-from-redpoint/" title="Scribd Banks $3.5 Million from Redpoint">$3.5 million</a> 的 A 轮融资，2008 年 12 月又完成了 <a href="http://venturebeat.com/2008/12/19/scribd-raises-9-million-hires-new-president-for-social-publishing/" title="Scribd raises $9 million, hires new president for social publishing">$9 million</a> 的 B 轮融资，发展得很是不错。一个有意思的事情，Scribd 有一个超级 NB 的用户，<b><a href="http://www.scribd.com/barackobama" title="Barack Obama">Barack Obama</a></b>，对，现任美国总统！</p>
<p> 在 Y Combinator 的合伙人中，我个人比较关注的是 <a href="http://www.paulgraham.com/" title="Paul Graham">Paul Graham</a>。他写过一篇流传很广的文章，<a href="http://www.paulgraham.com/start.html" title="How to Start a Startup">How to Start a Startup</a>。Paul 在 <a href="http://www.paulgraham.com/antispam.html" title="Anti Spam">Anti Spam</a> 方面颇有造诣，以前我在研究相关问题时，从他这里学到了很多东西。Paul 是 Lisp 的大牛，另外还是 <a href="http://www.paulgraham.com/arc.html" title="Arc">Arc</a> 语言的设计者，Hacker News 应该就是用 Arc 语言开发的。Paul 始终称自己是一名 programmer，相比于当前乌泱乌泱的架构师，很是洒脱。</p>
<p> 下面言归正传，看看 Hacker News 使用了怎么样的算法。</p>
<p> <a href="http://www.flickr.com/photos/gwd/3253728606/" title="hacker news by guwendong, on Flickr"><img src="http://farm4.static.flickr.com/3508/3253728606_0700bfd6bd_o.png" alt="hacker news"></a> </p>
<p> Hacker News 所使用的公式非常简单，</p>
<p>     (p &#8211; 1) / (t + 2)^1.5</p>
<p> 其中，<br /> 1）p 表示文章得到的投票数，之所以要使用 (p &#8211; 1)，应该是想去掉文章提交者的那一票。<br /> 2）(t + 2)^1.5， 这个是时间因子。t 表示当前时间与文章提交时间间隔的小时数。但为什么要加 2 之后再取 1.5 的幂，似乎就没什么道理可言了，也许是个 trial-and-error 的结果吧。</p>
<p> 总体来讲，Hacker News 的公式不像 <a href="http://www.guwendong.com/post/2008/social_media_algorithm_reddit.html" title="Social Media Algorithm: Reddit">reddit</a> 设计的那么巧妙。但是与 reddit 相比，Hacker News 的用户群比较集中，提交的文章更 Focus，质量也相对更高一些，因此实际的效果并不差。其实某些时候，解决问题就是这样，够用就好。</p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2009.<br/>
本文网址：<a href="http://www.guwendong.com/post/2009/social_media_algorithm_hackernews.html">http://www.guwendong.com/post/2009/social_media_algorithm_hackernews.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/algorithm" rel="tag">algorithm</a>, <a href="http://www.guwendong.com/post/tag/social" rel="tag">social</a> | <a href="http://www.guwendong.com/post/2009/social_media_algorithm_hackernews.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2009/social_media_algorithm_hackernews.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Social Media Algorithm: Reddit</title>
		<link>http://www.guwendong.com/post/2008/social_media_algorithm_reddit.html</link>
		<comments>http://www.guwendong.com/post/2008/social_media_algorithm_reddit.html#comments</comments>
		<pubDate>Wed, 17 Dec 2008 05:15:58 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[技术研究]]></category>
		<category><![CDATA[reddit]]></category>
		<category><![CDATA[social]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2008/social_media_algorithm_reddit.html</guid>
		<description><![CDATA[毫无疑问，互联网媒体的未来是属于 social media 的。
 群体智慧，是 social media 的基础。其基本假设是说，参与到 social 中的群体越多，media 所反应出来的智慧越高超。但如何把群体活动转化为可被使用的智慧呢？这个就是算法发挥作用的地方了。
 本文将陆续披露 Reddit，Stumbleupon，Del.icio.us，Hacker News 等一系列站点所使用到的算法。
 Reddit，背景介绍可以参考我之前写的两篇短文：1）社会新闻网站：Reddit 和 Findory；2）Reddit 被收购了。 
  
 1、公式构成
 假设有一篇文章《Social Media Algorithm》，与其相关的有两个时间 A 和 B，其中，A 为某篇文章的具体发布时间，精确到秒；B 为一个固定的时间常量，2005-12-8 7:46:43。则可以计算得到 A 和 B 间隔的秒数 ts， 
  
 另外，U 表示 《Social Media Algorithm》一文得到的支持票数，D 表示得到的否定票数，则可以计算得到 x， 
  
 定义变量 y， 
  
 [...]]]></description>
			<content:encoded><![CDATA[<p>毫无疑问，互联网媒体的未来是属于 social media 的。</p>
<p> 群体智慧，是 social media 的基础。其基本假设是说，参与到 social 中的群体越多，media 所反应出来的智慧越高超。但如何把群体活动转化为可被使用的智慧呢？这个就是算法发挥作用的地方了。</p>
<p> 本文将陆续披露 <a href="http://www.reddit.com/" title="Reddit">Reddit</a>，<a href="http://www.stumbleupon.com/" title="Stumbleupon">Stumbleupon</a>，<a href="http://delicious.com/" title="Del.icio.us">Del.icio.us</a>，<a href="http://news.ycombinator.com/" title="Hacker News">Hacker News</a> 等一系列站点所使用到的算法。</p>
<p> <b>Reddit</b>，背景介绍可以参考我之前写的两篇短文：1）<a href="http://www.guwendong.com/post/2006/reddit_findory.html" title="社会新闻网站：Reddit 和 Findory">社会新闻网站：Reddit 和 Findory</a>；2）<a href="http://www.guwendong.com/post/2006/reddit_acquied.html" title="Reddit 被收购了">Reddit 被收购了</a>。<br /> 
<div style="padding:1em 0pt;text-align:center"> <a href="http://www.flickr.com/photos/gwd/3142870789/" title="Reddit-Rank by guwendong, on Flickr"><img src="http://farm4.static.flickr.com/3075/3142870789_66027cd733_o.png" alt="Reddit-Rank"></a> </div>
<p> <b>1、公式构成</b></p>
<p> 假设有一篇文章《<a href="http://www.guwendong.com/post/2008/social_media_algorithm_reddit.html" title="Social Media Algorithm">Social Media Algorithm</a>》，与其相关的有两个时间 A 和 B，其中，A 为某篇文章的具体发布时间，精确到秒；B 为一个固定的时间常量，2005-12-8 7:46:43。则可以计算得到 A 和 B 间隔的秒数 t<sub>s</sub>，<br /> 
<div style="padding:1em 0pt;text-align:center"> <a href="http://www.flickr.com/photos/gwd/3142870807/" title="reddit01 by guwendong, on Flickr"><img src="http://farm4.static.flickr.com/3099/3142870807_6b74762561_o.png" alt="reddit01"></a> </div>
<p> 另外，U 表示 《<a href="http://www.guwendong.com/post/2008/social_media_algorithm_reddit.html" title="Social Media Algorithm">Social Media Algorithm</a>》一文得到的支持票数，D 表示得到的否定票数，则可以计算得到 x，<br /> 
<div style="padding:1em 0pt;text-align:center"> <a href="http://www.flickr.com/photos/gwd/3142870827/" title="reddit02 by guwendong, on Flickr"><img src="http://farm4.static.flickr.com/3196/3142870827_95f959263e_o.png" alt="reddit02"></a> </div>
<p> 定义变量 y，<br /> 
<div style="padding:1em 0pt;text-align:center"> <a href="http://www.flickr.com/photos/gwd/3142870741/" title="reddit03 by guwendong, on Flickr"><img src="http://farm4.static.flickr.com/3089/3142870741_bba3d6d901_o.png" alt="reddit03"></a> </div>
<p> 定义变量 z，<br /> 
<div style="padding:1em 0pt;text-align:center"> <a href="http://www.flickr.com/photos/gwd/3143699794/" title="reddit04 by guwendong, on Flickr"><img src="http://farm4.static.flickr.com/3089/3143699794_4f81889401_o.png" alt="reddit04"></a> </div>
<p> 最后定义得分公式 为，<br /> 
<div style="padding:1em 0pt;text-align:center"> <a href="http://www.flickr.com/photos/gwd/3143699856/" title="reddit05 by guwendong, on Flickr"><img src="http://farm4.static.flickr.com/3204/3143699856_4e39ae0b73_o.png" alt="reddit05"></a> </div>
<p> <b>2、公式解释</b></p>
<p> 1）时间点 B，2005-12-8 7:46:43，是一个固定的值，猜测应该是 Reddit 的上线时间。t<sub>s</sub> 反映了文章的新鲜程度。引入 B 是一个非常优雅的技巧，它使得新鲜度的度量可以独立于系统当前时间。<br /> 2）y 表示支持数和否定数之间的相对关系。被否定多的文章得负分，这是合乎常理的。<br /> 3）45000 代表的是一个 12.5 小时周期内的总秒数。它 与 yt<sub>s</sub> 一起使用，随着时间的推移，新文章的得分会逐渐超越高投票数的老文章，从而实现自动更新的效果。<br /> 4）log<sub>10</sub> 的使用是另外一个技巧，它可以使得早期的投票获得更大的权重。比如，前 10 票获得的权重，与 11 到 101 票所获得的权重是一样的。</p>
<p> 整个公式的效果可以简单解释为：在 00:00:00 发布的一个帖子 a，如果它想在 12.5 小时之后，能够取得与在 12:30:00 发布的帖子 b 同样的得分，则必须在 00:00:00 点到 12:30:00 这段时间内，把它的得票数扩大 10 倍。注：这个解释不精确，但容易理解一些，不然写着太绕。<br /> 不过，其中 45000 与 log<sub>10</sub> 的选择不是通用的，得根据自己网站实际的情况进行修正。这是一个 trial-and-error 的过程，也是作算法的人最头大的部分。</p>
<p> <b>3、来源</b><br /> <a href="http://code.reddit.com/" title="code.reddit.com">code.reddit.com</a>，<a href="http://redflavor.com/reddit.cf.algorithm.png" title="Redflavor.com">Redflavor.com</a> 以及 Hacker News 的用户 <a href="http://news.ycombinator.com/user?id=aneesh" title="Aneesh">Aneesh</a>。</p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2008.<br/>
本文网址：<a href="http://www.guwendong.com/post/2008/social_media_algorithm_reddit.html">http://www.guwendong.com/post/2008/social_media_algorithm_reddit.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/reddit" rel="tag">reddit</a>, <a href="http://www.guwendong.com/post/tag/social" rel="tag">social</a> | <a href="http://www.guwendong.com/post/2008/social_media_algorithm_reddit.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2008/social_media_algorithm_reddit.html/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Social Graph 与 Semantic Web</title>
		<link>http://www.guwendong.com/post/2007/social_graph_and_semantic_web.html</link>
		<comments>http://www.guwendong.com/post/2007/social_graph_and_semantic_web.html#comments</comments>
		<pubDate>Sat, 08 Dec 2007 17:10:12 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[三言两语]]></category>
		<category><![CDATA[semantic-web]]></category>
		<category><![CDATA[social]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2007/social_graph_and_semantic_web.html</guid>
		<description><![CDATA[Social Graph，或者称之为 Social Network，最近很是热闹。这自然是拜 MS 与 Facebook 之间 2.4/150 亿美刀 的 big deal 所赐。美国人和中国人其实也没太大的区别，见了花花绿绿的美刀一样是趋之若鹜，拼了老命也要凑个热闹。看 ReadWriteWeb 上的文章，从 Myspace/5.8亿 到 Youtube/16亿 再到如今的 Facebook/150亿，随着价码的提升，热闹程度也在飞速的上升。没办法，谁不爱钱呢？我也爱钱，哈哈。
不过类似的文章读多了也难免审美疲劳，直到看到 Tim Berners-Lee 也出来说话了，才真正刺激我把与此相关的东西，细细地读了一下。收获有一些，但目前还有待梳理。不过，我倒是严重同意 Richard MacManus 对 TimBL 观点的总结，他将网络划分为三个层次：
&#8230; this is how Berners-Lee envisions the 3 levels (a.k.a. layers of abstraction):
1. The Internet: links computers 2. Web: links documents 3. Graph: links relationships between people [...]]]></description>
			<content:encoded><![CDATA[<p>Social Graph，或者称之为 Social Network，最近很是热闹。这自然是拜 MS 与 Facebook 之间 2.4/150 亿美刀 的 big deal 所赐。美国人和中国人其实也没太大的区别，见了花花绿绿的美刀一样是趋之若鹜，拼了老命也要凑个热闹。看 ReadWriteWeb 上的文章，从 Myspace/5.8亿 到 Youtube/16亿 再到如今的 Facebook/150亿，随着价码的提升，热闹程度也在飞速的上升。没办法，谁不爱钱呢？我也爱钱，哈哈。</p>
<p>不过类似的文章读多了也难免审美疲劳，直到看到 <a href="http://www.w3.org/People/Berners-Lee/" title="Tim Berners-Lee">Tim Berners-Lee</a> 也出来<a href="http://dig.csail.mit.edu/breadcrumbs/node/215" title="说话">说话</a>了，才真正刺激我把与此相关的东西，细细地读了一下。收获有一些，但目前还有待梳理。<br />不过，我倒是严重同意 <a href="http://www.readwriteweb.com/archives/social_graph_tim_berners-lee.php" title="Social Graph &amp; Beyond: Tim Berners-Lee&#39;s Graph is The Next Level">Richard MacManus</a> 对 TimBL 观点的总结，他将网络划分为<a href="http://www.w3.org/DesignIssues/Abstractions.html" title="Levels of Abstraction: Net, Web, Graph">三个层次</a>：<br />
<blockquote>&#8230; this is how Berners-Lee envisions the 3 levels (a.k.a. layers of abstraction):
<p>1. The Internet: links computers<br /> 2. Web: links documents<br /> 3. Graph: links relationships between people and/or documents &#8212; &quot;the things documents are about&quot; as Berners-Lee put it.</p>
</blockquote>
<p> 而我个人更倾向于把第 3 层即 Graph 层分开来，这样总共是 4 层。让我们来看一下：<br /> 
<ol>
<li>The Internet: link computers。这个时代诞生了曾经很伟大的 Natscape 公司。</li>
<li>Web: links documents。这个时代诞生了曾经很伟大的 Yahoo! 公司。</li>
<li>Graph: links relationships between documents。这个时代的目标还没有完全实现，但已经诞生了目前还是很伟大的 Google 公司。</li>
<li>Graph: links relationships between people。这个时代会是属于 Facebook 的吗？明白为什么仅仅 link 了 6000 万个用户 relations 的 Facebook 就已经价值 150 亿美刀了吧！他代表了未来的趋势。</li>
</ol>
<p> 当然，如果仅仅是“你 link 我，我 link 他”这样六度空间理论的简单应用，那绝对是远远不够的。每一个时代的每一个伟大的公司，无一例外都是技术上的集大成者！Natscape 开创了浏览器技术，将 HTTP/HTML 推向实用化，让网络漫游成为现实；Yahoo! 开创了基于分类目录的第一代搜索技术，将 Web 技术推向了大规模应用，让浏览网络资料变得非常方便；Google 开创了 以 PageRank 为核心的第二代搜索技术，让用户可以从浩瀚的海量数据中解脱出来，快速准确地检索信息。目前来看，Facebook 最成功的技术创新是通过其 Applicaiton Platform，将原本还局限于企业应用范畴之内的 SOA 技术带入了基于 Web 的新境界。这无疑是非常大的进步！但若仅是如此也许还是不够。正像之前诸如 Lycos、Infoseek 等搜索引擎公司，尽管都曾经非常辉煌过，但一旦 Google Search 这样 Killer 级别的搜索引擎技术出现之后，他们很快就被人淡忘了。Facebook 一样有这样的危险！在这个问题上，我同意 RWW 上 <a href="http://www.readwriteweb.com/archives/why_open_social_matters.php" title="R/WW Thanksgiving: Thank You Google for Open Social (Or, Why Open Social Really Matters)">Alex Iskold 的观点</a>：<br /> <br />
<blockquote>&#8230; The Facebook platform is what made Facebook into &quot;the company&quot; of 2007. If everyone has the platform and not a proprietary, but standard platform, then Facebook&#39;s value shrinks back to the size of its current audience. &#8230; There is a chance that it[Facebook] is going to play the Apple &quot;we are the best and closed&quot; card, but it is a rather small one. &#8230; Consumers are going to recognize that if their social graph is portable and if their attention information is portable in social networks, then it should be portable at large. People are going to demand that their Amazon purchasing history and Netflix rental history is accessible via open API. If that happens, we will effectively enter the age of the attention economy.</p></blockquote>
<p> 援引下面这段 TimBL 关于 Social Graph 与 Semantic Web 技术的总结。我认为，能够打败 Facebook 的，或者说可以使 Facebook 立于不败之地的，应该就是 Semantic Web 这样的技术。<br /> <br />
<blockquote>&#8230; if only we could express these relationships, such as my social graph, in a way that is above the level of documents, then we would get re-use. That&#39;s just what the graph does for us. We have the technology &#8212; it is Semantic Web technology, starting with RDF OWL and SPARQL. Not magic bullets, but the tools which allow us to break free of the document layer. &#8230; If a social network site uses a common format for expressing that I know Dan Brickley, then any other site or program (when access is allowed) can use that information to give me a better service.</p></blockquote>
<p> 毫无疑问，Google 的 <a href="http://code.google.com/apis/opensocial/" title="Open Social">Open Social</a> 是 Facebook 最有力的挑战者，尽管他目前看起来还很不成熟。一直以来，我比较关注 Google 在 Semantic Web 方面的动作，从 2003 年收购 <a href="http://www.appliedsemantics.com/" title="Applied Semantics">Applied Semantics</a>，到大师级人物 <a href="http://norvig.com/" title="Peter Norvig">Peter Norvig</a> 与 TimBL 在 2006 年 <a href="http://aaai.org/Conferences/AAAI/aaai06.php" rel="nofollow">AAAI</a> 会议上关于 Semantic Web 的<a href="http://www.zdnet.com.au/news/software/soa/Google-exec-challenges-Berners-Lee/0,130061733,139263931,00.htm" title="Google exec challenges Berners-Lee">碰撞</a>，再到 <a href="http://norvig.com/" title="Peter Norvig">Peter Norvig</a> 自己对“<a href="http://blogoscoped.com/archive/2005-01-18.html" title="Norvig on the Semantic Web">Semantice Web 可以做什么，不可以做什么</a>”的总结，无不在透露着 Google 一直在 Semantic Web 方面进行着试探。同 <a href="http://blog.donews.com/sayonly/archive/2005/10/28/605465.aspx" title="Google Home Base">Sayonly</a> 一样，我也认为 <a href="http://base.google.com/" title="Google Base">Google Base</a> 是 Google 在 Semantic Web 方向上的一次尝试。而 Open Social 很可能也是 Google 本在密谋着的又一个 Semantic Web 应用，只不过由于 Facebook 的出现打乱了 Google 自己的计划，迫使其不得不匆忙着推出来。</p>
<p> Facebook 与 Open Social 商业上的竞争倒也让人很感兴趣。利益作祟会让貌似强大的 Open Social 瓦解吗？如果 Open Social 真发展的有模有样，Facebook 会加入进来吗？比较极端的是下面这个<a href="http://radar.oreilly.com/archives/2007/11/opensocial_social_mashups.html" title="OpenSocial: It&#39;s the data, stupid">观点</a>，不过我同意！<br /> <br />
<blockquote>Set the data free! Allow social data mashups. That&#39;s what will be the trump card in building the winning social networking platform.</p></blockquote>
<p>罗列一下我个人比较感兴趣的 Social Graph 相关的文章：<br /> 
<ol>
<li>TimBL 的原文：<a href="http://dig.csail.mit.edu/breadcrumbs/node/215" title="Giant Global Graph">Giant Global Graph</a>。</li>
<li><a href="http://www.w3.org/DesignIssues/Abstractions.html" title="Levels of Abstraction: Net, Web, Graph">Levels of Abstraction: Net, Web, Graph</a>。</li>
<li><a href="http://blogs.talis.com/nodalities/2007/11/who_is_afraid_of_the_ggg.php" title="Who is afraid of the GGG?">Social Graph: Concepts and Issues</a>。</li>
<li><a href="http://bradfitz.com/social-graph-problem/" title="Thoughts on the Social Graph">Thoughts on the Social Graph</a>。</li>
<li> 由 TimBL 文章引发的讨论，大部分在这里都可以看到：<a href="http://blogs.talis.com/nodalities/2007/11/who_is_afraid_of_the_ggg.php" title="Who is afraid of the GGG?">Who is afraid of the GGG?</a>。</li>
<li>一个有意思的实验：<a href="http://www.openlinksw.com/blog/%7Ekidehen/?id=1237" title="Injecting Facebook Data into the Semantic Data Web">Injecting Facebook Data into the Semantic Data Web</a>。</li>
</ol>
<p>对 Semantic Web 感兴趣的朋友，可以看看我的《<a href="http://www.guwendong.com/catalog.asp?cate=3" title="Semantic Web系列">Semantic Web系列</a>》文章。</p>
<p> 还有一件可以肯定的事情，http://www.opensocial.com/，这个域名一定会很值钱！^_^</p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2007.<br/>
本文网址：<a href="http://www.guwendong.com/post/2007/social_graph_and_semantic_web.html">http://www.guwendong.com/post/2007/social_graph_and_semantic_web.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/semantic-web" rel="tag">semantic-web</a>, <a href="http://www.guwendong.com/post/tag/social" rel="tag">social</a> | <a href="http://www.guwendong.com/post/2007/social_graph_and_semantic_web.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2007/social_graph_and_semantic_web.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
