<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Beyond Search &#187; 语义网</title>
	<atom:link href="http://www.guwendong.com/post/category/semweb/feed" rel="self" type="application/rss+xml" />
	<link>http://www.guwendong.com</link>
	<description>最好走的路越走越难，最难走的路越走越容易</description>
	<lastBuildDate>Wed, 11 Aug 2010 16:43:41 +0000</lastBuildDate>
	
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Digg+RDFa</title>
		<link>http://www.guwendong.com/post/2008/digg_rdfa.html</link>
		<comments>http://www.guwendong.com/post/2008/digg_rdfa.html#comments</comments>
		<pubDate>Sun, 25 May 2008 11:25:40 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[语义网]]></category>
		<category><![CDATA[digg]]></category>
		<category><![CDATA[rdf]]></category>
		<category><![CDATA[semantic-web]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2008/digg_rdfa.html</guid>
		<description><![CDATA[5月初，Digg 宣布在其新闻页面里，加入对 semantic markup [1]  的支持。目前支持 3 种：XFN，hCard，以及最重要的 RDFa [1]。
想看实际用法的，可以在 Digg 新闻页面的源代码里，搜索“property”。比如在这个页面里 http://digg.com/tech_news/In_Google_we_trust_but_should_we，你可以找到类似于这样的内容，“&#60;a href=&#34;http://www.guardian.co.uk/technology/2008/may/22/internet.google&#34; rel=&#34;dc:source&#34; property=&#34;dc:title&#34;&#62;In Google we trust &#8211; but should we?&#60;/a&#62;”。 如果安装了 RDFa bookmarklets 的话，可以看到更形象的效果，类似下面。 

 使用 RDFa Highlight 标亮页面上的 N3 Triples。  
使用 GetN3 extractor 抽取出来的 N3 Tripes 文本。
  &#60;http://digg.com/tech_news/In_Google_we_trust_but_should_we&#62;　　&#60;http://purl.org/dc/elements/1.1/source&#62;　　　　&#60;http://www.guardian.co.uk/technology/2008/may/22/internet.google&#62;&#60;http://digg.com/tech_news/In_Google_we_trust_but_should_we&#62;　　&#60;http://purl.org/dc/elements/1.1/title&#62;　　　　&#34;In Google we trust &#8211; but should we?&#34; &#60;http://digg.com/tech_news/In_Google_we_trust_but_should_we&#62;　　&#60;http://purl.org/dc/terms/abstract&#62;　　　　&#34;Google is more [...]]]></description>
			<content:encoded><![CDATA[<p>5月初，Digg <a href="http://blog.digg.com/?p=120" title="宣布">宣布</a>在其新闻页面里，加入对 <a href="http://www.guwendong.com/catalog.asp?cate=3" title="Semantic Web 系列">semantic markup</a> <a href="http://en.wikipedia.org/wiki/Semantic_Web" title="[1]">[1]</a>  的支持。目前支持 3 种：<a href="http://en.wikipedia.org/wiki/XHTML_Friends_Network" title="XFN">XFN</a>，<a href="http://en.wikipedia.org/wiki/Hcard" title="hCard">hCard</a>，以及最重要的 <a href="http://www.w3.org/TR/xhtml-rdfa-primer/" title="Embedding Structured Data in Web Pages">RDFa</a> <a href="http://en.wikipedia.org/wiki/RDFa" title="RDFa @ Wikipedia">[1]</a>。</p>
<p>想看实际用法的，可以在 Digg 新闻页面的源代码里，搜索“property”。比如在这个页面里 <br />http://digg.com/tech_news/In_Google_we_trust_but_should_we，你可以找到类似于这样的内容，<br />“&lt;<span>a</span><span> href</span>=<span>&quot;http://www.guardian.co.uk/technology/2008/may/22/internet.google&quot; </span><b><span style="color:#ff0000"><span>rel</span>=</span><span><span style="color:#ff0000">&quot;dc:source&quot;</span> </span><span style="color:#ff0000"><span>property</span>=<span>&quot;dc:title&quot;</span></span></b>&gt;<br />In Google we trust &#8211; but should we?&lt;/<span>a</span>&gt;”。<br /> 如果安装了 <a href="http://www.w3.org/2006/07/SWD/RDFa/impl/js/" title="RDFa bookmarklets">RDFa bookmarklets</a> 的话，可以看到更形象的效果，类似下面。<br /> 
<ol>
<li> 使用 <span>RDFa Highlight 标亮页面上的 </span>N3 Triples。<br /> <img src="http://docs.google.com/File?id=ddjqwpms_244hnccg9hd_b" style="width:684px;height:138px"> </li>
<li>使用 GetN3 extractor 抽取出来的 N3 Tripes 文本。</li>
<p>  &lt;http://digg.com/tech_news/In_Google_we_trust_but_should_we&gt;<br />　　&lt;http://purl.org/dc/elements/1.1/source&gt;<br />　　　　&lt;http://www.guardian.co.uk/technology/2008/may/22/internet.google&gt;<br />&lt;http://digg.com/tech_news/In_Google_we_trust_but_should_we&gt;<br />　　&lt;http://purl.org/dc/elements/1.1/title&gt;<br />　　　　&quot;In Google we trust &#8211; but should we?&quot; &lt;http://digg.com/tech_news/In_Google_we_trust_but_should_we&gt;<br />　　&lt;http://purl.org/dc/terms/abstract&gt;<br />　　　　&quot;Google is more vulnerable to competitors than people think.&quot; .<br /> &lt;http://digg.com/tech_news/In_Google_we_trust_but_should_we&gt;<br />　　&lt;http://purl.org/dc/elements/1.1/creator&gt;<br />　　　　&lt;http://digg.com/users/dagorret&gt; .<br /> &lt;http://digg.com/tech_news/In_Google_we_trust_but_should_we&gt;<br />　　&lt;http://purl.org/dc/elements/1.1/date&gt;<br />　　　　&quot;2008-05-22 11:45:13&quot; .   </ol>
<p> 最早的 <a href="http://www.w3.org/RDF/" title="RDF">RDF</a> <a href="http://en.wikipedia.org/wiki/Resource_Description_Framework" title="Resource Description Framework @ Wikipedia">[1]</a> <a href="http://www.guwendong.com/post/2006/rdf.html" title="Semantic Web：RDF实战">[2]</a>，由于其比较难于理解，并且操作复杂，导致其始终没有推广起来。W3C 组织受到轻量级规范如 <a href="http://microformat.org/" title="Microformats">Microformats</a> 的启发，推出了新的经过简化的 <a href="http://www.w3.org/TR/xhtml-rdfa-primer/" title="Embedding Structured Data in Web Pages">RDFa</a> <a href="http://en.wikipedia.org/wiki/RDFa" title="RDFa @ Wikipedia">[1]</a> 规范。从其官方描述“Embedding Structured Data in Web Pages”，就可以看出来，它是一种嵌入到 HTML/XHTML 中的数据。要说 RDFa 的实现比 Microformats 还是要复杂一些，不过它的适用性更广，对于可以通过 RDF 表达的任何内容， 都能够使用 RDFa 添加到 XHTML 文档中，而且不再需要使用繁琐的 XML 语言进行描述。这使得基于现有 Web 内容实现 Semantic Web，成本低了不少，也更靠谱了。</p>
<p>希望可以有更多的 Applicaitons 向 Digg 看齐，让 RDFa 的队伍壮大起来。<br />这里需要谴责一下 <a href="http://www.powerset.com/" title="Powerset">Powerset</a>，号称 Semantic Web 的 Killer App，居然都不支持 RDFa。</p>
<p>            推荐阅读：<br /> 
<ol>
<li><a href="http://www.digital-web.com/articles/writing_semantic_markup/" title="Writing Semantic Markup">Writing Semantic Markup</a> </li>
<li><a href="http://www.xml.com/pub/a/2007/02/14/introducing-rdfa.html" title="Introducing RDFa">Introducing RDFa</a>  </li>
</ol>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2008.<br/>
本文网址：<a href="http://www.guwendong.com/post/2008/digg_rdfa.html">http://www.guwendong.com/post/2008/digg_rdfa.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/digg" rel="tag">digg</a>, <a href="http://www.guwendong.com/post/tag/rdf" rel="tag">rdf</a>, <a href="http://www.guwendong.com/post/tag/semantic-web" rel="tag">semantic-web</a> | <a href="http://www.guwendong.com/post/2008/digg_rdfa.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2008/digg_rdfa.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Semantic Web: SPARQL——RDF查询语言</title>
		<link>http://www.guwendong.com/post/2006/semweb_intro_6.html</link>
		<comments>http://www.guwendong.com/post/2006/semweb_intro_6.html#comments</comments>
		<pubDate>Thu, 30 Nov 2006 19:19:11 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[语义网]]></category>
		<category><![CDATA[rdf]]></category>
		<category><![CDATA[semantic-web]]></category>
		<category><![CDATA[sparql]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2006/semweb_intro_6.html</guid>
		<description><![CDATA[SPARQL，和“sparkle”的发音一样，它是一种 RDF 查询语言，可以从 RDF 图中查询信息。在 W3C Technical Reports and Publications 页面上，我们可以看到，现在和 SPARQL 相关的共有三项内容：其中两个是 Candidate Recommendations（候选推荐），SPARQL Protocol for RDF 和 SPARQL Query Results XML Format；另外一个是 Word Drafts（工作草案），SPARQL Query Language for RDF。上了这个页面，基本上就已经说明这个要成为 W3C 的推荐标准了，就像 RDF 和 OWL 一样。而且，在 WWW2006 发言时，TimBL 也已经表示，随着 SPARQL 查询语言即将完成标准化，语义网已经具备了成功所需要的所有标准和技术，Web开发人员和内容创作人员可以开始使用这些语义语言了。
在 SPARQL 之前，已经有不少研究人员致力于开发针对 RDF 的查询语言，在这个网页  http://www.w3.org/2001/11/13-RDF-Query-Rules/ 上有一个比较完整的列表。SPARQL 是基于以前的 RDF 查询语言（如rdfDB、RDQL 和 SeRQL）发展而来的，拥有一些有价值的新特性，并且受到 Jena 开发团队的鼎立支持。Jena [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.w3.org/TR/rdf-sparql-query/">SPARQL</a>，和“sparkle”的发音一样，它是一种 RDF 查询语言，可以从 <a href="http://www.w3.org/RDF/">RDF</a> 图中查询信息。在 <a href="http://www.w3.org/TR/">W3C Technical Reports and Publications</a> 页面上，我们可以看到，现在和 SPARQL 相关的共有三项内容：其中两个是 Candidate Recommendations（候选推荐），<a href="http://www.w3.org/TR/2006/CR-rdf-sparql-protocol-20060406/">SPARQL Protocol for RDF</a> 和 <a href="http://www.w3.org/TR/2006/CR-rdf-sparql-XMLres-20060406/">SPARQL Query Results XML Format</a>；另外一个是 Word Drafts（工作草案），<a href="http://www.w3.org/TR/2006/WD-rdf-sparql-query-20061004/">SPARQL Query Language for RDF</a>。上了这个页面，基本上就已经说明这个要成为 W3C 的推荐标准了，就像 RDF 和 OWL 一样。而且，在 <a href="http://www2006.org/">WWW2006</a> 发言时，TimBL 也已经<a href="http://uk.builder.com/webdevelopment/design/0,39026630,39313738,00.htm">表示</a>，随着 <font>SPARQL 查询语言即将完成标准化</font>，<font>语义网已经具备了成功所需要的所有标准和技术，</font><font>Web开发人员和内容创作人员可以开始使用这些语义语言了。</font></p>
<p>在 SPARQL 之前，已经有不少研究人员致力于开发针对 RDF 的查询语言，在这个网页  <a href="http://www.w3.org/2001/11/13-RDF-Query-Rules/">http://www.w3.org/2001/11/13-RDF-Query-Rules/</a> 上有一个比较完整的列表。SPARQL 是基于以前的 RDF 查询语言（如rdfDB、RDQL 和 SeRQL）发展而来的，拥有一些有价值的新特性，并且受到 Jena 开发团队的鼎立支持。Jena 是 HP 公司语义网研究小组开发的一套 Java 工具包，用来支持人们进行语义网的相关研究和应用开发。SPARQL 的语法细节这里就不一一列举了，直接给出一个例子。总体来说，SPARQL 的语法和传统 SQL 的语法还是有几分相似的，大家应该不会陌生。</p>
<table width="90%" cellspacing="1" cellpadding="5" border="0" bgcolor="#cccccc">
<tr>
<td bgcolor="#e5e5e5">BASE &lt;http://my.donews.com/&gt;<br />
PREFIX rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt;<br />
PREFIX foaf: &lt;http://xmlns.com/foaf/0.1/&gt;<br />
# 这是一个以 BASE 为根的相对 IRI</p>
<div>PREFIX user: &lt;users#&gt;</div>
<p>SELECT ?person ?name ?age<br />
FROM &lt;users.rdf&gt;<br />
WHERE {<br />
?person a foaf:Person ;<br />
foaf:name ?name .<br />
OPTIONAL { ?person user:age ?age } .<br />
FILTER (REGEX(?name, “clickstone”))<br />
}<br />
ORDER BY ASC(?name)<br />
LIMIT 10<br />
OFFSET 10</p>
</td>
</tr>
</table>
<p>简要的说明一下例子中出现的语法。</p>
<ol>
<li>BASE，根 IRI，其他以此为根的 IRI 就可以写成相对形式了，见例子里面的注释。一旦定义了 BASE，就可以在 SPARQL 的任何地方进行使用了，例子中共用到了 2 处。</li>
<li>使用 # 进行注释。</li>
<li>PREFIX，IRI 前缀的缩写。</li>
<li>SELECT，查询关键字，和 SQL 中的一个意思。</li>
<li>?person ?name ?age，要查询的变量，使用 ? 标识变量，也可以使用 $。变量间使用空白分隔（现在正在<a href="http://www.w3.org/TR/rdf-sparql-query/#punctuationSyntax">征集意见</a>，正式标准中使用空白还是逗号分隔尚未最终确定）。</li>
<li>FROM，从何处查询数据。可以一次查询多个 RDF 数据集，只需要使用 FROM 逐一列出即可。</li>
<li>WHERE，过滤条件集合，和 SQL 的 WHERE 一个意思。</li>
<li>?person a foaf:Person，具体的过滤条件，使用 <a href="http://www.dajobe.org/2004/01/turtle/">Turtle</a> 语法。还记得“a”是什么意思吗？具体的介绍可以参看《<a href="http://my.donews.com/clickstone/2006/11/23/amnvbeuqomlpszgvpnlhoxjfovkecyedlrym/">RDF 实战</a>》。</li>
<li>例子中两个过滤条件的主语都是“?person”，因此，使用了简写的形式。如果主语不同，逐一列出检索条件即可。</li>
<li>OPTIONAL，可选过滤条件。比如有些 ?person 可能没有填写 age 属性，如果不使用 OPTIONAL，那么查询结果将不包含这些 ?person；使用了 OPTIONAL 关键字，没有填写 age 属性的 ?person，同样可以被查询到。</li>
<li>FILTER (REGEX(?name, “clickstone”))，明确化的过滤条件，类似于 SQL 中的 LIKE、=、&gt;  等的左右。例子中的意思是说，返回的 ?name 变量中，必须包含“clickstone”。</li>
<li>ORDER BY，排序，可以指定多个排序，比如例子可以改为，ORDER BY ASC(?name) DESC(?age)。默认排序是 ASC。</li>
<li>LIMIT 10，将返回结果限定在 10 条，类似于 SQL 中的 SELECT TOP 10。</li>
<li>OFFSET 10，掠过前边的 10 条，从 第 11 条开始返回。这个功能比 SQL 强大，SQL 要自己写翻页。</li>
</ol>
<p>其他的还有 UNION、DISTINCT 等的使用，大家就自己看<a href="http://www.w3.org/TR/rdf-sparql-query/">文档</a>吧。但必须强调一点，SPARQL 的使用中和 SQL 一个非常大的区别，需要大家注意：<strong>SELECT 子句中出现的变量</strong>，比如例子中的 ?person ?name ?age，<strong>在 WHERE 子句中必须全部出现</strong>。为什么会这样呢？因为对于一个 SPARQL 查询处理器来讲，它不具备类似于关系数据库中数据字典的东西以供参考，所以每一个 SELECT 的变量，在 WHERE 中必须指定一个用来匹配的triple。</p>
<p>这篇文章只是抛砖引玉，更详细的内容，还需要大家深入研究。推荐阅读：<a href="http://www.xml.com/pub/a/2005/11/16/introducing-sparql-querying-semantic-web-tutorial.html">Introducing SPARQL: Querying the Semantic Web</a>。欢迎互动交流。</p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2006.<br/>
本文网址：<a href="http://www.guwendong.com/post/2006/semweb_intro_6.html">http://www.guwendong.com/post/2006/semweb_intro_6.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/rdf" rel="tag">rdf</a>, <a href="http://www.guwendong.com/post/tag/semantic-web" rel="tag">semantic-web</a>, <a href="http://www.guwendong.com/post/tag/sparql" rel="tag">sparql</a> | <a href="http://www.guwendong.com/post/2006/semweb_intro_6.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2006/semweb_intro_6.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Semantic Web: RDF实战</title>
		<link>http://www.guwendong.com/post/2006/semweb_intro_5.html</link>
		<comments>http://www.guwendong.com/post/2006/semweb_intro_5.html#comments</comments>
		<pubDate>Wed, 22 Nov 2006 14:50:36 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[语义网]]></category>
		<category><![CDATA[rdf]]></category>
		<category><![CDATA[semantic-web]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2006/semweb_intro_5.html</guid>
		<description><![CDATA[前面的几篇文章里，对 Sementic Web 的整体情况做了一些介绍。都是一些非常概念化的东西，刚开始接触 Semantic Web 的人可能不太容易理解。不过其实总结一下，核心概念主要是这么几个：RDF、OWL和Ontology。今天围绕 RDF 动手作一些练习。
先看一个简单的例子：http://my.donews.com/clickstone/index.html 这个网页的作者是 clickstone。这是我们使用自然语言的表达方法。使用 RDF，我们需要首先提取出这句话的主干意思。被描述的事物是 “http://my.donews.com/clickstone/index.html”；他有一个“作者”属性；属性的值是“clickstone”。
RDF 正是基于这一思想：被描述的事物具有一些属性，这些属性各自有不同类型的值；对资源的描述可以通过对它作出指定了上述属性及值的陈述来进行 （就像上面例子中的那样）。RDF 用一套特定的术语来表达陈述中的各个部分，简单地讲：被陈述的事物称为 “主体” (例如上例中的“http://my.donews.com/clickstone/index.html”)；主题的属性称为“谓词”（例如上例中的“作 者”）；属性的值成为“客体”（例如上例中的“clickstone”）；主体、谓词和客体，构成一个“RDF 陈述”。
上一篇里，我们提到可以使用三种方法来表示这种陈述：图形、Notation3（N3）和XML。图形是最为形象直观的一种方法。RDF 可以将关于资源的陈述表示为一个由结点和弧组成的图，其中的弧的起始节点是主体资源；弧本身代表资源的属性；弧的结束节点是属性值，可以是原生值，也可以另外一个资源。还以“http://my.donews.com/clickstone/index.html”为主体，可以给出一组复杂一些的陈述：有一个网页他使用 http://my.donews.com/clickstone/index.html 作为标识，他的作者作者是clickstone，他的名称是 Beyond Search，他的主题是 Semantic Web。这组陈述可以使用图1表示。
图1 RDF示例图
使用 RDF 的语言来描述图1：
1、主体为网页，他的URI标识为“http://my.donews.com/clickstone/index.html” 。
2、谓词为creator、title、subject 等，表示属性，属性也有URI标识，图上省略了。完整的属性URI标识图上给了一个例子，“http://www.w3.org/1999/02/22-rdf-syntax-ns#type”，其中属性名为 type，URI标识为 http://www.w3.org/1999/02/22-rdf-syntax-ns。
3、客体为clickstone、“Beyond Search”和“Semantic Web”，其类型不同。clickstone 表示一个实体属性，他是Person类的一个实例。“Beyond Search”通常被称为“原生值”，字符串、数字等都可以看作原生值。“Semantic Web”也可以看作一个“原生值”属性，所不同的是他给出了一个参考(refrences)资源。
计算机无法理解 RDF 的图形表示。为了用一种计算机可处理的方式来表示 RDF 陈述，RDF 定义了一种基于 XML 的描述语法，称为 RDF/XML。在RDF/XML 语言里，有一些已经定义好的元语可以使用。通常情况下，主体节点对应于一个 rdf:Description 节点，我们称之为“主体节点”，主体的 URI 作为主体节点的 rdf:about 属性的值。谓词的 URI [...]]]></description>
			<content:encoded><![CDATA[<p>前面的<a href="http://my.donews.com/clickstone/tag/semantic-web/">几篇文章</a>里，对 Sementic Web 的整体情况做了一些介绍。都是一些非常概念化的东西，刚开始接触 Semantic Web 的人可能不太容易理解。不过其实总结一下，核心概念主要是这么几个：RDF、OWL和Ontology。今天围绕 RDF 动手作一些练习。</p>
<p>先看一个简单的例子：http://my.donews.com/clickstone/index.html 这个网页的作者是 clickstone。这是我们使用自然语言的表达方法。使用 RDF，我们需要首先提取出这句话的主干意思。被描述的事物是 “http://my.donews.com/clickstone/index.html”；他有一个“作者”属性；属性的值是“clickstone”。<br />
RDF 正是基于这一思想：被描述的事物具有一些属性，这些属性各自有不同类型的值；对资源的描述可以通过对它作出指定了上述属性及值的陈述来进行 （就像上面例子中的那样）。RDF 用一套特定的术语来表达陈述中的各个部分，简单地讲：被陈述的事物称为 “主体” (例如上例中的“http://my.donews.com/clickstone/index.html”)；主题的属性称为“谓词”（例如上例中的“作 者”）；属性的值成为“客体”（例如上例中的“clickstone”）；主体、谓词和客体，构成一个“RDF 陈述”。</p>
<p><a href="http://my.donews.com/clickstone/2006/11/18/rhdgoctxquandbzrilghxuezqcraaspratyo/">上一篇</a>里，我们提到可以使用三种方法来表示这种陈述：图形、Notation3（N3）和XML。图形是最为形象直观的一种方法。RDF 可以将关于资源的陈述表示为一个由结点和弧组成的图，其中的弧的起始节点是主体资源；弧本身代表资源的属性；弧的结束节点是属性值，可以是原生值，也可以另外一个资源。还以“http://my.donews.com/clickstone/index.html”为主体，可以给出一组复杂一些的陈述：有一个网页他使用 http://my.donews.com/clickstone/index.html 作为标识，他的作者作者是clickstone，他的名称是 Beyond Search，他的主题是 Semantic Web。这组陈述可以使用图1表示。<br />
<img alt="RDF sample" src="http://static.flickr.com/105/303746011_fa6d152110.jpg?v=0">图1 RDF示例图</p>
<p>使用 RDF 的语言来描述图1：<br />
1、主体为网页，他的URI标识为“http://my.donews.com/clickstone/index.html” 。<br />
2、谓词为creator、title、subject 等，表示属性，属性也有URI标识，图上省略了。完整的属性URI标识图上给了一个例子，“http://www.w3.org/1999/02/22-rdf-syntax-ns#type”，其中属性名为 type，URI标识为 http://www.w3.org/1999/02/22-rdf-syntax-ns。<br />
3、客体为clickstone、“Beyond Search”和“Semantic Web”，其类型不同。clickstone 表示一个实体属性，他是Person类的一个实例。“Beyond Search”通常被称为“原生值”，字符串、数字等都可以看作原生值。“Semantic Web”也可以看作一个“原生值”属性，所不同的是他给出了一个参考(refrences)资源。</p>
<p>计算机无法理解 RDF 的图形表示。为了用一种计算机可处理的方式来表示 RDF 陈述，RDF 定义了一种基于 XML 的描述语法，称为 RDF/XML。在RDF/XML 语言里，有一些已经定义好的元语可以使用。通常情况下，主体节点对应于一个 rdf:Description 节点，我们称之为“主体节点”，主体的 URI 作为主体节点的 rdf:about 属性的值。谓词的 URI 写为 XML QNames，以主体节点的子节点的形式编写，称之为“属性节点”。客体不作为独立的节点，根据类型不同，其 XML 表示形式也有所区别：一般的原生值，通常记做属性节点的内容；如果是一个资源值，通常在谓词节点中加入 rdf:resource 属性表示客体，其值为客体的 URI。例如，将图1使用RDF/XML可以表示为，</p>
<p>&lt;rdf:RDF xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#”<br />
xmlns:rdfs=”http://www.w3.org/2000/01/rdf-schema#”<br />
xmlns:dc=”http://purl.org/dc/elements/1.1/”<br />
xmlns:contact=”http://www.w3.org/2000/10/swap/pim/contact#”&gt;</p>
<p>&lt;rdf:Description rdf:about=”http://my.donews.com/clickstone/index.html”&gt;<br />
&lt;dc:creator rdf:resource=”http://my.donews.com/users/clickstone”/&gt;<br />
&lt;dc:title&gt;Beyond Search&lt;/dc:title&gt;<br />
&lt;dc:subject rdf:resource=”Semantic Web” /&gt;<br />
&lt;/rdf:Description&gt;<br />
&lt;rdf:Description rdf:about=”Semantic Web”&gt;<br />
&lt;rdf:seeAlso rdf:resource=”http://www.w3.org/2001/sw/” /&gt;<br />
&lt;/rdf:Description&gt;<br />
&lt;contact:Person rdf:about=”http://my.donews.com/users/clickstone”/&gt;</p>
<p>&lt;/rdf:RDF&gt;</p>
<p>RDF/XML 有一个最大的问题，他不具备约束其结构的 XML Schema。RDF Schema 的名字让人很容易误以为是干这个用的，其实不是，他被称为“<a href="http://www.w3.org/TR/rdf-schema/">RDF 词汇描述语言</a>”，和 XML Schema 的作用相去甚远。缺乏约束导致 RDF/XML 的写法没有标准，人们使用起来效果不是很好。</p>
<p>Notation 3，N3，是另外一种 RDF 表示方法，他相比 RDF/XML 大为简洁。他将 RDF 陈述写成一个依次为主体，谓词，客体的三元组形式。每一个三元组均对应于 RDF 图中的一条弧，且这个弧的起始节点和终止节点分别是陈述中的主体和客体。和图形表示法不同，三元组表示法要求一个节点在它出现的每个陈述中都要有标识。例如，“http://my.donews.com/clickstone/index.html 的作者是 clickstone”这个陈述，使用 N3 表示为，“   .”。注意，N3 写法中，末尾需要有一个“.”。上面这个例子看起来一点儿也不简洁，这主要是因为 URI 标识的原因。和 XML 的 Namespace 概念类似的，N3 中可以定义“前缀”，用“@prefix”来表示，例如，“@prefix dc:  .”。将图1使用 N3 可以表示为，</p>
<p>@prefix rdf: &lt;http://www.w3.org/1999/02/22-rdf-syntax-ns#&gt; .<br />
@prefix rdfs: &lt;xmlns:rdfs=”http://www.w3.org/2000/01/rdf-schema#&gt; .<br />
@prefix dc: &lt;http://purl.org/dc/elements/1.1/&gt; .<br />
@prefix contact: &lt;http://www.w3.org/2000/10/swap/pim/contact#&gt; .<br />
@prefix user: &lt;http://my.donews.com/users/&gt; .<br />
@prefix cs: &lt;http://my.donews.com/clickstone/&gt; .<br />
&lt;cs:index.html&gt; dc:creator user:clickstone .<br />
user:clickstone rdf:type contact:Person .<br />
&lt;cs:index.html&gt; dc:title “Beyond Search” .<br />
&lt;cs:index.html&gt; dc:subject &lt;Semantic Web&gt; .<br />
&lt;Semantic Web&gt; rdfs:seeAlso &lt;http://www.w3.org/2001/sw/&gt; .</p>
<p>在 N3 中，当对一个相同的主体你进行若干个陈述时，可以使用简化表示：用一个分号 “;” 引入相同主体的其他属性；用一个逗号引入相同主体及谓词的其他客体。另外，rdf:type 在 N3 中可以简写为“a”。<br />
那么上面的 N3 表示可以简化为，</p>
<p>&lt;cs:index.html&gt; dc:creator user:clickstone ;<br />
dc:title “Beyond Search” ;<br />
dc:subject &lt;Semantic Web&gt; .<br />
&lt;Semantic Web&gt; rdfs:seeAlso &lt;http://www.w3.org/2001/sw/&gt; .<br />
user:clickstone a contact:Person .</p>
<p><a href="http://www.w3.org/People/Berners-Lee/">Tim BL</a> 写了一篇非常经典的 N3 教学文章，在这里“<a href="http://www.w3.org/2000/10/swap/Primer.html">Primer: Getting into RDF &amp; Semantic Web using N3</a>”。另外，他还写了一个 Python 工具，可以进行 RDF/XML 与 N3 之间的转换，在这里“<a href="http://www.w3.org/2000/10/swap/doc/cwm.html">CWM</a>”，但早先我把下载包解压后，cwm.py 文件是 0 字节，导致无法使用，我从 CVS 里面弄出来一个 win32 的安装程序，是 1.19 版的，可以使用。</p>
<p>Update：推荐阅读，<a href="http://weblog.burningbird.net/2005/10/28/the-bottoms-up-rdf-tutorial/">The Bottoms Up RDF Tutorial</a> 。</p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2006.<br/>
本文网址：<a href="http://www.guwendong.com/post/2006/semweb_intro_5.html">http://www.guwendong.com/post/2006/semweb_intro_5.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/rdf" rel="tag">rdf</a>, <a href="http://www.guwendong.com/post/tag/semantic-web" rel="tag">semantic-web</a> | <a href="http://www.guwendong.com/post/2006/semweb_intro_5.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2006/semweb_intro_5.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Semantic Web：语义网是如何运作的？</title>
		<link>http://www.guwendong.com/post/2006/semweb_intro_4.html</link>
		<comments>http://www.guwendong.com/post/2006/semweb_intro_4.html#comments</comments>
		<pubDate>Sat, 18 Nov 2006 07:34:06 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[语义网]]></category>
		<category><![CDATA[semantic-web]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2006/semweb_intro_4.html</guid>
		<description><![CDATA[为了实现语义网智能化与自动化处理信息的目标，语义网的研究者们开发了许多新技术并提出了一系列的标准和规范。被广泛认可的语义网体系框架是由Tim Berners-Lee提出来的，如图1所示，自下而上共有7层。
  图1 语义网体系框架
第1层：URI和Unicode，语义网的基础设施。
必须首先说一下URI（Uniform Resource Identifier），中文通常称作“统一资源标识符”，它是语义网的根基。同现在互联网使用URL标识HTML页面一样，语义网同样需要一个类似的规范，用来唯一标识网络上的资源。语义网使用URI规范，具体的规范在RFC 2396里进行了详细的说明。任何组织和个人都可以自由定义和使用URI。需要澄清的一个概念是，URI的使用与URL有很大区别。URL被用来标识一个网络路径，可以通过互联网在这个URL上访问到对应的资源；但一个URI所标识的资源可能根本无法通过网络访问到，它标识而且仅仅是标识一个资源，并不同时包含该资源的访问路径。从概念上来讲，URI包含URL。
Unicode想必大家都不陌生，它是一个字符集，这个字符集中所有的字符都用两个字节表示，可以表示65356个字符，基本上包括了世界上所有语言的字符。语义网的终极目标是构建一个全球信息网络，它必然涵盖各个国家、各个民族的语言，采用Unicode作为其字符编码方案，可以从根本上解决跨地区、跨语言字符编码的格式标准问题。
这一层是整个语义网的基础，URI负责资源的标识，Unicode负责资源的编码。
第2层：XML、Namespaces、XML Schema和XML Query，语义网的语法层。
XML已经成为数据表示和数据交换的事实标准，它提供一种格式自由的语法，用户可以按照自己的需要创建标记集，并使用这些标记编写XML文档。正因为任何人都可以自由定义标记，所以不可避免地就会发生标记同名的情况。W3C引入Namespaces，即命名空间，机制，在标记前面加上URI索引，从而消解这种冲突。例如，，其中标记就指定了“cs”命名空间，从而避免与其他博客的标记产生冲突。XML Schema提供了一种对XML文档进行数据校验的机制。它基于XML语法，提供多种数据类型，对XML标记的结构和使用方法进行了规范。XML Query是在XML基础上发展起来的技术标准，类似的还有XPath等，使用这些技术，可以对XML文档进行数据检索、提取节点等操作。
然而，随着XML在数据交换，应用集成等领域的广泛应用，人们逐渐发现，XML仅适用于描述表示数据的语法，却不能涵盖数据的语义。鉴于XML受到业界的普遍支持，并且已经具备了较完备的技术标准，在语义网体系框架中，将其作为数据表示的语法层。
第3层：RDF Model、RDF Schema和RDF Syntax，语义网的数据互操作层。
XML不适于表达数据的语义，因此，数据语义的定义和互操作，需要由更高一层来完成。因此，W3C组织开发出了一种新的语言，用来描述互联网上的资源及其之间的关系，这就是，资源描述框架（Resource Description Framework，RDF）。RDF采用三元组，来表示互联网上的资源、属性及其值。在语义网概念里，这种三元组被称为RDF的“陈述（Statement）”：主体，即某个资源（Resource），的某个属性（Property）（谓词）的值是客体（某个资源，或者是原生值，如字符串）。
RDF提供了一套标准的数据语义描述规范，但它还需要定义描述中使用的词汇。RDF Schema（RDFS）提供了一种面向计算机理解的词汇定义，提供了描述类和属性的能力。RDFS在RDF的基础上引入了类、类之间的关系、属性之间的关系、以及属性的定义域与值域等。它就像一个字典，计算机通过它可以理解数据的含义。它有一个明显区别于对象模型的特点，属性是独立于类的，一个属性可以应用于多个类或者实例。
RDF Syntax构建了一套完整的语法以利于计算机进行自动分析和处理。它有三种常用的表示方法：图形、N3 和XML。其中，图形表示是对RDF模型的直接描述，通过RDF模型的图像化，可以直接明了的观察RDF数据及其关系；N3 是一种用三元组的方式，通过枚举RDF模型中的每个“陈述”来表述RDF模型，它最易于使用，简明易懂；RDF/XML 将RDF以XML语法描述，将XML的解析过程和解释过程相结合，这样，RDF在帮助解析器阅读XML的同时，可以获取XML所要表达的语义，并可以根据它们的关系进行推理，从而做出基于语义的判断。但是RDF/XML常常因为过于复杂、难以使用而受到指责。
第4层：Ontology，语义网的知识集合。
本体（Ontology）最早是一个哲学上的概念，从哲学的范畴来说，本体是客观存在的一个系统的解释或说明，关心的是客观现实的抽象本质。人工智能方面的研究人员最早将其引入了计算机领域。关于本体，一个最为流行的定义是，“本体是共享概念模型的形式化规范说明”。这包含4层含义：概念模型（conceptualization）、明确（explicit）、形式化（formal）和共享（share）。
1）概念模型（conceptualization）：通过抽象出客观世界中一些现象的相关概念而得到的模型，其表示的含义独立于具体的环境状态。
2）明确（explicit）：所使用的概念及使用这些概念的约束都有明确的定义。
3）形式化（formal）：本体是计算机可读的。
4）共享（share）：本体中体现的是共同认可的知识，反映的是相关领域中公认的概念集，它所针对的是团体而不是个体的共识。
本体的目标是提取领域知识，统一对某个领域知识的共同理解，确定该领域内共同认可的词汇，并从不同层次的形式化模式上给出这些词汇和词汇之间相互关系的明确定义。
作为语义网中最为核心的一层，本体层在RDF和RDFS进行基本的类/属性描述的基础之上，更进一步地描述了本体以及它们之间的关系。这一层有其专用的本体描述语言。历史上曾经出现的有一定影响的包括，SHOE（Simple HTML Ontology Language），OIL（Ontology Inference Language），DAML（DARPA Agent Markup Language），以及DAML+OIL。RDF也是一种简单的本体描述语言，但它的描述能力比较弱，需要进行扩展。OWL（Web Ontology Language）是W3C组织推荐的本体描述语言，它的实现比较多的参考了DAML+OIL的设计思想和经验。
第5层：Logic，规则及其描述方法是自动推理的基础。
语义网的一个重要目标，就是实现基于特定规则的自动推理。这是一项非常复杂的工作。起初，围绕着如何实现这个目标，甚至是能否实现这个目标，研究人员之间的争论非常激烈。一个典型的论题就是“RDF是否具备实现自动推理的能力？”，一些人认为RDF/RDFS缺乏进行量化运算的能力。
举个例子，如果你的好朋友说，“《阿干正传》是部好电影”，恰好你也看了《阿干正传》，并且和他的意见一致。这样，你会对好朋友的判断产生认同。这种肯定的认同会对你的推理发生作用。当他再次告诉我们，“《无极》无聊至极”之后，你就可以依据之间的结果对这个评论做出判断。
现实生活里，人们可以根据自己的亲身经历作出推理。在语义网中，研究者们需要把这个推理过程使用量化的方法加以实现和证明。近年来，随着研究工作的不断深入，描述逻辑（Description Logic, DL）, 作为较为一种较为成熟的知识表示方法，被引入进来。它对OWL等规范的指定，起到了一定程度的指导作用。最近，研究人员已经开始尝试着在OWL 上加入规则形成OWL的规则语言ORL（OWL Rules Language），从而可以更好地进行自动推理工作。
第6层：Proof，推理结果应该是可以验证的。
目前，针对Proof层以及后面Trust层的研究成果还不是很多，但一个普遍的共识是，Proof和Trust是语义网领域内两个非常重要的研究课题。Proof层使用Logic层定义的推理规则进行逻辑推理，得出某种结论。对于语义网的用户来讲，这个推理过程应该是建立在可靠的数据基础之上的，推理的过程应该是公开的，而且推理得到的结论也应该是可以验证的。
还使用上面的那个例子，我们经过推理，认为“《无极》不是一部好电影”。在现实生活里，我们可以亲自观看《无极》，并做成判断，对这个推理及其结论进行验证。而在语义网中，我们也必须具备这样的验证机制。在计算机的概念里，通常把类似于亲身经历的事情称作“上下文”。上下文是我们作出推理的基础，因此，语义网必须建立一种方法来证明推理所使用的上下文信息的准确性和真实性。
第7层：Trust，语义网应该是一个可以信任的网络。
在语义网内进行推理并最终得出的结论应该是可以信任的。这需要满足两点：（1）可以信任所见的数据，即上下文；（2）可以信任所作的推理过程。满足了这两点，才可以信任最终得到的推理结果。
使用语义网的RDF模型，任何人都可以对任何资源进行描述，不同立场的人对相同的资源可能会作出完全相反的描述。Trust层负责为应用程序提供一种机制，以决定是否信任给出的论证。Trust层的建立，使智能代理在网络上实现个性化服务，以及彼此间自动交互合作，具备了可靠性和安全性。
其他：Signature，数字签名。
数字签名位于层次模型的右侧，贯串了语义网的中间四层。数字签名是一种基于互联网的安全认证机制。当信息从一个层次传递到另一个层次时，可以使用数字签名说明信息的来源和安全性；这样，接收方就可以通过数字签名鉴别其来源和安全性，以决定信息的可信任程度。有了数字签名，一些重要的电子商务活动就可以放心地在语义网上进行了。其实不光对于语义网，数字签名对于所有的信息交换系统都非常重要。

© guwendong for Beyond Search, 2006.
本文网址：http://www.guwendong.com/post/2006/semweb_intro_4.html
tags: semantic-web &#124; 参与讨论
]]></description>
			<content:encoded><![CDATA[<p>为了实现语义网智能化与自动化处理信息的目标，语义网的研究者们开发了许多新技术并提出了一系列的标准和规范。被广泛认可的语义网体系框架是由Tim Berners-Lee提出来的，如图1所示，自下而上共有7层。<br />
<img alt="W3C Semantic Stack" src="http://docs.google.com/File?id=ddjqwpms_23c5nwp563">  图1 语义网体系框架</p>
<p>第1层：URI和Unicode，语义网的基础设施。<br />
必须首先说一下URI（Uniform Resource Identifier），中文通常称作“统一资源标识符”，它是语义网的根基。同现在互联网使用URL标识HTML页面一样，语义网同样需要一个类似的规范，用来唯一标识网络上的资源。语义网使用URI规范，具体的规范在RFC 2396里进行了详细的说明。任何组织和个人都可以自由定义和使用URI。需要澄清的一个概念是，URI的使用与URL有很大区别。URL被用来标识一个网络路径，可以通过互联网在这个URL上访问到对应的资源；但一个URI所标识的资源可能根本无法通过网络访问到，它标识而且仅仅是标识一个资源，并不同时包含该资源的访问路径。从概念上来讲，URI包含URL。<br />
Unicode想必大家都不陌生，它是一个字符集，这个字符集中所有的字符都用两个字节表示，可以表示65356个字符，基本上包括了世界上所有语言的字符。语义网的终极目标是构建一个全球信息网络，它必然涵盖各个国家、各个民族的语言，采用Unicode作为其字符编码方案，可以从根本上解决跨地区、跨语言字符编码的格式标准问题。<br />
这一层是整个语义网的基础，URI负责资源的标识，Unicode负责资源的编码。</p>
<p>第2层：XML、Namespaces、XML Schema和XML Query，语义网的语法层。<br />
XML已经成为数据表示和数据交换的事实标准，它提供一种格式自由的语法，用户可以按照自己的需要创建标记集，并使用这些标记编写XML文档。正因为任何人都可以自由定义标记，所以不可避免地就会发生标记同名的情况。W3C引入Namespaces，即命名空间，机制，在标记前面加上URI索引，从而消解这种冲突。例如，，其中标记就指定了“cs”命名空间，从而避免与其他博客的标记产生冲突。XML Schema提供了一种对XML文档进行数据校验的机制。它基于XML语法，提供多种数据类型，对XML标记的结构和使用方法进行了规范。XML Query是在XML基础上发展起来的技术标准，类似的还有XPath等，使用这些技术，可以对XML文档进行数据检索、提取节点等操作。<br />
然而，随着XML在数据交换，应用集成等领域的广泛应用，人们逐渐发现，XML仅适用于描述表示数据的语法，却不能涵盖数据的语义。鉴于XML受到业界的普遍支持，并且已经具备了较完备的技术标准，在语义网体系框架中，将其作为数据表示的语法层。</p>
<p>第3层：RDF Model、RDF Schema和RDF Syntax，语义网的数据互操作层。<br />
XML不适于表达数据的语义，因此，数据语义的定义和互操作，需要由更高一层来完成。因此，W3C组织开发出了一种新的语言，用来描述互联网上的资源及其之间的关系，这就是，<a href="http://www.w3.org/TR/rdf-concepts/">资源描述框架</a>（Resource Description Framework，RDF）。RDF采用三元组，来表示互联网上的资源、属性及其值。在语义网概念里，这种三元组被称为RDF的“陈述（Statement）”：主体，即某个资源（Resource），的某个属性（Property）（谓词）的值是客体（某个资源，或者是原生值，如字符串）。<br />
RDF提供了一套标准的数据语义描述规范，但它还需要定义描述中使用的词汇。RDF Schema（RDFS）提供了一种面向计算机理解的词汇定义，提供了描述类和属性的能力。RDFS在RDF的基础上引入了类、类之间的关系、属性之间的关系、以及属性的定义域与值域等。它就像一个字典，计算机通过它可以理解数据的含义。它有一个明显区别于对象模型的特点，属性是独立于类的，一个属性可以应用于多个类或者实例。<br />
RDF Syntax构建了一套完整的语法以利于计算机进行自动分析和处理。它有三种常用的表示方法：图形、N3 和XML。其中，图形表示是对RDF模型的直接描述，通过RDF模型的图像化，可以直接明了的观察RDF数据及其关系；N3 是一种用三元组的方式，通过枚举RDF模型中的每个“陈述”来表述RDF模型，它最易于使用，简明易懂；RDF/XML 将RDF以XML语法描述，将XML的解析过程和解释过程相结合，这样，RDF在帮助解析器阅读XML的同时，可以获取XML所要表达的语义，并可以根据它们的关系进行推理，从而做出基于语义的判断。但是RDF/XML常常因为过于复杂、难以使用而受到指责。</p>
<p>第4层：Ontology，语义网的知识集合。<br />
本体（Ontology）最早是一个哲学上的概念，从哲学的范畴来说，本体是客观存在的一个系统的解释或说明，关心的是客观现实的抽象本质。人工智能方面的研究人员最早将其引入了计算机领域。关于本体，一个最为流行的定义是，“本体是共享概念模型的形式化规范说明”。这包含4层含义：概念模型（conceptualization）、明确（explicit）、形式化（formal）和共享（share）。<br />
1）概念模型（conceptualization）：通过抽象出客观世界中一些现象的相关概念而得到的模型，其表示的含义独立于具体的环境状态。<br />
2）明确（explicit）：所使用的概念及使用这些概念的约束都有明确的定义。<br />
3）形式化（formal）：本体是计算机可读的。<br />
4）共享（share）：本体中体现的是共同认可的知识，反映的是相关领域中公认的概念集，它所针对的是团体而不是个体的共识。<br />
本体的目标是提取领域知识，统一对某个领域知识的共同理解，确定该领域内共同认可的词汇，并从不同层次的形式化模式上给出这些词汇和词汇之间相互关系的明确定义。<br />
作为语义网中最为核心的一层，本体层在RDF和RDFS进行基本的类/属性描述的基础之上，更进一步地描述了本体以及它们之间的关系。这一层有其专用的本体描述语言。历史上曾经出现的有一定影响的包括，<a href="http://www.cs.umd.edu/projects/plus/SHOE/">SHOE</a>（Simple HTML Ontology Language），<a href="http://www.ontoknowledge.org/oil/">OIL</a>（Ontology Inference Language），<a href="http://www.daml.org/">DAML</a>（DARPA Agent Markup Language），以及DAML+OIL。RDF也是一种简单的本体描述语言，但它的描述能力比较弱，需要进行扩展。<a href="http://www.w3.org/TR/owl-features/">OWL</a>（Web Ontology Language）是W3C组织推荐的本体描述语言，它的实现比较多的参考了DAML+OIL的设计思想和经验。</p>
<p>第5层：Logic，规则及其描述方法是自动推理的基础。<br />
语义网的一个重要目标，就是实现基于特定规则的自动推理。这是一项非常复杂的工作。起初，围绕着如何实现这个目标，甚至是能否实现这个目标，研究人员之间的争论非常激烈。一个典型的论题就是“RDF是否具备实现自动推理的能力？”，一些人认为RDF/RDFS缺乏进行量化运算的能力。<br />
举个例子，如果你的好朋友说，“《阿干正传》是部好电影”，恰好你也看了《阿干正传》，并且和他的意见一致。这样，你会对好朋友的判断产生认同。这种肯定的认同会对你的推理发生作用。当他再次告诉我们，“《无极》无聊至极”之后，你就可以依据之间的结果对这个评论做出判断。<br />
现实生活里，人们可以根据自己的亲身经历作出推理。在语义网中，研究者们需要把这个推理过程使用量化的方法加以实现和证明。近年来，随着研究工作的不断深入，描述逻辑（Description Logic, DL）, 作为较为一种较为成熟的知识表示方法，被引入进来。它对OWL等规范的指定，起到了一定程度的指导作用。最近，研究人员已经开始尝试着在OWL 上加入规则形成OWL的规则语言ORL（OWL Rules Language），从而可以更好地进行自动推理工作。</p>
<p>第6层：Proof，推理结果应该是可以验证的。<br />
目前，针对Proof层以及后面Trust层的研究成果还不是很多，但一个普遍的共识是，Proof和Trust是语义网领域内两个非常重要的研究课题。Proof层使用Logic层定义的推理规则进行逻辑推理，得出某种结论。对于语义网的用户来讲，这个推理过程应该是建立在可靠的数据基础之上的，推理的过程应该是公开的，而且推理得到的结论也应该是可以验证的。<br />
还使用上面的那个例子，我们经过推理，认为“《无极》不是一部好电影”。在现实生活里，我们可以亲自观看《无极》，并做成判断，对这个推理及其结论进行验证。而在语义网中，我们也必须具备这样的验证机制。在计算机的概念里，通常把类似于亲身经历的事情称作“上下文”。上下文是我们作出推理的基础，因此，语义网必须建立一种方法来证明推理所使用的上下文信息的准确性和真实性。</p>
<p>第7层：Trust，语义网应该是一个可以信任的网络。<br />
在语义网内进行推理并最终得出的结论应该是可以信任的。这需要满足两点：（1）可以信任所见的数据，即上下文；（2）可以信任所作的推理过程。满足了这两点，才可以信任最终得到的推理结果。<br />
使用语义网的RDF模型，任何人都可以对任何资源进行描述，不同立场的人对相同的资源可能会作出完全相反的描述。Trust层负责为应用程序提供一种机制，以决定是否信任给出的论证。Trust层的建立，使智能代理在网络上实现个性化服务，以及彼此间自动交互合作，具备了可靠性和安全性。</p>
<p>其他：Signature，数字签名。<br />
数字签名位于层次模型的右侧，贯串了语义网的中间四层。数字签名是一种基于互联网的安全认证机制。当信息从一个层次传递到另一个层次时，可以使用数字签名说明信息的来源和安全性；这样，接收方就可以通过数字签名鉴别其来源和安全性，以决定信息的可信任程度。有了数字签名，一些重要的电子商务活动就可以放心地在语义网上进行了。其实不光对于语义网，数字签名对于所有的信息交换系统都非常重要。</p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2006.<br/>
本文网址：<a href="http://www.guwendong.com/post/2006/semweb_intro_4.html">http://www.guwendong.com/post/2006/semweb_intro_4.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/semantic-web" rel="tag">semantic-web</a> | <a href="http://www.guwendong.com/post/2006/semweb_intro_4.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2006/semweb_intro_4.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Semantic Web：为什么需要语义网？</title>
		<link>http://www.guwendong.com/post/2006/semweb_intro_3.html</link>
		<comments>http://www.guwendong.com/post/2006/semweb_intro_3.html#comments</comments>
		<pubDate>Fri, 17 Nov 2006 12:46:00 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[语义网]]></category>
		<category><![CDATA[semantic-web]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2006/semweb_intro_3.html</guid>
		<description><![CDATA[据最近报道，全世界互联网上的站点已经超过了1亿个，互联网也成为了人类有史以来构建的最大的数据库，它涉及几乎所有已知的领域。现在的互联网使用HTML语言编写的页面作为数据的载体，它们通过超链接相互交织在一起，使得人们可以方便地访问这些数据。HTML语言是互联网的支撑技术之一，它为互联网的繁荣起到了不可磨灭的作用。但不可否认，HTML语言有着其与生俱来的缺陷——作为一种面向表现的标记语言，它只定义了用来格式化数据显示的标记集，而缺乏明确说明数据含义的标记。这导致在HTML页面里，数据与其表现形式是糅合在一起的，计算机只明白如何显示一个页面，但并不能真正地“理解”这个页面的信息。因此，基于互联网的一些应用，如电子商务、智能信息检索、智能代理等，始终无法真正实现智能化和自动化。互联网的研究者们，一直都在试图解决这个问题。目前为止，搜索引擎技术是最成功的一种尝试。搜索引擎技术以自然语言处理（Natural Language Processing，NLP）为基础，在相关领域展开了大量的理论研究和应用实践，但是依然面临着巨大的困难，信息查询的查准率和查全率很难进一步提高。现在的搜索引擎，大多是通过关键字进行搜索，在找到你所需信息的同时，也会带来大量毫不相关的干扰信息，需要我们再进行人工过滤。例如，如果你用关键字“苹果”搜索，搜索引擎根本无法知道你是在找一种水果，还是在找苹果公司的信息，抑或是苹果牌牛仔裤。问题的根源，在于“苹果”这个词对计算机来说根本不具备“语义”。
语义网致力于改变这种状况，它研究的重点就是如何把信息表示为计算机能够理解和处理的形式，即带有“语义”。在语义网概念中，“语义”是核心，能够在人与计算机之间、计算机与计算机之间以无偏差的方式传递的信息，就是语义。语义网的基本思想是对互联网上任意的资源，进行结构化的描述并引入语义，使得计算机可以理解互联网上的信息。当然，计算机不可能真正像人一样进行思考，但是通过制定标准，使用标准描述信息的含义，计算机就可以根据标准进行自动分析和推理，将网络上的服务集成在一起，从而使得自动化智能服务成为可能。
I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web – the content, links, and transactions between people and computers. A ‘Semantic Web’, which should make this possible, has yet to emerge, but when it does, the day-to-day mechanisms of trade, bureaucracy and [...]]]></description>
			<content:encoded><![CDATA[<p>据最近报道，全世界互联网上的站点已经超过了1亿个，互联网也成为了人类有史以来构建的最大的数据库，它涉及几乎所有已知的领域。现在的互联网使用HTML语言编写的页面作为数据的载体，它们通过超链接相互交织在一起，使得人们可以方便地访问这些数据。HTML语言是互联网的支撑技术之一，它为互联网的繁荣起到了不可磨灭的作用。但不可否认，HTML语言有着其与生俱来的缺陷——作为一种面向表现的标记语言，它只定义了用来格式化数据显示的标记集，而缺乏明确说明数据含义的标记。这导致在HTML页面里，数据与其表现形式是糅合在一起的，计算机只明白如何显示一个页面，但并不能真正地“理解”这个页面的信息。因此，基于互联网的一些应用，如电子商务、智能信息检索、智能代理等，始终无法真正实现智能化和自动化。互联网的研究者们，一直都在试图解决这个问题。目前为止，搜索引擎技术是最成功的一种尝试。搜索引擎技术以自然语言处理（Natural Language Processing，NLP）为基础，在相关领域展开了大量的理论研究和应用实践，但是依然面临着巨大的困难，信息查询的查准率和查全率很难进一步提高。现在的搜索引擎，大多是通过关键字进行搜索，在找到你所需信息的同时，也会带来大量毫不相关的干扰信息，需要我们再进行人工过滤。例如，如果你用关键字“苹果”搜索，搜索引擎根本无法知道你是在找一种水果，还是在找苹果公司的信息，抑或是苹果牌牛仔裤。问题的根源，在于“苹果”这个词对计算机来说根本不具备“语义”。</p>
<p>语义网致力于改变这种状况，它研究的重点就是如何把信息表示为计算机能够理解和处理的形式，即带有“语义”。在语义网概念中，“语义”是核心，能够在人与计算机之间、计算机与计算机之间以无偏差的方式传递的信息，就是语义。语义网的基本思想是对互联网上任意的资源，进行结构化的描述并引入语义，使得计算机可以理解互联网上的信息。当然，计算机不可能真正像人一样进行思考，但是通过制定标准，使用标准描述信息的含义，计算机就可以根据标准进行自动分析和推理，将网络上的服务集成在一起，从而使得自动化智能服务成为可能。</p>
<p><em>I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web – the content, links, and transactions between people and computers. A ‘Semantic Web’, which should make this possible, has yet to emerge, but when it does, the day-to-day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines. The ‘intelligent agents’ people have touted for ages will finally materialize. (Berners-Lee, 1999)</em></p>
<p>还是不明白语义网会对互联网产生多大改变？那就看看 <a href="http://ftrain.com/PaulFord.html">Paul Ford</a> 在2002年写的这篇文章吧，很有意思，非常生动形象！《<a href="http://ftrain.com/google_takes_all.html">August 2009: How Google beat Amazon and Ebay to the Semantic Web</a>》，还有3年了，让我们拭目以待吧。</p>
<p><a title="How Google beat Amazon and Ebay to the Semantic Web" href="http://clipmarks.com/clipmark/A89960D4-F036-46FB-87CA-045C6AD1D741/"><img border="0" src="http://clipmarks.com/image_cache/clickstone/512/DD60FC6E-BDF7-46E0-981E-1BAC60113E17.png"></a></p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2006.<br/>
本文网址：<a href="http://www.guwendong.com/post/2006/semweb_intro_3.html">http://www.guwendong.com/post/2006/semweb_intro_3.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/semantic-web" rel="tag">semantic-web</a> | <a href="http://www.guwendong.com/post/2006/semweb_intro_3.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2006/semweb_intro_3.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Semantic Web：这是怎么个回事？</title>
		<link>http://www.guwendong.com/post/2006/semweb_intro_2.html</link>
		<comments>http://www.guwendong.com/post/2006/semweb_intro_2.html#comments</comments>
		<pubDate>Thu, 16 Nov 2006 08:28:17 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[语义网]]></category>
		<category><![CDATA[semantic-web]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2006/semweb_intro_2.html</guid>
		<description><![CDATA[“石头”后遗症 ，这个成了口头禅了，呵呵。好了，言归正传。
Semantic Web通常被译为“语义网”，W3C组织是这么定义它的——The Semantic Web provides a common framework that allows data to be shared and reused across application, enterprise, and community boundaries.（语义网提供了一套通用框架，通过它，数据可以跨越边界，为各种应用程序，企业和社区所用。）
语义网是一个数据网络——a web of data。它主要完成两件事情：1、提供进行数据交换的通用格式；2、提供记录数据与实体映射关系的语言。语义网并不是一个全新的网络，它是现有互联网的扩展，它提供对数据的语义描述，使计算机能够自动“理解”网络上的数据，实现计算机之间的智能交互，从而使得互联网真正成为一个全球化的信息共享和智能服务平台成为可能。
语义网的概念是由Tim Berners-Lee提出的，他是互联网的创始人，发明了URI，HTTP和HTML，编写了第一个Web Server软件和第一个浏览器。在2000年的世界XML大会上，他进行了题为《The Semantic Web》的专题演讲，对语义网的概念进行了阐述，并首先给出了语义网的体系架构。2001年5月，《Scientific American》以封面文章，刊发了他的《The Semantic Web》一文，向人们描绘了语义网的美好前景，并对其中的主要技术进行了简要的说明。
能够得到这样重量级人物的大力推广，并被看作是“下一代互联网技术”，语义网自然发展迅速。在W3C里面，有专门的一个小组负责推进语义网的标准化工作，并且已经发布了不少相关的语言、论文和工具。在学术界，语义网也吸引了广泛的关注，相关的科研活动相当活跃。国际语义网会议（International Semantic Web Conference -ISWC) 和欧洲语义网会议（European Semantic Web Conference -ESWC），是目前国际上最高级别的学术会议，在语义网的理论研究和实践应用方面已取得了许多优秀成果。近两年，亚洲各国也已经越来越重视语义网这个研究领域。2006年9月，北京清华大学成功举办了“第一届亚洲语义网会议（Asian Semantic Web Conference -ASWC)”。有兴趣的朋友，可以去会议的官方网站（http://www.aswc2006.org/）看看。
但尽管如此，因为语义网的实现太过复杂，目前已经取得的这些成就仍然只能算是一些铺垫而已，大家就它未来的发展方向也还远没有达成一致。
附一些语义网的研究资料：
1.         W3C [...]]]></description>
			<content:encoded><![CDATA[<p><em>“石头”后遗症 ，这个成了口头禅了，呵呵。好了，言归正传。</em></p>
<p>Semantic Web通常被译为“语义网”，W3C组织是这么定义它的——<em>The Semantic Web provides a common framework that allows data to be shared and reused across application, enterprise, and community boundaries.</em><em>（语义网提供了一套通用框架，通过它，数据可以跨越边界，为各种应用程序，企业和社区所用。）</em></p>
<p>语义网是一个数据网络——<em>a web of data</em>。它主要完成两件事情：1、提供进行数据交换的通用格式；2、提供记录数据与实体映射关系的语言。语义网并不是一个全新的网络，它是现有互联网的扩展，它提供对数据的语义描述，使计算机能够自动“理解”网络上的数据，实现计算机之间的智能交互，从而使得互联网真正成为一个全球化的信息共享和智能服务平台成为可能。</p>
<p>语义网的概念是由Tim Berners-Lee提出的，他是互联网的创始人，发明了URI，HTTP和HTML，编写了第一个Web Server软件和第一个浏览器。在2000年的世界XML大会上，他进行了题为《The Semantic Web》的专题演讲，对语义网的概念进行了阐述，并首先给出了语义网的体系架构。2001年5月，《Scientific American》以封面文章，刊发了他的《The Semantic Web》一文，向人们描绘了语义网的美好前景，并对其中的主要技术进行了简要的说明。</p>
<p>能够得到这样重量级人物的大力推广，并被看作是“下一代互联网技术”，语义网自然发展迅速。在W3C里面，有专门的一个小组负责推进语义网的标准化工作，并且已经发布了不少相关的语言、论文和工具。在学术界，语义网也吸引了广泛的关注，相关的科研活动相当活跃。国际语义网会议（International Semantic Web Conference -ISWC) 和欧洲语义网会议（European Semantic Web Conference -ESWC），是目前国际上最高级别的学术会议，在语义网的理论研究和实践应用方面已取得了许多优秀成果。近两年，亚洲各国也已经越来越重视语义网这个研究领域。2006年9月，北京清华大学成功举办了“第一届亚洲语义网会议（Asian Semantic Web Conference -ASWC)”。有兴趣的朋友，可以去会议的官方网站（<a href="http://www.aswc2006.org/">http://www.aswc2006.org/</a>）看看。</p>
<p>但尽管如此，因为语义网的实现太过复杂，目前已经取得的这些成就仍然只能算是一些铺垫而已，大家就它未来的发展方向也还远没有达成一致。</p>
<p>附一些语义网的研究资料：<br />
1.         W3C Semantic Web Activity，<a href="http://www.w3.org/2001/sw/">http://www.w3.org/2001/sw/</a>。<br />
2.         Semantic Web @ Wikipeida，<a href="http://en.wikipedia.org/wiki/Semantic_web/">http://en.wikipedia.org/wiki/Semantic_web/</a>。<br />
3.         关注开发的朋友可以看看这里，<a href="http://www.w3.org/2001/sw/BestPractices/">http://www.w3.org/2001/sw/BestPractices/</a>。<br />
4.         国际语义网会议官方站点，<a href="http://iswc.semanticweb.org/">http://iswc.semanticweb.org/</a>。明年第7届会议将在韩国釜山举办。<br />
5.         第1届亚洲语义网会议官方站点，<a href="http://www.aswc2006.org/">http://www.aswc2006.org/</a>。<br />
6.         Journal of Web Semantics，<a href="http://www.websemanticsjournal.org/">http://www.websemanticsjournal.org/</a>。<br />
7.         国内也有一个，<a href="http://bbs.w3china.org/">http://bbs.w3china.org/</a>。<br />
8.         最好的语义网项目：FOAF（Friend of a Friend），<a href="http://rdfweb.org/">http://rdfweb.org/</a>。</p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2006.<br/>
本文网址：<a href="http://www.guwendong.com/post/2006/semweb_intro_2.html">http://www.guwendong.com/post/2006/semweb_intro_2.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/semantic-web" rel="tag">semantic-web</a> | <a href="http://www.guwendong.com/post/2006/semweb_intro_2.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2006/semweb_intro_2.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Semantic Web 专题</title>
		<link>http://www.guwendong.com/post/2006/semweb_intro_1.html</link>
		<comments>http://www.guwendong.com/post/2006/semweb_intro_1.html#comments</comments>
		<pubDate>Wed, 15 Nov 2006 04:11:05 +0000</pubDate>
		<dc:creator>guwendong</dc:creator>
				<category><![CDATA[语义网]]></category>
		<category><![CDATA[semantic-web]]></category>

		<guid isPermaLink="false">http://www.guwendong.com/post/2006/semweb_intro_1.html</guid>
		<description><![CDATA[今天看到这篇文章《The Road to the Semantic Web》出现在了 Read/Write Web 上面。RWW 是我非常喜欢的一个站点，基本上每天都要看一看。对我而言，他是了解 IT 前沿的不二选择。看到 Semantic Web 的内容出现在这里，感觉很是兴奋。
我的博士论文就是在研究 Semantic Web 。我虽然非常崇拜爱因斯坦，但自己倒并不喜欢做纯学术性质的研究。我的兴奋点在学术课题与实践应用的结合，这是性格使然。Semantic Web 一直以来都是一个过于学术性的话题，关于他的研究大多是围绕“本体（ontoloty）”、“表示（presentation）”和“推理（inference）”展开的，距离实际的应用尚远。如果能够更多地在应用层面进行一些探索，更加亲近一些业界，相信可以更好地促进其发展。
从今天起，开始 Semantic Web 的专题，记录自己在博士论文研究过程中的一些思考，并将收获与大家共享。

© guwendong for Beyond Search, 2006.
本文网址：http://www.guwendong.com/post/2006/semweb_intro_1.html
tags: semantic-web &#124; 参与讨论
]]></description>
			<content:encoded><![CDATA[<p>今天看到这篇文章《<a rel="bookmark" title="The Road to the Semantic Web" href="http://www.readwriteweb.com/archives/semantic_web_road.php">The Road to the Semantic Web</a>》出现在了 <a href="http://www.readwriteweb.com/">Read/Write Web</a> 上面。RWW 是我非常喜欢的一个站点，基本上每天都要看一看。对我而言，他是了解 IT 前沿的不二选择。看到 <a href="http://www.w3.org/2001/sw/">Semantic Web</a> 的内容出现在这里，感觉很是兴奋。</p>
<p>我的博士论文就是在研究 Semantic Web 。我虽然非常崇拜爱因斯坦，但自己倒并不喜欢做纯学术性质的研究。我的兴奋点在学术课题与实践应用的结合，这是性格使然。Semantic Web 一直以来都是一个过于学术性的话题，关于他的研究大多是围绕“本体（ontoloty）”、“表示（presentation）”和“推理（inference）”展开的，距离实际的应用尚远。如果能够更多地在应用层面进行一些探索，更加亲近一些业界，相信可以更好地促进其发展。</p>
<p>从今天起，开始 Semantic Web 的专题，记录自己在博士论文研究过程中的一些思考，并将收获与大家共享。</p>
<hr id="rss-footer" />
<small>© guwendong for <a href="http://www.guwendong.com">Beyond Search</a>, 2006.<br/>
本文网址：<a href="http://www.guwendong.com/post/2006/semweb_intro_1.html">http://www.guwendong.com/post/2006/semweb_intro_1.html</a><br/>
tags: <a href="http://www.guwendong.com/post/tag/semantic-web" rel="tag">semantic-web</a> | <a href="http://www.guwendong.com/post/2006/semweb_intro_1.html#comments">参与讨论</a>
</small><br>]]></content:encoded>
			<wfw:commentRss>http://www.guwendong.com/post/2006/semweb_intro_1.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
