等了很久之后,终于在4月26日拿到了 Twine Beta 的试用邀请。简单地玩儿了一下,发现用标题这句话形容它再合适不过了——盛名之下,其实难副!
这就是传说中万人瞩目的“The First Mainstream Semantic Web App”?OMG!与 Freebase 的惊艳相比,Twine 差得简直太远了。
用官方的话说,Twine 的核心是“Interest Networks“,又或者是之前更多被提到的“Knowledge Networks”。Twine is a Smartest Way To Organize, Share and Discover Information About Your Interests. You can use Twine alone, with friends, groups and communities, or even in your company. 但以其目前的 Beta 版来看,Twine 最多也就能算个稍微新型的 bookmark 应用而已。
当然,可以看到 Twine 试图在做一些事情,我捡重要的说说。
第一件事情,从网页里抽取实体。
这事儿英文通常称为 Entity Extraction,Semantic Web 中叫做 Ontology Annotation。这个确实是 Sematic Web App 必须要解决地第一件事情。但在这件事情上,Twine 做得很烂。我总共试了 3 篇文章。
- 第一篇是我的一个中文 blog,“个性化站点:MyStrands”。Twine This,结果是乱码!好吧,你可以说 Beta 对中文的支持还不好,可以容忍。
- 第二篇是我在 Google Reader 上 share 的一篇英文 blog,“Slide decks from Web 2.0 talks”,里面有两个很棒的 PPT。这次更离谱,完全没有定位准确正文,居然把 “Recent Comments” Panel 里的内容作为了网页正文!好吧,你可以说这篇文章的正文部分字数少,识别有难度,可以容忍。
- 第三篇是一个分析 Twine 的英文 blog,“Web2Summit: Radar Networks Unwinds twine.com”,长篇大论,以免正文字数少又难倒了 Twine。这次总算顺利通过了,让我们赶紧来看一下 Twine 传说中的 Auto Tag 吧。“People”里加上了“Nova Spivack”,这个不错。“Organizations”里加入了“O'Reilly”和“Radar Networks”,也不错,但有个“Directory Assistance”非常诡异!点链接进去一看,search 结果里大量出现了“Network”这个词,而这篇文章里总共出现了3次“Network”,看来“Network”被当作了“Directory Assistance”的一个 Keyword。由此大概可以推断,对于 Entity Extraction,Twine 使用的是 Meta Model。但关键是此处的结果是有问题的,Network 在本文里是作为“Radar Networks”出现的,并不是本来的 Network,这里产生了歧义,但 Twine 的模型并没能解决这个问题。最后再来看“Other Tags”,“Semantic Edge”、“Semantic Web”和“Web 2.0”还算不错,但称不上好。通篇在评论的 Twine 应用本身,并没有出现在 Auto Tags 里面,但通过验证,其实“Twine”这个 Tag 是存在的。
第二件事情,“Twine”的使用。
这里的“Twine”,不是 Twine.com,而是 Twine team 创造出来的一个概念,用来组织 Interest Networks。用大家都能理解的一个说法,“Twine”基本和我们常见的“频道”差不多,就是一堆相似的文章的集合。在我看来,“Twine”本身其实和 tag 没有本质的区别,不同就在于用作“Twine”的 tag 应该会得到一个比较高的 tag weight,并在 tag hierarchy 中占据更高层的位置。其实,tag weight 与 tag hierarchy,也是我一直在思考的一个问题。比如在使用 del.icio.us 时,我们会给网页打上不同的 tag,潜意识里,各个 tag 的 weight 应该是不同的,并且通常还会使用不同层次的概念。比如“Web2Summit: Radar Networks Unwinds twine.com”这篇文章,Technorati Tags 就是“freebase, radarnetworks, SemanticWeb, web2.0, web20, web2summit”,其中 SemanticWeb 和 radarnetworks 应该 weight 高一些,而 freebase 是 SemanticWeb 和 web2.0 概念之下的一个应用。但常见的 tag 标注方法,是没有办法体现上述两项差别的。“Twine”的使用,似乎就意在 tag 上面再插入一层,定义出重要的 tag,建立 hierachy。如果 Twine 确实是这种思路的话,目前的产品设计至少也有一个问题。用户可以自由地创建 Twine,似乎并没有什么规则/规范。我可以建立一个“Film”的“Twine”,然后把“The Matrix”加进来,打上“Science fiction”的 tag;也可以建立一个“Science fiction”的“Twine”,然后把“The Matrix”加进来,打上“Film”的 tag。这会造成混乱。
Recommendation Panel, 是 Twine 上另外一个值得关注的功能,但由于我目前活动度不够,推荐给我的东西很少,留待下一步分析。





