最好走的路越走越难,最难走的路越走越容易

Follow guwendong on Web
  • Subscribe to Beyond Search via RSS
  • Join Resys Google Group
  • Follow @clickstone on Douban
  • Follow @clickstone on Twitter

Category Archives: Only alpha

Only alpha:Feed Filter Service

前些日子,有一次和金色葡萄讨论了 blog 阅读的问题,他给出了一个非常简单有效的 Feed 评分方法,一个基于 google reader trends 的方法。下面这段引自金色金色葡萄给我发的 Gmail。

用 Reading trends 中的 starred 除以 Subscription trends中的Items/Day,分别得到每一个 blog 的评分。比如生活帮-LifeBang的评分是 9/0.8=11.25,而你的 beyond search 的评分是 4/0.3=3.3,属于一个相当高的评分了,不过因为是刚刚订阅的,有一定的”新加入优势”。

这个方法我个人认为其实有个小瑕疵。比如从金色葡萄公布的结果来看,keso 的得分就不是很高,究其原因,是因为 keso 的 starred 数很少。这其实是比较正常的,对于整体来讲很重要的东西,人们通常不再就其中的个体作特殊标注了。这应该也是金色葡萄 对 keso 的文章 starred 比较少的原因。

当然,对于个人使用的一个评分方法,这也够用了。但其实这种 Rank 式的方法应该是可以发扬光大的,尤其是围绕每一个 post,仔细研究的话,应该有不少参数可以用来作数据分析。比如这个 PostRank。豆瓣的“九点”应该就可以按照这个思路作下去,“必看”的就不需要再对单独的 post 进行评分了,对于“关注”或者“偶尔看”的 blog,就应该作一些评分方面的工作,以免不感兴趣的 post 干扰用户的阅读。

我之前也曾经写过一篇 blog,《Only alpha: RSS 文章推荐》,简单说了说我的看法。Only alpha 栏目,是记录我对一些互联网产品的想法,基本都还很不成熟。

Matt 曾经写过一篇文章《Taming the RSS beast》,提出了他认为解决 Feed overload 的四个方法:

  • The author decides,作者决定,例如 keso 的 “top 10 post of 2006”。
  • The community decides,社区决定,例如 Top Today link on Digg
  • The reader’s friends decides,这个我还没找到实际的例子,豆瓣应该作作这个,google reader 的“shared items”也许也会朝这个方向发展。
  • The feed reader decides,阅读器决定,这个应该好多人都在努力。

简单的分析一下这四种方法。anthor decides 方法用处不大,作者当然希望越多人看到自己越多的文章最好。Digg 是 community decides 一个很好也是很成功的例子,但这种方法通常代表的是一个 Group 整体的观点,在一定程度上缺乏个性化。friends decides 肯定大有可为,也是我个人最为看好的方向,他的基本原理和推荐类似,“人以群分”,朋友的推荐通常是最有效的,但要走的路还很长。feed reader decides 是最可行的自动化方法,长时间的使用 reader,可以让它充分了解你的阅读习惯。

国外现在已经出现了专注于作 feed filter 的 service,比如 BlastfeedFeedRinse。有人置疑为什么要把 feed filter 和 feed reader 分开来作?Blastfeed 的 Patrick 给出了他的解释,我个人感觉非常有说服力和远见!

“One other direction we want to take Blastfeed to would be to use it as a platform to manage all kinds of media generating/powering RSS. For instance, TV / VOD providers could send their programs in RSS, and users could actually set a channel for such specific topic of interest. Whenever a TV / VOD content described in the RSS feeds matches the users requirements it could trigger a notification to an application that would record the film for later viewing, etc. Combination with other media assets (Podcasts, videocast, news and blogs feeds, company feeds, etc.) can then be envisaged as well.”

我个人正在关注这三个服务:TailrankTouchStoneBlastfeed

 

Only alpha: 网摘3.0?

现在,网摘工具已经成为网民的们一个重要工具,我最经常使用的就是 del.icio.us,感觉还不错。国内的365key和和讯网摘,据说做得也挺好,但我还没有试过。就我现在使用 del.icio.us 的体验而言,它对我来讲最大的用处有两点,核心是收集和共享。
1)记录自己每天的阅读,可以和他人共享,也可以方便自己进行阶段总结。
2)通过共同收藏的用户,找到一些和自己兴趣相似的人。

我不太习惯使用它来组织我的书签。我上网基本使用固定的机器,使用浏览器的书签,我只需要:(1) 打开“书签”菜单;(2) 点击书签。而如果使用 del.icio.us 的话,我需要:(1) 首先进入到我在它上面的主页(有时候还要登录);(2) 然后选择某一个tag;(3) 再点击其中的一个收藏,我才能最终进入到页面。显而易见,使用 del.icio.us 我多用了一个步骤。而作为经常使用的一个功能,自己方便才是第一位的,呵呵。

我对 del.icio.us 的结论是,它是一个收集/共享资料的好工具,但并不是一个管理知识的工具。当然,人家的设计初衷本来也不是用来管理知识的,我的结论恰恰证明了 del.icio.us 的产品设计是成功的。

但我需要一个管理知识的工具。如何才能更有效地组织自己的资料,这其实是一个值得琢磨的事情,尤其是对作研究的人。我以前的办法可能比较土,但时间久了也已经习惯了。具体方式如下。

1、根据自己的兴趣,分门别类的建立一些目录。类别尽量分的细致一些,这样可以使得目录层次始终保持在一级,避免了目录层次多带来的繁杂操作。我只会收藏自己真正感兴趣的资料,临时兴奋的东西,我会先放到Temp目录里凉一凉,待确认有必要建立一个目录的时候,我再把他们copy过去。事实证明,一个人能够持续保持关注的分类数量其实很少。能够持续关注下去,才能够整理出一些脉络,发现“真正对自己有用”的东西。其他因为偶然兴奋而保存下来的东西,其实到需要的时候google或者baidu一下,完全可以很快的找到。

2、对每一个目录里面的文件,我会编写一个索引。我会给每一个文件编号,并简单地写一个描述,比如“说明了构建一个可用推荐系统的关键技术”。另外,自然少不了要提取关键字,论文写多了,总结关键字也已经比较得心应手了。文件描述一定要短,只说最重要的,有利于走马观花的浏览;关键字不嫌多,有利于检索。这样,需要查资料的时候,我可以快速过一下我的描述文字,也可以搜索关键字。google和baidu刚刚推出桌面搜索工具的时候,我非常兴奋,以为可以用它方便的检索资料了。但试用了之后,感觉比较失望。我最需要的一个功能,针对我选定的目录建立索引并进行检索,他们没有。我不需要对我整个硬盘的资料建立索引,我根本用不上,还白白占用我的硬盘空间,我的本子只有40G硬盘,寸土寸金啊。

当然,这毕竟是土方法,其他倒还好,但感觉最不方便的一点就是:我没有找到一个有效的方法来跟踪这些文件内容——即知识——之间的关系。只靠关键字进行聚合,是远远不够的。我所说的关系类似于论文中的引文,我需要能够快速定位到某个文件里的被引用的部分,而不是链接到这个文件就了事了。当然,现在连链接到文件还没有解决好,直接定位到内容就更是奢望了。

使用语义网的技术扩展网摘工具,应该是实现这个目标的办法之一。实现的方法和现在流行的Tag类似,只不过这些Tag是预定义好的。为了下文能够和现在Tag区分,我把这种Tag命名为 Knowledge Tag,KTag。可以使用RDF之类的语言来描述KTag,从而使其具备表达关系和进行推理的能力。实现的难点初步想来有两个。

1、标准KTag的定义。可以引用现成的标准,已经有一些了,但不多。也可以从头开始自己慢慢积累,像现在 del.icio.us 这样,在你加Tag的时候,建议你最常用的Tag,引导用户逐渐统一Tag的使用。但不论采用哪种办法,后台的工作量都相当大。

2、如何引导用户正确地标记KTag。和现在Tag的最大的区别,KTag最终是需要标注在内容上的,而不仅是针对整篇文章。这就给用户的使用带了麻烦,像我上面比较浏览器的收藏夹和 del.icio.us 一样,易用性是决定因素,除非 Target User 定义成我这样的——愿意付出额外的努力以换取管理知识的效果和效率。总之,用户体验绝对是个问题。

这篇文章是我对语义网的一个应用思考,现在有人把语义网称作“Web 3.0”,那我就把这种基于语义网的网摘产品命名为“网摘 3.0”吧。有兴趣的朋友欢迎进行留言讨论,也欢迎给我发Email:wendell.gu@gmail.com。

 

Only alpha: Local events

最近发现了一个国外的Web2.0网站 Zvents.com ,标题是“find local events fast”。挺不错的一个概念,可以帮助访问者关注其所在城市或地区的热点事情。我试了试北京,返回的结果是“oh no!”,呵呵。看来他们还没有北京的内容,也还没有北京的用户为他们提供信息。当时曾经简单地分析了一下将其引入到国内的可行性,感觉有几个需要考虑的问题。

  1. Zvents上面主要的内容是关注在本地举办的有影响的会议、音乐会、发布会之类的。这类信息在国内的互联网用户中,关注度会有多大呢?
  2. 是否会有厂商或者个体用户,愿意通过这样的平台来发布此类信息呢?或者说,采用何种办法可以吸引厂商和个体用户来这里发布信息呢?
  3. 当时草草得出的结论是,可以引入此概念作一些比较小众的事情,比如约球。

今天,无意之中,发现国内已经有了个 “发生网” ,在做类似的事情。他和Zvents不同的是,他上面的信息种类繁多,包括,赛事直播时间表、演出、展览会等等,甚至还有“2007年硕士研究生网上报名常见问题汇总”。用小组和社区的概念将用户进行了聚会,以期可以吸引一些同样爱好的用户聚拢在一起,并产生小组和社区内的一些热点。用这种方式来作社区,不知道是不是一种可行的思路?不过我个人认为,应该是一个值得尝试的思路。现在传统的BBS,似乎正在逐渐的失去其吸引力,起码我和我身边的人,已经很少在上BBS了。寻找一种适合的方式来取代BBS,应该是国内互联网内值得做的一件事情。豆瓣的似乎正在作着这样的尝试。说实话,我初次访问发生网,第一感觉是又一个douban mocker,但起码他并不是简单的抄袭,而是在摸索另外一条路。

我个人倒是认为,首先还是应该对信息内容加以界定,找两三类在国内关注度较高的事情,持续专注地做一做。对发生网保持关注!

 

1. 持续关注 个性化推荐 技术;
2. 持续关注 Semantic Web 技术;
3. 评论与上两项相关的互联网业务与产品;

我相信技术的力量!
wendell.gu@GMail.com

Archives