MovieLens 是历史最悠久的推荐系统。它由美国 Minnesota 大学计算机科学与工程学院的 GroupLens 项目组创办,是一个非商业性质的、以研究为目的的实验性站点。MovieLens 主要使用 Collaborative Filtering 和 Association Rules 相结合的技术,向用户推荐他们感兴趣的电影。当然,这说起来简单,后台的算法肯定还是相当复杂的。
MovieLens 使用打分的方法获取用户对电影的偏好数据。在正式使用其服务前,需要用户对至少 15 部电影进行打分。当然,你对越多的电影打分,系统给你的推荐结果就会更趋于准确。题外话,douban 也是这种模式,在系统开始做出推荐之前,用户需要至少给 9 部电影打分。9 < 15,看来 douban 的算法似乎要先进一些,呵呵。MovieLens 的电影数据还是有些久远的,最开始让你打分的电影基本上是上世纪八九十年代的,因此,你得有足够的耐心找出你看过的,或者上 IMDB 查查剧情。
MovieLens 还可以针对一个 Group 进行推荐。MovieLens 的 Group 挺有意思,全都是动物,包括熊啊、鹰啊、猩猩、老虎、狮子什么的。我被分到了“Bear Group”。在组推荐模式下,MovieLens 会综合考虑每个组员的兴趣特征,最终给出一个合并后的推荐结果。对于“Bear Group”,MovieLens 认为最 cool 的电影是 Lord of Rings、Matrix 和 Star Wars,全部是我的最爱!
伴随着 Web 2.0 的兴起,MovieLens 也在努力进步着。2006 年,MovieLens 引入了 social tagging / collaborative tagging 的特性,开始进行基于 tag 的推荐尝试。
再说说 MovieLens 的创办者 —— GroupLens 项目组。这个项目组绝对是全世界推荐系统领域最具影响力的学术研究团体,他们为推荐系统的发展做出了许多卓越的贡献。
他们公布出来的 MovieLens 数据集,包括 6040 个用户针对 3900 部电影所进行的将近 1,000,000 条打分数据,是被使用最为广泛的实验资料,并且已经成为评价推荐算法的基准数据集。不过,和去年 Netflix 公布出来的数据集(480,189 个用户,17,770 部电影,100,480,507 条评分记录)相比,MovieLens 数据集少了 2 个数量级。它的位置相信会逐渐被 Netflix 数据所替代,这是时代进步的必然结果。
另外,作为名校的研究团队,GroupLens 项目组自然是发表了不少精彩的 paper。尤其是其中《GroupLens: An Open Architecture for Collaborative Filtering of Netnews (1994) 》这篇 paper,绝对称得上是推荐系统领域最具影响力的经典 paper 之一。
如果你想了解推荐系统的发展历程,那么你一定要到 MovieLens 上注册一个用户,使用使用,体验一下。






