麦田蚂蚁 – 最新网站推荐,免费资源下载 ? Freebase:世界上最大的语义数据库
来源:百度文库 编辑:神马文学网 时间:2024/04/29 20:32:26
Freebase:世界上最大的语义数据库
Freebase 可以算作是世界上最大的语义数据库。它是由计算机和人共同组织维护的庞大的知识库,它通过 Wikipedia、MusicBrainz 一类的信息源,加上人工上传和编辑,对知识和信息进行采集、整理、归纳、并提供语义技术(什么是语义技术),以便更好地从中查找数据资料。
简单说,Freebase是个类似Wikipedia的创作共享类网站,所有内容都由用户添加,采用创意共用许可证,可以自由引用。两者之间最大的 不同在于资料存储方式,Wikipedia是以文章的方式输出,而Freebase中的条目都采用结构化数据的形式。因为资料存储结构化的关系,条目之间 的关系或者串联就相当容易,这样就方便网站或者软件开发人员将数据应用到网站或软件中。Freebase提供了API及其他工具以供使用。
比如,下图是已故美国总统肯尼迪的条目(点击查看网页)。可以发现其中所有的内容都是格式化的,一条一条的,有点像履历表,包括出生时间、死亡时间、性别、职业、国籍、配偶等等。
这一套格式是固定的,所有人物条目都包含同样的字段。这样一来,数据之间就可以很容易地联系在一起,为信息的查询和处理提供了巨大的方便。
举例来说,将来可以很方便地在Freebase中查到“出生于1946年的美国电影导演的名单”,然后你就可以根据这份名单,立即从 Freebase中提取他们每个人的简历。要想在wikipedia中完成类似的查询是非常困难的,事实上,wikipedia最大的缺点就是它的数据不是结构化的,因此难于引用和处理。
推而广之,Freebase的目标是包含地球上的所有信息,因此可以设想,理论上,将来可以从freebase中得到任何信息。很多 Web2.0 公司使用 Freebase 的数据库,对某个领域的知识进行归纳,获得有价值的资料,如:
Taught or Not – 一个非常可爱的小游戏,用来测试你对历史上那些思想家之间的相互影响关系的了解。
Shot or Not – 另一个有趣的游戏,测试你对有些历史著名人物死因的了解。
Random Walk Through Influences – 一个小程序,输入某个艺术家的名字,你就可以知道他受哪个流派影响。
Pull Quotes – 如果你对政治感兴趣,这个网站值得一看。
Powerset - 刚刚以1亿美金卖给微软的 Powerset 也使用 Freebase 作知识来源。
还可以查看介绍Freebase的PPT英文文档。
网址:http://freebase