3

到目前为止,这是我的清单上的内容。我想知道同样的其他人,也许技术性更强,也许更少

被炸成碎片:数字爆炸后的你的生活、自由和幸福 - Ableson、Leeden 和 Lewis
Glut:通过时代掌握信息 - Wright
信息规则 - Varian 和 Shapiro
网络龙:搜索引擎技术的神话 - Witten, Gori 和 Numerico

我在文本挖掘方面见过一些,它们包括
Web Data Mining - Liu
现代信息检索 - Baeza-Yates,Ribiero-Neto

也在寻找像
http://www.stat.columbia.edu/~gelman/blog/
http://www.econlib.org/library/Enc/Information.html这样的博客记录

或诸如
结构形式的发现之类的论文

4

5 回答 5

8
  • “SIGIR” - 会议
  • “TREC” - 会议
  • Baeza-Yates,Ribeiro-Neto,“现代信息检索”(1999)
  • Witten,“管理千兆字节”(1999 年)
  • van Rijsbergen,“信息检索”(1979)

是明显的“圣经”(如上所述)。

  • Büttcher、Clarke、Cormack,“信息检索:实施和评估搜索引擎”(2010 年)

是一本有趣的新教科书(学生级别),充满了参考书目。它包含对并行检索算法的很好解释(示例章节)。

  • Croft、Metzler、Strohman,“搜索引擎:实践中的信息检索”(2009 年)

有很好的评价;我不太喜欢它(阅读 Croft 主页上的示例章节)。

  • Voorhees, Harman,“Trec:信息检索中的实验和评估”(2009 年)

是对评估 IR 的 TREC 方法的一个很好的介绍。

  • Langville, Meyer,“Google 的 Pagerank 及其他:搜索引擎排名的科学”(2006 年)

解释了如何有效地计算 PageRank。

于 2010-08-19T15:09:46.197 回答
4

如今,信息检索简介似乎是推荐用于底层技术的文本;它于 2008 年发布,我还没有阅读它。(全文免费在线。)TimB 推荐的《管理千兆字节》是我最喜欢的老书它比Modern Information Retrieval写的好得多,尽管这也值得一看。您可以通过明显的搜索找到更多内容。

于 2008-10-26T23:02:52.843 回答
3

管理千兆字节 - Witten、Moffat 和 Bell:非常详细地介绍了信息检索、文本和图像压缩背后的一些技术。(免责声明:我的大学导师是第二作者。)

您还应该了解 ACM 的SIGIR,它组织了一次关于信息检索的年度会议,并且还有一个邮件列表

于 2008-10-26T21:40:25.800 回答
0

As Book Introduction to Information Retrieval as mentioned.

I think, the best advanced information are the publications found in several academic sites and the conference papers (SIGIR, CIKM, SPIRE, WWW009, ...).

Ex.:

于 2009-06-15T20:42:47.167 回答
0

Information Retrieval - Implementation and Evaluating Search Engines已于 2010 年由 MIT 出版社出版,是一本非常好的关于获取信息检索实用知识的书籍。Stefan Buttcher、Charles Clarke 和 Gordon Cormack 是本书的作者。Buttcher 是 Clarke 的博士生,Clarke 是 Cormack 的博士生。总之,他们在本书中结合了大约 50 年的 IR 研究和经验。它必须阅读!

于 2012-11-20T22:48:00.727 回答