文章吧-经典好文章在线阅读:《信息检索导论》读后感1000字

当前的位置:文章吧 > 经典文章 > 经典美文 > 经典精选 >

《信息检索导论》读后感1000字

2020-08-03 23:57:02 来源:文章吧 阅读:载入中…

《信息检索导论》读后感1000字

  《信息检索导论》是一本由Christopher D.Manning / Hinrich 著作人民邮电出版社出版的平装图书,本书定价:69.00元,页数:388,特精心网络整理的一些读者读后感希望大家能有帮助

  息检索导论》精选点评

  ●有点学术化,内容比较杂而不精

  ●CS273A

  ●manning还是好些..

  ●简单明了深入浅出。。。。。好吧,就是老师讲的好。。。。

  ●很实用话题,原书非常好,译者尽心

  ●快速浏览过一遍,还行吧

  ●相好的入门书籍

  ●只了一部分,后面也用不到了。

  ●很好,很详细介绍了一些常用的IR模型,不过LTR,CF之类的貌似还木有

  ●粗略看了一下,反正也没怎么太看懂只是了解了一些概念如倒排、索引结构文本和非结构化文本之类的...但是整本书很有条理,都在想如何在xxx中找xxx的问题,冲着条理给5分

  《信息检索导论》读后感(一):很好的入门书籍

  搜素引擎入门书籍,各方面均有涉猎严谨通俗易懂

  入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典入门经典

  《信息检索导论》读后感(二):不错

  这本书不错。值得一看。

  Christopher D. Manning,1989年毕业于澳大利亚国立大学,1995年获斯坦福大学语言学博士学位,曾先后在卡内基-梅隆大学、悉尼大学教授语言学,1999年起任斯坦福大学计算机科学和语言学副教授,其主要研究方向统计自然语言处理、信息提取表示,以及文本理解和文本挖掘等。

  《信息检索导论》读后感(三):对信息检索介绍的很全面深入浅出

  对于搜索引擎初学者里说,本书是一本绝对值得阅读书目作者从最简单的布尔检索到一个完整搜索引擎,逐步深入,逐步引导读者思考,对建造一个大型搜索引擎需要用到的架构算法都有所涉猎,看完后会对搜索引擎有一个大概认识,对其基本原理也会有所了解。搜索引擎并不仅仅是检索信息,还有一个更重要用处是对返回的结果进行排序,而这往往是非常重要的。

  《信息检索导论》读后感(四):评《信息检索导论》

  作为入门书籍,还不错。分别介绍了信息检索领域的几个重要概念:倒排索引、检索引擎;tf-idf权重计算技术;向量空间模型,信息检索的评价有序检索结果的评价MAP,ROC曲线,NDCG等等;相关反馈技术,伪相关反馈;概率检索模型,BM25算法;基于语言建模的信息检索模型,各种文本分类的技术,NB的,VSM的,SVM的;各种文本聚类技术,扁平的,层次的,LSI的;以及最后三章的关于web搜索的,不过关于web的都很基础很浅,没什么太深入的内容。重点推荐的中间部分的章节(第6,7,8,9,11,12章)。

  《信息检索导论》读后感(五):宏观,广阔

  最重要的收获,是对信息检索系统(搜索引擎)有一个宏观的认识,大体上说,需要从两个维度来看:

  第一个是查询维度,它的核,是两个索引结构;其一是字典,其二是倒排拉链和正排索引;

  字典的职责,是把 query 变成 term set;期间用到了多种技术,如:语义扩展(同义词、拼写校正)、k-gram 索引等等;

  倒排拉链的职责,有两个,是完成 term 到文档列表的映射;同时,由于从倒排拉链中获取的文档数量,直接影响了后续计算量的大小,这里需要考虑拉链中文档的排序,往往会使用静态得分技术(如机器学习打分),按照得分高低进行排序;并借助此静态得分,对索引进行分层,核心思想,就是提早剪枝;

  正排索引的职责,是获取评分所需要的信息(如:tf-idf),一些文档聚类的信息(如 返回了文档 A,可以再返回与 文档 A 统一类的文档,来增强查询的召回率);

  最后,需要对返回的结果进行再打分(重排序)、并计算相关性(可以用 tf-idf、可用概率检索模型等等技术),一般是在这里引入了 query 相关的信息,比如:在静态打分的基础上,基于向量模型,计算query 与文档的相似度;

  第二个是数据维度,包括了爬取、索引的构建和预计算;

  这里就是大名鼎鼎的 mapreduce 和 pagerank 发挥作用的地方了;当时,前面提到的文档聚类,和各种与 query 无关的剪枝、打分技术,都是在这个阶段完成的;

  另外,值得注意的是,由于某些正排索引中所需要的信息是全局的(tf-idf),但是物理上上,索引是分片的,这些信息一是在此过程计算的;

  目前就了解到这,后面再好好读读,尤其是那些年我们一起忽略的各种算法和数学公式 ...

评价:

[匿名评论]登录注册

评论加载中……