常用的互联网信息检索模型有哪些?各自的优缺点是什么?
1、布尔检索模型布尔检索模型是最简单的检索模型,也是其他检索模型的基础。其优缺点是: 布尔检索模型原理简单易理解,容易在计算机上实现并且具有检索速度快的优点,但最终给出的检索结果没有相关性排序,不够精确,不能反映不同的索引项对一个文档的重要程度的差异。2、扩展布尔模型:是对布尔模型的改进。其基本思想是将非此即彼的相关判断方式改为计算相似度。3、向量空间模型 向量空间模型的基本思想是:文档和检索提问都可以用向量表示,检索过程就是计算文档向量与检索提问向量之间的相似度,可以根据相似度值的不同,对检索结果进行排序;还可以根据检索结果,做进一步的相关检索。向量空间模型的优点:使用简便,并且在模型中有许多可调整的计算方式。向量空间模型的弱点:欠缺理论的支持与验证。4、概率检索模型概率检索模型有严格的数学理论基础,采用了相关反馈原理克服不确定性推理的缺点。概率检索模型的缺点是参数估计的难度比较大,文件和检索的表达也比较困难。