博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
lucene全文检索技术
阅读量:6153 次
发布时间:2019-06-21

本文共 691 字,大约阅读时间需要 2 分钟。

 1:lucene的介绍

   全文检索引擎工具包。作用:使用lucene进行全文检索 。可以直接运行。 

   什么是全文检索。全文检索的场景,搜索引擎,搜索商品。

   站内搜索,只会搜索自己站内的资源

   全文检索首先将要查询的目标文档中的词提取出来,组成索引,通过查询索引达到搜索的文档的目的

   这种先建立索引,在对索引进行搜索的过程就叫全文检索。

 

   索引就类似于书籍的目录,目标文档就相当于书籍中的内容

   搜索书籍中的内容,如果不通过目录,很费劲

   其实,全文检索就是相当于给书籍编写目录。

 2:Lucene实现全文检索的流程

   

   采集数据---》创建索引----》用户查询---》搜索索引---》展示显示

    全文检索的流程:索引流程和搜索流程

 3:入门程序

  a :索引

  b :搜索

   4:field域 

    搜索流程

      为啥要采集数据。如何采集数据,使用http协议,使用网络爬虫采集。数据库中的数据使用jdbc采集。文件系统中的数据,使用IO流读取文件中的内容。

         数据的分类:01非结构化数据02结构化数据

                 对结构化数据的搜索使用mysql搜索

                 对非结构化数据的搜索使用

  爬虫技术

    

 

                 

 5:索引维护  入门程序之创建索引。

 6:搜索

 7:相关度排序

 8:中文分词器 

转载于:https://www.cnblogs.com/CAOXIAOYANG/p/6384449.html

你可能感兴趣的文章
转:Vue keep-alive实践总结
查看>>
深入python的set和dict
查看>>
C++ 11 lambda
查看>>
Android JSON数据解析
查看>>
DEV实现日期时间效果
查看>>
java注解【转】
查看>>
centos 下安装g++
查看>>
嵌入式,代码调试----GDB扫盲
查看>>
下一步工作分配
查看>>
Response. AppendHeader使用大全及文件下载.net函数使用注意点(转载)
查看>>
Wait Functions
查看>>
jQuery最佳实践
查看>>
centos64i386下apache 403没有权限访问。
查看>>
jquery用法大全
查看>>
PC-BSD 9.2 发布,基于 FreeBSD 9.2
查看>>
css斜线
查看>>
Windows phone 8 学习笔记(3) 通信
查看>>
Revit API找到风管穿过的墙(当前文档和链接文档)
查看>>
Scroll Depth – 衡量页面滚动的 Google 分析插件
查看>>
Windows 8.1 应用再出发 - 视图状态的更新
查看>>