Lucene查询语法详解
Lucene查询
Lucene查询语法以可读的方式书写,然后使用JavaCC进行词法转换,转换成机器可识别的查询。
下面着重介绍下Lucene支持的查询:
Terms词语查询
词语搜索,支持 单词 和 语句。
- 单词,例如:"test","hello"
- 语句,例如:"hello,world!"
多个词语可以通过操作符,连接成更复杂的搜索逻辑。
Field字段查询
Lucene支持针对某个字段进行搜索,语法如:
title:hello
或者
title:"hello title"
搜索语句时需要加上双引号,否则:
title:hello title
就意味着,搜索title为hello,或者包含title关键字的文档
Term Modifier修饰符查询
Lucene支持对词语增加修饰,从而扩大查询的范围。
WildCard Searches通配符查询
支持在单个单词或者语句中添加通配符:
-
?
匹配单个字符 -
*
匹配0个或多个字符
例如:
=>想要搜索test或者text
te?t
=>想要搜索test tests tester
test*
文档中不支持通配符放在搜索的开头,如*test,但是在kibana中是支持这种搜索语法的。
Fuzzy Searches模糊词查询
支持搜索模糊词,如果想要搜索模糊词,需要在词语后面加上符号~
例如:
=>想要搜索和test相近的词
test~
可以搜索出text或者tests等词
也支持在~后面添加模糊系数,模糊系数[0-1],越靠近1表示越相近,默认模糊系数为0.5。
test~0.8
Proximity Searches邻近词查询
前面的模糊词只是针对某个单词,在语句间也存在模糊搜索的概念,只不过不是单词的模糊,而是单词之间内容的模糊。
注意要使用双引号`""`包围
例如:
=>想要搜索包含"hello""world"的文档,这两个单词中间可以有一部分内容(这部分内容通过字符个数限制)
"hello world"~10
可以匹配"hello 123 world"
或者"hello,Tom,world"
Range Searches范围查询
支持范围搜索,可以指定最小值和最大值,会自动查找在这之间的文档。如果是单词,则会按照字典顺序搜索。
-
{}
尖括号表示不包含最小值和最大值,可以单独使用 -
[]
方括号表示包含最小值和最大值,可以单独使用
例如:
=>搜索成绩grade字段小于等于80分,大于60分的
grade:{60,80]
=>搜索名字在A和C之间的
name:{A,C}
返回,bone、baby、barry
Boosting a Term词语相关度查询
如果单词的匹配度很高,一个文档中或者一个字段中可以匹配多次,那么可以提升该词的相关度。使用符号^
提高相关度。
例如:
=>提高jarkarta的比重
jakarta apache
可以采用下面的语法:
jakarta^4 apache
Boolean Operator布尔操作符
支持多种操作符:
AND
AND操作符用于连接两个搜索条件,仅当两个搜索条件都满足时,才认为匹配。通常用来做交集操作。也可以使用&&
替换。
注意必须使用大写。如果不使用AND,而是and,可能会被单做关键词进行搜索!
例如:
=> 搜索同时包含tom和john的文档
tom AND john
或者
tom && john
OR
OR操作符用于连接两个搜索条件,当其中一个条件满足时,就认为匹配。通常用来做并集操作。也可以使用||
替换。
注意必须使用大写。
例如:
=>搜索包含tom或者john的文档
tom OR john
或者
tom || john
NOT
NOT操作符排除某个搜索条件。通常用来做差集操作也可以使用!
替换。
注意必须大写。
例如:
=>搜索包含tom,不包含john的文档
tom NOT john
或者
tom && !john
在kibana中支持单独使用,如:
=>排除包含test的文档
NOT test
+
包含该操作符后跟着的搜索条件,如:
=>搜索包含tom的文档
+tom
作用于AND的差不多,但是支持单独使用
-
排除该操作符后跟着的搜索条件,如:
=>搜索不包含tom的文档
-tom
效果类似NOT
Grouping分组
支持使用小括号对每个子句进行分组,形成更为复杂的查询逻辑。
例如:
=>要搜索包含hello的文档中,也包含tom或者john的
hello AND (tom OR john)
也支持在字段中使用小括号:
=>要搜索标题中,既包含return 也包含pink panther的
title:(+return +"pink panther")
Escaping Special Character转义字符
由于Lucene中支持很多的符号,如
+ - && || ! ( ) { } [ ] ^ " ~ * ? :
因此如果需要搜索 (1+1):2
需要对改串进行转换,使用字符。
(1+1):2
- 分享几个WordPress本地缓存gravatar评论头像的方案
- Linux下的mongodb服务脚本,以备不时之需
- WordPress发布文章主动推送到百度,加快收录保护原创
- Nginx开启fastcgi_cache缓存加速,支持html伪静态页面
- Go-指针、传值与传引用、垃圾回收
- SEO分享:彻底禁止搜索引擎抓取/收录动态页面或指定路径的方法
- Go-defer,panic,recover
- SEO技巧:Shell脚本自动提交网站404死链到搜索引擎
- Nginx发布1.9.0版本,新增支持TCP代理和负载均衡的stream模块
- WordPress4.2升级修复补丁:解决大量404请求以及评论表情路径及尺寸异常问题
- Linux系统编译安装Redis以及主从复制配置小记
- Go-Maps
- 为WordPress开启Nginx缩略图功能,七牛从此陌路
- 为网站开启Nginx缓存加速,支持html伪静态页面
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 详解Java解析XML的四种方法
- 《Java从入门到失业》第四章:类和对象(4.6):类路径
- 《Java从入门到失业》第四章:类和对象(4.5):包
- 《Java从入门到失业》第四章:类和对象(4.4):方法参数及传递
- 《Java从入门到失业》第四章:类和对象(4.3):一个完整的例子带你深入类和对象
- 《Java从入门到失业》第四章:类和对象(4.2):String类
- 《Java从入门到失业》第三章:基础语法及基本程序结构(3.9):数组(数组基本使用、数组的循环、数组拷贝、数组排序、多维数组)
- Establishing SSL connection without server identity verification is not recommended
- 《Java从入门到失业》第三章:基础语法及基本程序结构(3.8):流程控制(循环语句、while语句、for语句)
- 《Java从入门到失业》第三章:基础语法及基本程序结构(3.8):流程控制(选择语句、if-else语句、switch语句)
- 线上服务启动卡死,堆栈分析
- 《Java从入门到失业》第三章:基础语法及基本程序结构(3.7):运算符(自增自减、关系运算、逻辑运算、条件运算、位运算、赋值运算、类型转换)
- JavaWeb——MyBatis框架之多表查询操作实战案例总结(MyBatis1对1查询,MyBatis1对多查询,MyBatis多对多查询)
- kubernetes(二十二) 服务网格化istio入门
- 使用Ngrok将本地服务映射为公网服务