正文

mysqlregexp：正则表达式查询(代码片段)

知其黑、受其白  知其黑、受其白  2022-12-06  283

关键词：

阅读目录

阐述
应用示例 1

阐述

MySQL中正式表达式通常被用来检索或替换符合某个模式的文本内容，根据指定的匹配模式匹配文中符合要求的特殊字符串。

例如，从一个文件中提取电话号码，查找一篇文章中重复的单词或替换用户输入的敏感语汇等，这些地方都可以使用正则表达式。

正则表达式强大而且灵活，常用于复杂的查询。

REGEXP 操作符中常用的匹配列表

MySQL 中使用 REGEXP 关键字指定正则表达式的字符匹配模式，下表列出了 REGEXP 操作符中常用的匹配列表。

选项	说明	例子	匹配值示例
^	匹配文本的开始字符	'^b' 匹配以字母 b 开头的字符串	book、big、banana、 bike
$	匹配文本的结束字符	'st$’ 匹配以 st 结尾的字符串	test、resist、persist
.	匹配任何单个字符	'b.t’ 匹配任何 b 和 t 之间有一个字符	bit、bat、but、bite
*	匹配零个或多个在它前面的字符	'f*n’ 匹配字符 n 前面有任意个字符 f	fn、fan、faan、abcn
+	匹配前面的字符 1 次或多次	'ba+’ 匹配以 b 开头，后面至少紧跟一个 a	ba、bay、bare、battle
<字符串>	匹配包含指定字符的文本	'fa’	fan、afa、faad
[字符集合]	匹配字符集合中的任何一个字符	'[xz]'匹配 x 或者 z	dizzy、zebra、x-ray、 extra
[^]	匹配不在括号中的任何字符	'[^abc]’ 匹配任何不包含 a、b 或 c 的字符串	desk、fox、f8ke
字符串n,	匹配前面的字符串至少 n 次	b2 匹配 2 个或更多的 b	bbb、 bbbb、 bbbbbbb
字符串 n,m	匹配前面的字符串至少 n 次，至多 m 次	b2,4 匹配最少 2 个，最多 4 个 b	bbb、 bbbb

查询以特定字符或字符串开头的记录

字符 "^" 匹配以特定字符或者字符串开头的文本。

【实例 1】

在 tb_departments 表中，查询 dept_name 字段以字母 “C” 开头的记录，输入的 SQL 语句和执行结果如下所示。

mysql> SELECT * FROM tb_departments
    -> WHERE dept_name REGEXP '^C';
+---------+-----------+-----------+-----------+
| dept_id | dept_name | dept_call | dept_type |
+---------+-----------+-----------+-----------+
|       1 | Computer  | 11111     | A         |
|       3 | Chinese   | 33333     | B         |
+---------+-----------+-----------+-----------+
2 rows in set (0.05 sec)

在 tb_departments 表中有两条记录的 dept_name 字段值是以字母 C 开头的，返回结果有 2 条记录。

【实例 2】

在 tb_departments 表中，查询 dept_name 字段以“Ch”开头的记录，输入的 SQL 语句和执行结果如下所示。

mysql> SELECT * FROM tb_departments
    -> WHERE dept_name REGEXP '^Ch';
+---------+-----------+-----------+-----------+
| dept_id | dept_name | dept_call | dept_type |
+---------+-----------+-----------+-----------+
|       3 | Chinese   | 33333     | B         |
+---------+-----------+-----------+-----------+
1 row in set (0.03 sec)

只有 Chinese 是以“Ch”开头的，所以查询结果中只有 1 条记录。

查询以特定字符或字符串结尾的记录

字符 “$” 匹配以特定字符或者字符串结尾的文本。

【实例 3】

在 tb_departments 表中，查询 dept_name 字段以字母“y”结尾的记录，输入的 SQL 语句和执行结果如下所示。

mysql> SELECT * FROM tb_departments
    -> WHERE dept_name REGEXP 'y$';
+---------+-----------+-----------+-----------+
| dept_id | dept_name | dept_call | dept_type |
+---------+-----------+-----------+-----------+
|       4 | Economy   | 44444     | B         |
|       5 | History   | 55555     | B         |
+---------+-----------+-----------+-----------+
2 rows in set (0.00 sec)

在 tb_departments 表中有两条记录的 dept_name 字段值是以字母 y 结尾的，返回结果有 2 条记录。

【实例 4】

在 tb_departments 表中，查询 dept_name 字段以“my”结尾的记录，输入的 SQL 语句和执行结果如下所示。

mysql> SELECT * FROM tb_departments
    -> WHERE dept_name REGEXP 'my$';
+---------+-----------+-----------+-----------+
| dept_id | dept_name | dept_call | dept_type |
+---------+-----------+-----------+-----------+
|       4 | Economy   | 44444     | B         |
+---------+-----------+-----------+-----------+
1 row in set (0.00 sec)

只有 Economy 是以“my”结尾的，所以查询结果中只有 1 条记录。

用符号 “.” 代替字符串中的任意一个字符

【实例 5】

在 tb_departments 表中，查询 dept_name 字段值包含字母“o”与字母“y”，且两个字母之间只有一个字母的记录，输入的 SQL 语句和执行结果如下所示。

mysql> SELECT * FROM tb_departments
    -> WHERE dept_name REGEXP 'o.y';
+---------+-----------+-----------+-----------+
| dept_id | dept_name | dept_call | dept_type |
+---------+-----------+-----------+-----------+
|       4 | Economy   | 44444     | B         |
|       5 | History   | 55555     | B         |
+---------+-----------+-----------+-----------+
2 rows in set (0.00 sec)

查询语句中“o.y”指定匹配字符中要有字母 o 和 y，且两个字母之间包含单个字符，并不限定匹配的字符的位置和所在查询字符串的总长度，因此 Economy 和 History 都符合匹配条件。

使用 “*” 和 “+” 来匹配多个字符

星号 “*” 匹配前面的字符任意多次，包括 0 次。加号 “+” 匹配前面的字符至少一次。

【实例 6】

在 tb_departments 表中，查询 dept_name 字段值包含字母“C”，且“C”后面出现字母“h”的记录，输入的 SQL 语句和执行结果如下所示。

mysql> SELECT * FROM tb_departments
    -> WHERE dept_name REGEXP '^Ch*';
+---------+-----------+-----------+-----------+
| dept_id | dept_name | dept_call | dept_type |
+---------+-----------+-----------+-----------+
|       1 | Computer  | 11111     | A         |
|       3 | Chinese   | 33333     | B         |
+---------+-----------+-----------+-----------+
2 rows in set (0.00 sec)

星号 “*” 可以匹配任意多个字符，Computer 中字母 C 后面并没有出现字母 h，但是也满足匹配条件。

【实例 7】

在 tb_departments 表中，查询 dept_name 字段值包含字母“C”，且“C”后面出现字母“h”至少一次的记录，输入的 SQL 语句和执行结果如下所示。

mysql> SELECT * FROM tb_departments
    -> WHERE dept_name REGEXP '^Ch+';
+---------+-----------+-----------+-----------+
| dept_id | dept_name | dept_call | dept_type |
+---------+-----------+-----------+-----------+
|       3 | Chinese   | 33333     | B         |
+---------+-----------+-----------+-----------+
1 row in set (0.00 sec)

“h+” 匹配字母 “h” 至少一次，只有 Chinese 满足匹配条件。

匹配指定字符串

正则表达式可以匹配指定字符串，只要这个字符串在查询文本中即可，若要匹配多个字符串，则多个字符串之间使用分隔符 “|” 隔开。

【实例 8】

在 tb_departments 表中，查询 dept_name 字段值包含字符串 “in” 的记录，输入的 SQL 语句和执行结果如下所示。

mysql> SELECT * FROM tb_departments
    -> WHERE dept_name REGEXP 'in';
+---------+-----------+-----------+-----------+
| dept_id | dept_name | dept_call | dept_type |
+---------+-----------+-----------+-----------+
|       3 | Chinese   | 33333     | B         |
+---------+-----------+-----------+-----------+
1 row in set (0.00 sec)

可以看到，dept_name 字段的 Chinese 中包含字符串“in”，满足匹配条件。

【实例 9】

在 tb_departments 表中，查询 dept_name 字段值包含字符串“in”或者“on”的记录，输入的 SQL 语句和执行结果如下所示。

mysql> SELECT * FROM tb_departments
    -> WHERE dept_name REGEXP 'in|on';
+---------+-----------+-----------+-----------+
| dept_id | dept_name | dept_call | dept_type |
+---------+-----------+-----------+-----------+
|       3 | Chinese   | 33333     | B         |
|       4 | Economy   | 44444     | B         |
+---------+-----------+-----------+-----------+
2 rows in set (0.00 sec)

可以看到，dept_name 字段的 Chinese 中包含字符串“in”，Economy 中包含字符串“on”，满足匹配条件。

提示：LIKE 运算符也可以匹配指定的字符串，但与 REGEXP 不同，LIKE 匹配的字符串如果在文本中间出现，就找不到它，相应的行也不会返回。而 REGEXP 在文本内进行匹配，如果被匹配的字符串在文本中出现，REGEXP 将会找到它，相应的行也会被返回。

匹配指定字符串中的任意一个

方括号 “[]” 指定一个字符集合，只匹配其中任何一个字符，即为所查找的文本。

【实例 10】

在 tb_departments 表中，查询 dept_name 字段值包含字母“o”或者“e”的记录，输入的 SQL 语句和执行结果如下所示。

mysql> SELECT * FROM tb_departments
    -> WHERE dept_name REGEXP '[io]';
+---------+-----------+-----------+-----------+
| dept_id | dept_name | dept_call | dept_type |
+---------+-----------+-----------+-----------+
|       1 | Computer  | 11111     | A         |
|       3 | Chinese   | 33333     | B         |
|       4 | Economy   | 44444     | B         |
|       5 | History   | 55555     | B         |
+---------+-----------+-----------+-----------+
4 rows in set (0.00 sec)

从查询结果可以看到，所有返回的记录的 dept_name 字段的值中都包含字母 o 或者 e，或者两个都有。

方括号 “[]” 还可以指定数值集合。

【实例 11】

在 tb_departments 表中，查询 dept_call 字段值中包含 1、2 或者 3 的记录，输入的 SQL 语句和执行结果如下所示。

mysql> SELECT * FROM tb_departments
    -> WHERE dept_call REGEXP '[123]';
+---------+-----------+-----------+-----------+
| dept_id | dept_name | dept_call | dept_type |
+---------+-----------+-----------+-----------+
|       1 | Computer  | 11111     | A         |
|       2 | Math      | 22222     | A         |
|       3 | Chinese   | 33333     | B         |
+---------+-----------+-----------+-----------+
3 rows in set (0.00 sec)

查询结果中，dept_call 字段值中有 1、2、3 三个数字中的一个即为匹配记录字段。

匹配集合 “[123]” 也可以写成 “[1-3]”，即指定集合区间。例如，“[a-z]” 表示集合区间为 a~z 的字母，“[0-9]” 表示集合区间为所有数字。

匹配指定字符以外的字符

“[^字符集合]” 匹配不在指定集合中的任何字符。

【实例 12】

在 tb_departments 表中，查询 dept_name 字段值包含字母 a~t 以外的字符的记录，输入的 SQL 语句和执行结果如下所示。

mysql> SELECT * FROM tb_departments
    -> WHERE dept_name REGEXP '[^a-t]';
+---------+-----------+-----------+-----------+
| dept_id | dept_name | dept_call | dept_type |
+---------+-----------+-----------+-----------+
|       1 | Computer  | 11111     | A         |
|       4 | Economy   | 44444     | B         |
|       5 | History   | 55555     | B         |
+---------+-----------+-----------+-----------+
3 rows in set (0.00 sec)

返回记录中的 dept_name 字段值中包含了指定字母和数字以外的值，如 u、y 等，这些字母均不在 a～t 中，满足匹配条件。

应用示例 1

场景介绍：

精确查询 question_id 包含 2 的记录

使用正则

SELECT * FROM yexam_exam where question_ids REGEXP '(^|,)2(,|$)';

查询结果：

bsonserializer和正则表达式(代码片段)

当查询包含正则表达式过滤器时，我从字符串解析mongo查询时遇到问题。过滤器定义是由]创建的varbson=BsonSerializer.Deserialize<BsonDocument>(query);vardefinition=newBsonDocumentFilterDefinition<CellDo>(bson);查询看起来像这样："description":"$reg... 查看详情

正则表达式（regexp）(代码片段)

1正则表达式（英语：RegularExpression）正则表达式（英语：RegularExpression，在代码中常简写为regex、regexp或RE）使用单个字符串来描述、匹配一系列符合某个句法规则的字符串搜索模式。搜索模式可用于文本搜索和文本替换。2 ... 查看详情

正则表达式——html(代码片段)

1正则表达式正则表达式（英语：RegularExpression，在代码中常简写为regex、regexp或RE）使用单个字符串来描述、匹配一系列符合某个句法规则的字符串搜索模式。搜索模式可用于文本搜索和文本替换。什么是正则表达式？... 查看详情

如何将查询转换为使用正则表达式而不是相等(代码片段)

...检查例如年龄是否包含类似“2”的值。我需要使用正则表达式。无论如何转换该查询以使用正则表达式/而不是$eq运算符？PS：我不想使用聚合，因为我正在使用旧版本。答案您可以使用$indexOfCP查找字符串字符内的子字符串db.coll... 查看详情

mysql正则表达式（regexp）之管道“|”的应用(代码片段)

select*fromarticlewheretagREGEXP'java|html5'limit0,10;SQL语句解释：查询字段tag匹配为“java”或“html5”的article表中的数据，且最多10条查询结果：查看详情

瞧这里，没有比这更全的！mysql高阶语句介绍汇总！（查询正则表达式运算符连接查询函数存储过程）(代码片段)

mysql高阶语句一.常用查询类1.按关键字排序2.区间判断及查询不重复记录（1）AND/OR——且/或（2）distinct查询不重复记录3.对结果进行分组4.限制结果条目limit5.设置别名alise、as6.通配符7.子查询8.视图（1）作... 查看详情

re模块，主要用来查询(代码片段)

...re模块（就是正则表示式模块）主要功能就是做匹配#正则表达式（re）是一种小型的高度专业化的编程语言，#例子：12345665、4563111、4565778、可以通过123.。。6+*正则匹配importre#元字符：.^$*+?[]|()\res=re.findall(‘\d+‘,‘asdw45qw 查看详情

html入门笔记(代码片段)

今天主要学习了JavaScript的正则表达式，下面就来分享一下今天的学习收获。一、正则表达式1.什么是正则表达式？正则表达式是由一个字符序列形成的搜索模式。当你在文本中搜索数据时，你可以用搜索模式来描述你... 查看详情

用正则表达批量快速解决如“过滤注释的//”“查询特定单词”“匹配特定子字符串”等工作中难题(代码片段)

正则表达式原理正则表达式(RegularExpression)起源于人类神经系统的研究。正则表达式的定义有以下几种：用某种模式去匹配一类字符串的公式，它主要是用来描述字符串匹配的工具。描述了一种字符串匹配的模式。可以... 查看详情

mysql数据库高阶语句之正则表达式运算符连接表达式join(代码片段)

一、正则表达式实例：selectid,namefromwwwwherenameregexp'^li'; ##查询以li开头的学生信息selectid,namefromwwwwherenameregexp'i$'; ##查询以i结尾的的学生信息 selectid,namefromwwwwherenameregexp'an'; 查看详情

python中正则表达式的巧妙使用(代码片段)

...下：findall(pattern,string,flags=0)pattern：指定需要匹配的正则表达式。string：指定待处理的字符串。flags：指定匹配模式，常用的值可以是re.I、re.M、re.S和re.X。re.I的模式是让正则表达式对大小查看详情

hive正则表达式(代码片段)

hive正则正则表达式描述了一种字符串匹配的模式，可以用来检查一个字符串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。正则表达式是由普通字符以及特殊字符组成的文字模式。普通字符... 查看详情

正则表达式反斜杠的匹配2018-11-30(代码片段)

问题引入：在学习正则表达式的过程中，遇到了一直无法正确匹配反斜杠，初始使用的是下面两种方法：使用普通字符串，匹配一个反斜杠，需要再用一个反斜杠来转义：\使用带r的原始字符串，这样就不用再转义：r‘‘使用上... 查看详情

用于转义 MySQL 正则表达式语法的 PHP 函数

...QL正则表达式语法的PHP函数【英文标题】：PHPfunctiontoescapeMySQLregexpsyntax【发布时间】：2011-04-3018:22:47【问题描述】：我正在寻找类似于preg_quote的东西，但使用的是MySQLregexp语法。有什么想法吗？【问题讨论】：What\'sthebestwaytoescape... 查看详情

markdown正则表示正则表达式(代码片段)

查看详情

html入门笔记(代码片段)

text正则表达式片段(代码片段)

查看详情

正则表达式(代码片段)

1#tool.chinaz.com/regex/这是一个在线的正则表达式测试工具2#re模块,在python中想要使用正则表达式，要使用re模块来进行使用3#正则表达式45#学习正则表达式67#学习使用re模块来操作正则表达式8910#正则表达式是用来做字符串匹配的11#... 查看详情