Java中使用正则表达式的正确打开方式

不屈的醉猫 發表於 2025-9-1 14:14:00

Java中使用正则表达式的正确打开方式

<h2 id="正则表达式基础语法">正则表达式基础语法</h2>
<p>Java正则表达式基于java.util.regex包，核心类是Pattern和Matcher。基本语法遵循标准正则规范：</p>
<ul>
<li>. 匹配任意单个字符（除换行符）</li>
<li>\d 匹配数字，等价于 </li>
<li>\w 匹配单词字符，等价于 </li>
<li>\s 匹配空白字符（空格、制表符等）</li>
<li>[] 字符集合，如匹配a、b或c</li>
<li>^ 在字符集中表示否定，如 [^abc] 匹配非a/b/c的字符</li>
<li>* 匹配前一个元素0次或多次</li>
<li>+ 匹配前一个元素1次或多次</li>
<li>? 匹配前一个元素0次或1次</li>
<li>{n} 精确匹配n次</li>
<li>{n,} 匹配至少n次</li>
<li>{n,m} 匹配n到m次</li>
<li>| 写在方括号外面，表示或</li>
<li>&& 交集，表示与</li>
<li>(?!) 忽略后面字符的大小写</li>
</ul>
<h3 id="常用预定义字符类">常用预定义字符类</h3>
<pre><code>\\d 数字
\\D 非数字 [^0-9]
\\s 空白字符 [ \\t\\n\\x0B\\f\\r]
\\S 非空白字符 [^\\s]
\\w 单词字符
\\W 非单词字符 [^\\w]
</code></pre>
<h3 id="边界匹配符">边界匹配符</h3>
<pre><code>^ 匹配行首
$ 匹配行尾
\b 匹配单词边界
\B 匹配非单词边界
</code></pre>
<h3 id="java中的特殊处理">Java中的特殊处理</h3>
<p>在Java字符串中需要使用双反斜杠转义：</p>
<pre><code>// 匹配数字的正则表达式
String regex = "\\d+"; // 实际表示 \d+
</code></pre>
<h3 id="pattern和matcher使用示例">Pattern和Matcher使用示例</h3>
<pre><code>import java.util.regex.*;

String text = "Hello 123 World";

// Pattern：表示正则表达式
Pattern pattern = Pattern.compile("\\d+");
// Matcher：文本匹配器，从头开始读取，直到读取到匹配的字符串
Matcher matcher = pattern.matcher(text);

// 查找匹配
while (matcher.find()) {
System.out.println("Found: " + matcher.group());
}

// 匹配整个字符串
boolean isMatch = Pattern.matches("Hello.*", text);
</code></pre>
<ul>
<li>贪婪爬取：用+，*，表示尽可能多的获取数据</li>
<li>非贪婪爬取：在+，*后面加上?，表示尽可能少的获取数据</li>
</ul>
<pre><code>    String str = "aaaaaaaaaabbbbbbbbaaaaaaaaa";
   System.out.println("--------- 贪婪匹配 ---------");
   // 贪婪匹配
   Pattern p = Pattern.compile("ab+");
   Matcher m = p.matcher(str);
   while (m.find()) {
         System.out.println(m.group());
   }
   System.out.println("--------- 懒惰匹配 ---------");
   // 懒惰匹配
   Pattern p1 = Pattern.compile("ab+?");
   Matcher m1 = p1.matcher(str);
   while (m1.find()) {
         System.out.println(m1.group());
   }
</code></pre>
<p>效果图：<br>
<img src="https://img2024.cnblogs.com/blog/3684158/202509/3684158-20250901140903455-506030650.png"></p>
<h3 id="分组和捕获">分组和捕获</h3>
<p>使用()创建捕获组：</p>
<pre><code>String str = "a123a";
   String str1 = "abc123abc";
   String str2 = "1117891111";
   String str3 = "aa7879a";
   // 捕获分组
   System.out.println("--------- 捕获分组 ---------");
   String regex = "(.).+\\1";
   String regex1 = "(.+).+\\1";
   String regex2 = "((.)\\2).+\\1";

   System.out.println(str.matches(regex));
   System.out.println(str1.matches(regex1));
   System.out.println(str2.matches(regex2));
   System.out.println(str3.matches(regex2));
   // 非捕获分组
   System.out.println("--------- 非捕获分组 ---------");
   String str4 = "我要学学变变变变撑撑撑撑撑";
   str4 = str4.replaceAll("(.)\\1+", "$1");// replaceAll() 方法用于把所有满足匹配的字符串替换成指定的字符串
   System.out.println(str4);
</code></pre>
<p>效果图：<br>
<img src="https://img2024.cnblogs.com/blog/3684158/202509/3684158-20250901140936023-1040023626.png"></p>
<ul>
<li>从1开始，连续不断</li>
<li>以左括号为基准</li>
<li>捕获分组（默认）：① 内部：\组号 ② 外部：$组号（组号会保留下来）</li>
<li>非捕获分组：使用条件，不占组号
<ul>
<li>"?="：表示任一数据</li>
<li>"?:"：表示所有数据</li>
<li>"?!"：表示不包含这些数据</li>
</ul>
</li>
</ul>
<h3 id="常用正则表达式示例">常用正则表达式示例</h3>
<ul>
<li>邮箱验证：<br>
<code>String emailRegex = "^[\\w-_.+]*[\\w-_.]@([\\w]+\\.)+[\\w]+[\\w]$";</code></li>
<li>手机号验证（中国大陆）：<br>
<code>String phoneRegex = "^1\\d{9}$";</code></li>
<li>身份证号验证（简易版）：<br>
<code>String idCardRegex = "^\\d{5}(18|19|20)\\d{2}(0|1)(0|\\d|3)\\d{3}$";</code></li>
<li>URL验证：<br>
<code>String urlRegex = "^(https?://)?([\\w-]+\\.)+[\\w-]+(/[\\w-./?%&=]*)?$";</code></li>
</ul>
<h3 id="特殊匹配模式">特殊匹配模式</h3>
<p>通过Pattern的常量设置匹配模式：</p>
<pre><code>// 不区分大小写匹配
Pattern.CASE_INSENSITIVE

// 多行模式（^和$匹配每行的开头和结尾）
Pattern.MULTILINE

// 示例：不区分大小写匹配
Pattern.compile("hello", Pattern.CASE_INSENSITIVE).matcher("Hello").find(); // true
</code></pre>
<h3 id="字符串替换">字符串替换</h3>
<p>使用正则表达式进行字符串替换：</p>
<pre><code>String text = "a1b2c3";
String replaced = text.replaceAll("\\d", "-"); // a-b-c-
</code></pre>
<h3 id="性能优化建议">性能优化建议</h3>
<p>预编译常用正则表达式：</p>
<pre><code>private static final Pattern EMAIL_PATTERN = Pattern.compile(emailRegex);
</code></pre>
<ol>
<li>避免过度使用.通配符，尽可能明确匹配范围</li>
<li>对于简单固定字符串匹配，优先使用String.contains()或String.startsWith()等原生方法</li>
<li>谨慎使用回溯量大的表达式（如嵌套的量词）</li>
</ol><br><br>
来源：https://www.cnblogs.com/Saintwaters/p/19068170

頁: [1]

圆梦公社's Archiver

Java中使用正则表达式的正确打开方式