JavaScript正则表达式怎么写_如何高效匹配字符串？

狼影 2026-01-06 00:00:00 次阅读

写好JavaScript正则的关键是匹配逻辑与边界条件可靠，需拆解原子规则、慎用标志、避免回溯灾难，并用真实数据反复验证。

JavaScript 正则表达式写得对不对，关键看 test()、exec()、match() 这几个方法是否返回你预期的结果——不是语法没错就行，而是匹配逻辑和边界条件都得压得住。

别从「我要匹配邮箱」这种模糊目标开始，先拆成可验证的原子规则：

对应写出来就是：

/^[^\s@]+@[^\s@]+\.[a-zA-Z]{2,6}$/

。注意这里没用 \w（它会匹配下划线，而邮箱本地部分通常不允许），也没用 .*（太宽泛，容易跨行或吞掉不该吞的内容）。

标志不是装饰，直接决定匹配行为：

g：让 exec() 和 match() 能多次匹配；但 test() 用 g 时会维护 lastIndex，连续调用可能跳过开头——这是最常踩的坑
i：只影响字母大小写，不影响 Unicode 字符（比如中文、emoji 不受它影响）
m：只在开启多行模式后，才让 ^ 和 $ 匹配每行首尾；否则它们只匹配整个字符串的开头和结尾

例如：

const re = /^start/gm;
'restart\nstart'.match(re); // ['start', 'start']，不是 ['restart', 'start']

这不是 bug，是设计：当没匹配到，或用了 g 但没匹配到任何内容时，match() 就返回 null，而不是空数组。

示例：

const text = 'id:123 name:abc';
const re = /id:(\d+)/g;
[...text.matchAll(re)][0][1]; // '123'，安全取第一个捕获组

像 /(a+)+b/ 这种嵌套量词，在遇到不匹配的字符串（如 'aaaaaaaaaa'）时，引擎会指数级尝试所有组合，导致卡死或超时。

真正难的不是写出能跑的正则，而是写出在各种边界输入（空字符串、换行符、Unicode 表情、超长文本）下依然稳定、不慢、不崩的正则——这需要反复用真实数据验证，而不是只测一两个例子。

上一篇文章

JavaScript短路求值是什么_它如何简化条件判断

2026-01-06 476次阅读

下一篇文章

2026-01-06 1290次阅读