如何使用JavaScript正则表达式【教程】

JavaScript正则需明确匹配目标、边界及转义规则;/^abc$/不匹配因隐含空白,应用^\s*abc\s*$或trim();replace中$1等占位符依赖捕获组;RegExp构造函数需双反斜杠转义。

JavaScript 正则表达式不是“学了就会用”的工具,它真正起效的前提是:你清楚要匹配什么、边界在哪、哪些字符需要转义、g / i / m 标志到底影响哪部分行为。

为什么 /^abc$/test() 里不匹配字符串 "abc"

看起来该匹配,但常见原因是:字符串实际含不可见字符(如首尾空格、BOM、换行符)。^$ 锚定的是行首行尾,不是整个字符串的绝对边界——除非启用 m 标志且字符串含换行;更安全的做法是用 \A\z(但 JS 不支持),所以得靠 ^ + $ 配合 trim() 或显式排除空白:

const str = "  abc  ";
/^\s*abc\s*$/.test(str); // true
/^[a-z]+$/i.test(str.trim()); // true,先 trim 再判断
  • ^ 只匹配输入开头(非每行开头),$ 同理,m 才让它们支持多行模式
  • JS 不支持 \A / \z,别在正则里写它们——会字面匹配字母 A 或 z
  • 空格、制表符、换行符都需显式处理,\s 虽覆盖常见空白,但不包括某些 Unicode 分隔符(如 \u2028

String.prototype.replace() 中的 $1$& 是怎么工作的?

这些是替换字符串里的特殊占位符,只在 replace() 的第二个参数为字符串时生效。它们依赖正则中的捕获组(即括号 ()),且大小写敏感、不能嵌套:

const text = "file-123-name.txt";
text.replace(/-(\d+)-(.+)\.txt/, "_$1_$2_"); // "file_123_name_.txt"
text.replace(/-(\d+)-(.+)\.txt/, "_$&_");     // "file_-123-name.txt_"($& 表示整个匹配)
  • $1 对应第一个 () 捕获的内容,$2 是第二个,最多到 $99
  • $& 是整个匹配字符串,$` 是匹配前的部分,$' 是匹配后部分
  • 如果正则没用括号,$1 会原样输出(即字面字符串 "$1"),不会报错
  • 想动态计算替换内容?必须传函数作为第二个参数,不能依赖 $1

为什么 RegExp 构造函数里要写双反斜杠 \\d

因为字符串字面量先解析一次反斜杠。JS 引擎读到 "\\d",先转成 "\d",再交给正则引擎解释为“数字字符”;而字面量写法 /\d/ 不经过字符串解析,反斜杠直通正则引擎。

// ❌ 错误:传给 RegExp 的字符串里只写一个 \,会被 JS 字符串吞掉
new RegExp("\d"); // 等价于 new RegExp("d"),匹配字母 d

// ✅ 正确:必须双写,让字符串最终提供一个 \ 给正则
new RegExp("\\d"); // 匹配数字

// ✅ 更推荐:能用字面量就不用构造函数,避免转义混乱
/\d/g;

  • 所有需转义的字符(\.\*\+\?\[ 等)在 RegExp 构造函数中都要双写反斜杠
  • 动态拼接正则时,若来源含用户输入,务必对特殊字符做 escape 处理(不能只靠双反斜杠)
  • RegExp 构造函数不支持修饰符标志以外的语法,比如不支持 /x(忽略空白)或 /s(dotAll)在旧环境

正则最难的不是语法,是把模糊的业务需求翻译成精确的字符约束。比如“邮箱格式”,/.+@.+\..+/ 看似能用,但允许 "@."@a.b 这种非法值;真要校验,要么用成熟库(如 validator.js),要么接受它只能做初步过滤——这点常被忽略。