正则表达式

如何用正则提取文本:零基础指南

2026-06-10

不懂正则表达式也没关系。本文教你用免费的正则生成器,几秒钟内从任意文本中提取值、关键词和数字。


正则表达式是解析文本最强大的工具之一,但手写正则往往令人头疼。正则生成器解决了这个问题:粘贴文本、选择提取模式,立即获得可用的正则表达式。

可以提取哪些内容?

正则生成器支持四种提取模式。提取值:精确匹配已知字符串;关键词后的值:提取标签后面的数字,如"目标等级"或"价格:";所有数字:一次性提取全部整数和小数;自定义:指定前缀和后缀,提取中间的所有内容。

每种模式都会生成不同的正则,立即在输入文本上测试,并高亮显示匹配结果。

第一步:粘贴样本文本

打开正则生成器,粘贴一段有代表性的文本。可以是日志行、游戏通知、网页片段,或任何结构化字符串。

样本越有代表性,生成的正则在真实数据上就越可靠。

第二步:选择提取模式

根据目标选择模式。如果要提取"bounceRate:"后面的数字,选择关键词模式并输入 bounceRate。如果要提取文本中所有数字,选所有数字。如果要提取两段固定文字之间的内容,选自定义并填入前缀和后缀。

每种模式都有简短提示,说明生成的正则具体做什么,无需猜测。

第三步:生成并测试

点击"生成正则"。工具构建正则表达式,立即在样本文本上运行,显示:原始正则字符串、所有匹配项列表,以及原文中黄色高亮的匹配位置。

如果结果不准确,调整关键词或前后缀再次生成。所有处理都在浏览器中进行,无需等待。

第四步:复制代码

切换 JavaScript、Python、Java 标签,获取包含你的正则的即用代码片段,直接粘贴到项目中。

JavaScript 使用 exec 循环,Python 使用 re.findall,Java 使用 java.util.regex 的 Pattern 和 Matcher,均无额外依赖。

隐私与速度

正则生成器完全在浏览器中运行,文本不会发送到任何服务器,离线也可使用,对敏感数据完全安全。

正则生成和测试是即时的,无论输入长度如何,一切由客户端 JavaScript 正则引擎处理。


Try it free — no sign-up required

All conversions happen in your browser. Your files never leave your device.

Open Free Tool →