请教一个正则表达式和一些关于网页提取的问题

动作需求 · 1337 次浏览
CJ12138 创建于 2022-12-16 19:34

目的:由于工作需要,经常要通过工标网核查一些工程规范是否在执行,或者被废除了,类似于这样的

CL大大做了一个快捷核查单条规范的动作,减少了复制粘贴和打开网站的过程。在这个动作的基础上,我想要实现批量核查规范。
现在我做了:在cl大大动作的基础上,我加了正则提取(没接触过编程,照搬讨论区其他人的帖子),选中全部待核验规范后提取出书名号《》中间的汉字内容(即规范名称),输出一个列表。然后用  每个  这个动作,挨个打开工标网站搜索这个规范。大概长这样
使用了一次,效果不太好。原因:这个动作是通过规范汉字名称来进行搜索的,而一个规范会像软件一样迭代,有很多版本,有的废止了有的在执行,我需要额外再分辨确认一下年份和编号,效率甚至比手动复制编号还低,像这样

而我只需要查看我选中的文本的那个版本。所以,解决方法就是,应该提取版本号搜索而不是汉字,这样它将只显示一个版本。

 


问题:如图怎么提取版本号。(门外汉确实摸不着头脑)

暂时的思路是:
1、求大大们帮我写个正则表达式,提取出比如从G,C,J等字母开始,到 - 这个符号后第四个字(-20xx)
2、或者获取文本后,自动去除汉字,书名号,再输出一个文本窗口,允许我手动检查修改一下版本号、确认后再输回去。

有其他更快捷的思路请大大们不吝指教。


CJ12138 2022-12-16 19:38 :

测试文本

(1)《道路交通标志和标线 第1部分:总则》  GB 5768.1-2009

2)《道路交通标志和标线 第2部分:道路交通标志》》  GB 5768.2-2009

3)《道路交通标志和标线 第3部分:道路交通标线》  GB 5768.3-2009

4)《道路交通反光膜》 (GB/T 18833-2012)

5)《给水用聚乙烯(PE)管道系统》 第2部分:管材  GB/T 13663.2-2018

6)《路面标线涂料》  (JT/T280-2004)

7《公路工程质量检验评定标准》 第一册 土建工程 JTG F80/1-2017

8)《变形铝及铝合金化学成分》  GB/T 3190-2020              

9)《道路交通标志板及支撑件》 (GB/T23827-2021)

10)《城市道路交通设施设计规范》 GB50688-20112019年版)

11)《道路交通信号灯设置与安装规范》 GB 14886-2016

12)《道路交通信号控制机》 GB 25280-2016 


动作链接:

https://getquicker.net/Sharedaction?code=f1736328-5061-4624-e5a6-08dadf3d8029 



EC10010 2022-12-16 19:46 :

你是交通工程学教师吗😜

CJ12138 回复 EC10010 2022-12-16 19:56 :

不,只是一名打工人o( ̄┰ ̄*)ゞ

CJ12138 回复 EC10010 2022-12-16 19:59 :

巧了嘛,我说你ID好眼熟正在模仿你写的动作把查询结构提取下来


EC10010 回复 CJ12138 2022-12-16 20:45 :
CJ12138 回复 EC10010 2022-12-16 21:14 :

有头绪吗有头绪吗上面的问题

CL 回复 CJ12138 2022-12-16 21:22 :

上面那个《临时分享》是大佬帮你做的动作,你试下能不能实现提取编号的目的。

CJ12138 回复 EC10010 2022-12-16 21:40 :

感谢大大,一开始以为  临时分享  是指你的另一个动作😂,没发现是个链接

CJ12138 回复 CL 2022-12-16 21:40 :

感谢提醒

回复内容
臭冬瓜 2022-12-17 20:49
#1

你得首先搞清楚国标的起名方式,才能有效提取,这个是有规定的。我大概知道GB=强制性国家标准,GB/T=推荐性国标,GB/Z指导性国标等等。了解这个才能制作正则表达式。

CJ12138 回复 臭冬瓜 2022-12-20 16:30 :

谢谢提醒,不过我只需要提取版本号验证,大佬@EC10010 帮我搞定了

正则

[GCJ].*?-[0-9]{4}


CJ12138 回复 乐昂岚【接定制】 2022-12-20 16:31 :

感谢帮助,大佬@EC10010 已经帮我搞定了

回复主贴