请问如何添加豆瓣图书简介和作者信息

功能建议 · 652 次浏览
不买会员的爱好者 创建于 2022-01-31 10:30

老哥你好,感谢你的更新!一直在用你的这个动作,非常强!减轻了很多工作量!遇到喜欢用notion和quicker的同伴太高兴了!

请教下,能否添加“作者信息”和“内容简介”这两个字段进页面?谢谢你的关注!


回复内容

 现在我测试的抓简介的语句是//div[@class='intro']/p/text()

但是只能抓p1,如果要抓所有p字段,应该如何操作呢?感谢赐教!


yslemmo 2022-01-31 16:01 :

可以呀,就用你这个Xpath语法就行。

1. 只不过提取方式改成「所有符合条件的节点」,提取到一个列表变量中

2. 然后使用「列表合成文本」动作将列表转合并成文本。分割文本输入「\r\n」,取消勾选「转义分割文本」

3. Http请求中,请求体内容添加相应的字段(Text)

yslemmo 2022-01-31 16:44 :

刚又看了一下豆瓣的「内容简介」和「作者简介」的类名都是 intro,但是可以根据h2这个标签进行定位(例如:节点 //span[text()="作者简介"]的父节点的下一个兄弟节点的子节点中,类名为intro的节点内容)

Xpath语法:

内容简介://span[text()="内容简介"]/../following::div[1]//div[@class='intro']/p/text()

作者简介://span[text()="作者简介"]/../following::div[1]//div[@class='intro']/p/text()

不买会员的爱好者 2022-02-01 00:44 :

新年好!牛逼老哥 我学习下再测试!

yslemmo 回复 不买会员的爱好者 2022-02-01 17:19 :

新年好。

yslemmo 2022-01-31 16:08
#2

我没有添加「简介」字段的需求,我一般自己买的书基本也知道大概内容,记不太清的直接点击豆瓣链接再看就行了。我把实现抓取简介的几个动作的截图贴一下,你自己弄一下吧。

1. 添加两个变量,introList(字典类型)、Intro(文本类型)

2. Xpatch提取网页内容

3. 列表合并成文本

4. Http请求(框住的内容)


不买会员的爱好者 2022-02-07 21:44 :

设置了, 但是这个语法只能抓取出一个{},我明天在检查下流程

yslemmo 2022-02-09 03:17 :

我测试下面的xpath语法没问题,另外更新了一版动作,可以直接传图片链接到files属性了,

yslemmo 2022-01-31 16:22
#3

豆瓣大部分的图书的简介都很长,直接放到一个Property中不太好看。建议放到页面段落中(关于如何通过API生成page 内的Block,你可以搜索相关API)

不买会员的爱好者 2022-02-05 17:49 :

太好了,我正在测试,最近找到一个ios捷径导入notion的方法,同步方法再次升级https://www.bilibili.com/video/BV17h411v7hm

yslemmo 2022-01-31 16:48
#4

你要测试Xpath语法可以在安装「Xpath Helper」插件,写Xpath语法时方便很多


不买会员的爱好者 2022-02-05 17:47 :

老哥辅导员yyds

谢谢作者又更新了,提前把id和key备份好,希望平稳过度 开心

回复主贴