PySpider 如何合并长文章的内分页

24 views
Skip to first unread message

lee...@gmail.com

unread,
Apr 25, 2019, 8:45:23 AM4/25/19
to pyspider-users
文章很长,内部有多个分页,请问如何每个分页都采集后再合成一个完整的文章?

比如漫画的一个篇章有很多个页面,但是都属于同一话,采集完后要归类到同一个页面。

Url 一般是这种格式。

https://www.dmzj.com/view/jinshangxiang/83169.html#@page=1
https://www.dmzj.com/view/jinshangxiang/83169.html#@page=2
https://www.dmzj.com/view/jinshangxiang/83169.html#@page=3

谢谢
Reply all
Reply to author
Forward
0 new messages