问大家一个关于HTML截图的问题

30 views
Skip to first unread message

alsotang

unread,
Feb 27, 2012, 5:11:50 AM2/27/12
to python-cn(华蟒用户组,CPyUG 邮件列表)
假如有了一个网址,比如:http://www.baidu.com,然后我想要我的python代码根据这个网址模拟人的操作去截一副该网站的图。截
图所模拟的显示屏大小最好还可以自己设定。
请问有类似的库可用吗?

G_will

unread,
Feb 27, 2012, 5:17:03 AM2/27/12
to pyth...@googlegroups.com

Github上有类似项目,思路就是用webkit。

>
> --
> 来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
> 规则: http://code.google.com/p/cpyug/wiki/PythonCn
> 发言: pyth...@googlegroups.com
> 退订: python-cn+...@googlegroups.com (向此发空信即退!)
> 详情: http://code.google.com/p/cpyug/wiki/PythonCn
> 严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
> 强烈: 建议使用技巧: 如何有效地报告Bug http://www.chiark.greenend.org.uk/%7Esgtatham/bugs-cn.html

Zimilo

unread,
Feb 27, 2012, 5:22:00 AM2/27/12
to pyth...@googlegroups.com, Zimilo
phantomjs
----
Enjoy分享编程技术的快乐!




依云

unread,
Feb 27, 2012, 5:30:42 AM2/27/12
to pyth...@googlegroups.com

http://www.phantomjs.org/
也有 Python 版。

--
Best regards,
lilydjwg

Linux Vim Python 我的博客:
http://lilydjwg.is-programmer.com/
--
A: Because it obfuscates the reading.
Q: Why is top posting so bad?

alsotang

unread,
Feb 28, 2012, 12:28:36 AM2/28/12
to python-cn(华蟒用户组,CPyUG 邮件列表)
谢谢楼上各位!

Felix Yan

unread,
Feb 28, 2012, 12:51:51 AM2/28/12
to pyth...@googlegroups.com
2012/2/27 G_will <gwill...@gmail.com>:
> Github上有类似项目,思路就是用webkit。
我以前试过几个用webkit的, 需要启动一个headless X(xvfb?), 自己用用当然没事, 但是性能完全不能用于生产环境...

Zoom.Quiet

unread,
Feb 28, 2012, 1:09:05 AM2/28/12
to pyth...@googlegroups.com

- 談性能的话,没有工具可以支撑每秒几千网页解析的,,,
- 真心不如你控制虚拟机集群中的 chrome 们根据任务逐一解析了,,

--
人生苦短, Pythonic! 冗余不做,日子甭过!备份不做,十恶不赦!
俺: http://about.me/zoom.quiet
文字协议: http://creativecommons.org/licenses/by-sa/2.5/cn/

alsotang

unread,
Feb 28, 2012, 9:07:29 AM2/28/12
to python-cn(华蟒用户组,CPyUG 邮件列表)
其实我就是想在SAE上用python写个小应用,想用python模拟人的截图。
根据大家给的回复来说,应该是无法在SAE上实现了。。。

On 2月28日, 下午2时09分, "Zoom.Quiet" <zoom.qu...@gmail.com> wrote:
> 在 2012年2月28日 下午1:51,Felix Yan <felixonm...@gmail.com> 写道:
>
> > 2012/2/27 G_will <gwill.b...@gmail.com>:

Mayli Hellsing

unread,
Feb 28, 2012, 9:41:05 AM2/28/12
to pyth...@googlegroups.com
其实可以,不过需要费些劲,因为如果是要逼真的模拟浏览器渲染应该不可能,
不过如果是模拟把w3元素都绘制出来,可以把在内存做个canvas然后存为png,这就用不到X,就是效果会差些

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
规则: http://code.google.com/p/cpyug/wiki/PythonCn
发言: pyth...@googlegroups.com
退订: python-cn+...@googlegroups.com (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
强烈: 建议使用技巧: 如何有效地报告Bug http://www.chiark.greenend.org.uk/%7Esgtatham/bugs-cn.html



--
Best regards,
Mengyang Li
NKU,TJ,CHN

Chopin Ngo

unread,
Feb 28, 2012, 9:49:44 AM2/28/12
to pyth...@googlegroups.com
之前一直在找能够在Linux Shell下,下载国外网盘的方法(非付费会员)
看了下phantomjs的几个示例,貌似可以实现啊...就是...非付费会员一般都需要输入验证码...Shell上无法显示图形验证码....用程序判断验证码貌似难度大了点啊...我自己都经常要刷新好几次,刷到简单点的验证码才看的清楚...

--
智慧子使父亲喜乐。愚昧人藐视母亲。
              ----箴言 十五章20节

Mayli Hellsing

unread,
Feb 28, 2012, 9:53:52 AM2/28/12
to pyth...@googlegroups.com
你难道就没X么?开个tk显示验证码+文本输入呗。

在 2012年2月28日 下午10:49,Chopin Ngo <cons...@gmail.com>写道:
看了下phantomjs的几个示例,貌似可以实现啊...就是...非付费会员一般都需要输入验证码...Shell上无法显示图形验证码....用程序判断验证码貌似难度大了点啊...我自己都经常要刷新好几次,刷到简单点的验证码才看的清楚...

Chopin Ngo

unread,
Feb 28, 2012, 10:38:14 AM2/28/12
to pyth...@googlegroups.com
是打算在国外的WEB空间上下载的...那个WEB空间支持SSH登录...所以....如果自己有VPS,当然就可以装X了...

在 2012年2月28日 下午10:53,Mayli Hellsing <mayl...@gmail.com>写道:
你难道就没X么?开个tk显示验证码+文本输入呗。

Mayli Hellsing

unread,
Feb 28, 2012, 11:47:03 AM2/28/12
to pyth...@googlegroups.com
X转发

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
规则: http://code.google.com/p/cpyug/wiki/PythonCn
发言: pyth...@googlegroups.com
退订: python-cn+...@googlegroups.com (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
强烈: 建议使用技巧: 如何有效地报告Bug http://www.chiark.greenend.org.uk/%7Esgtatham/bugs-cn.html

依云

unread,
Feb 28, 2012, 12:08:00 PM2/28/12
to pyth...@googlegroups.com
那个也得要有相应的库才行。把图片下回来吧,比如给出到图片的临时链接。

--
Best regards,

Mayli Hellsing

unread,
Feb 28, 2012, 12:20:29 PM2/28/12
to pyth...@googlegroups.com
在我random browsing的过程中发现了以下实现:
  1. 直接转换:
使用python+webkit引擎渲染的:
不过如果你想用简单的方法的话,可以使用
html->pdf->png
 


在 2012年2月27日 下午6:11,alsotang <also...@gmail.com>写道:
--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
规则: http://code.google.com/p/cpyug/wiki/PythonCn
发言: pyth...@googlegroups.com
退订: python-cn+...@googlegroups.com (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
强烈: 建议使用技巧: 如何有效地报告Bug http://www.chiark.greenend.org.uk/%7Esgtatham/bugs-cn.html
Reply all
Reply to author
Forward
0 new messages