pyquery的使用
pyquery可以像jquery那样操作xml文档,一般如果想要获取html里某元素的内容都是使用正则之类的方法,正则这方法想要匹配精准,表达式得写好,不像pyquery选择器那样很容易就可以写出来,下面我简单的介绍下我个人使用。首先使用:"pip install pyquery"安装,结果如下图:
安装完毕之后即可使用:
import PyQuery as pq d = pq(url='http://www.bstaint.net') d('title').text()
不过在使用中遇到个问题,在使用"d('td:first').text()"的时候报如下错误:
AttributeError: 'XPathExpr' object has no attribute 'add_post_condition'
截图如下:
之后搜索了下,找到了解决方法,使用github上的版本即可解决该问题:
<pre lor:="" rgb(51,="" 51,="" 51);="" overflow:="" auto;="" line-height:="" 18px;="" word-wrap:="" break-word;="" max-height:="" 220px;="" font-size:="" 14px;"="">pip uninstall pyquery pip install git+git://github.com/gawel/pyquery.git
下面是测试截图:
参考链接:http://stackoverflow.com/questions/15474248/attributeerror-xpathexpr-object-has-no-attribute-add-post-condition
补充:
简单使用了下,感觉还需要继续加强,比如上图我原本使用的选择器是"d('h2 a:first').text()"这样是无法获取我需要的标签
补充:Web开发 , Python ,