1. Xpath简单匹配标签内容

    Xpath Xpath全程为xml路径语言,用来确定xml文档中某部分位置的语言。 使用Xpath需要安装lxml库,lxml为Python的第三方库,安装方法可以直接下载库文件手动添加到python库...

    2017-05-18

  2. requests的content与text导致lxml的解析问题

    我使用requests获取了新浪微博的源代码,通过lxml库的etree.HTML来处理一段网页源代码,从而生成一个可以被xpath解析的对象。 selector = etree.HTML(html) 遇到报错: sel...

    2017-05-18

  3. mac osx下面的selenium(python)+chromedriver配置

    Python2.7.10: 系统自带 终端输入python --version 可以查看版本号。 Selenium: 用命令安装 sudo easy_install selenium 在用 brew install selenium的时候检测出来是brew ...

    2017-05-05

  4. Python正则表达式实现截取成对括号的方法

    本文实例讲述了Python正则表达式实现截取成对括号的方法。分享给大家供大家参考,具体如下: strs = '1(2(3(4(5(67)6)7)8)9)0' reg1 = re.compile('([()])∗') #一对括号 r...

    2017-05-03

  5. Python爬虫利器二之Beautiful Soup的用法

    http://cuiqingcai.com/1319.html python下很帅气的爬虫包 - Beautiful Soup 示例 http://blog.csdn.net/watsy/article/details/14161201 http://www.cnblogs.com/xin-xin/...

    2017-03-27

  6. Python学习

    错误收集: 1。import urllib.request提示 ImportError: No module named request,我是Python 2.7.3 from urllib import request,提示ImportError: cannot import name ...

    2016-03-15

  7. python根据股票代码获取当前数据

    #!/usr/bin/env python # -*- coding: utf-8 -*- import urllib2 import re import datetime def getStockInfo(url): """根据url获取信息""" stockList = [] ...

    2016-03-11

  8. 抓美图

    #-*- coding:utf-8 -*- import os import urllib2 import cStringIO import Image import re import requests from lxml import etree Mozilla_header={ 'Connection'...

    2016-03-11