python字符串操作和string模块代码分析

任何语言都离不开字符,那就会涉及对字符的操作,尤其是脚本语言更是频繁,不管是生产环境还是面试考验都要面对字符串的操作。 python的字符串操作通过2部分的方法函数基本上就可以解决所有的字符串操作需求:python的字符串属性函数python的string模块~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ …… 阅读全文

Python抓取gb2312字符集网页中文乱码

最近在学习Python,练习用Python抓取网页内容并解析,在解析gb2312字符集网页时出现中文乱码:UnicodeEncodeError:'gbk'codeccan'tencodecharacteru'\xbb'inposition0:illegalmultibytesequence网上找了一大推,长篇大论啰嗦了半天都不知道在讲什么,原来Pyt …… 阅读全文

Python网页抓取正则表达式应用练习-爬取基金信息

仅作练习:1、Python网页抓取2、Python正则表达式应用直接上代码:# coding: utf-8import sysimport urllibimport urllib2import reimport requests# reload(sys)# sys.setdefaultencoding("utf-8")# 基金代码fundIds = ['000051 …… 阅读全文

Python编写定时关机小脚本

# coding: utf-8import sysimport osimport timereload(sys)sys.setdefaultencoding("GBK")# shutdown computer after time_diff secondsdef shutdown(seconds): print str(seconds) + u' 秒后将会关机...' …… 阅读全文

Python爬虫利器一之Requests库的用法

前言之前我们用了 urllib 库,这个作为入门的工具还是不错的,对了解一些爬虫的基本理念,掌握爬虫爬取的流程有所帮助。入门之后,我们就需要学习一些更加高级的内容和工具来方便我们的爬取。那么这一节来简单介绍一下 requests 库的基本用法。注:Python 版本依然基于 2.7官方文档以下内容大多来自于官方文档,本文进行了一些修改和总结。要了解更多可以参考 …… 阅读全文

Python爬虫利器二之Beautiful Soup的用法

上一节我们介绍了正则表达式,它的内容其实还是蛮多的,如果一个正则匹配稍有差池,那可能程序就处在永久的循环之中,而且有的小伙伴们也对写正则表达式的写法用得不熟练,没关系,我们还有一个更强大的工具,叫Beautiful Soup,有了它我们可以很方便地提取出HTML或XML标签中的内容,实在是方便,这一节就让我们一起来感受一下Beautiful Soup的强大吧。1. Beautiful So …… 阅读全文

Python库beautifulsoup的安装与使用

http://www.lfd.uci.edu/~gohlke/pythonlibs/找到相应的库,解压后把bs4目录复制到Python安装目录下的lib目录下。参考:http://cuiqingcai.com/1319.html#coding:utf-8from bs4 import BeautifulSouphtml = ...soup = BeautifulSoup …… 阅读全文

Python库selenium的安装与使用

下载:https://pypi.python.org/pypi/selenium#downloads浏览器驱动:https://sites.google.com/a/chromium.org/chromedriver/downloadshttp://chromedriver.storage.googleapis.com/index.html?path=2.21/ …… 阅读全文