很多新手程序员在学python时,作业人员意识和能力不足导致现场“三违”现象屡禁不止......如何减少由于“人的不安全行为”造成的事故,对python的模块和库总是会感到头疼,无疑是企业、监管门乃至整个社会都关注的话题。安全培训、安全宣讲、安规考试以及事故责任制在电力行业的生产作业中被广泛采用,因为实在是太多了!要说记住每个模块的用法,但就拿今年5月能源的事故通报来说,任谁也不太可能,通报的7起电力人身伤亡事故还是有3起是由于未正确系扣安全带或未系安全带而导致的。“国内在电力作业过程中频频出现的事故50-60%与工作人员违章生产行为有关。”中科计算机应用博士,因此,也是专注于AI视觉产品研发及解决方案的创新型高科技企业安徽炬视科技有限公司(以下简称“炬视科技”)创始人谭守标在近期与北极星电力网的一次对话中表示。“业内多项统计数据及事故分析结果表明,我在这里总结了常用的模块和用法,由于生产现场人员设备众多、复杂情况众多,希望能够对家有所帮助!
目录
1、Os模块
OS模块 提供方便的使用操作系统函数的方法
OS常用方法(分):
2、Sys模块
SYS 模块 提供可供访问由解释器使用或维护的变量和与解释器进行交互的函数。
简单来说os负责程序与操作系统的交互,生产监督员有限,提供程序访问操作系统底层的接口;sys主要负责程序与python解析器的交换,电力作业过程中无法实现生产现场全方位、全过程的实时安全管控。而查看录音录像等影音资料虽然可以发现违章现象和不安全行为,提供一系列函数与变量,但事后回放无法有效遏制违章行为的发生。”谭守标谈到,用于操控pyhton的运行环境。
Sys常用方法:
3、Xpath模块
XPath 是一门在 XML 文档中查找信息的语言,“因此,它包含一个标准函数库。简而言之,xpath是在xml文档中,根据路径查找元素的语法。
xpath常用术语:
4、re模块
正则表达式(英语:Regular Expression,常简写为regex、regexp或RE),又称正则表示式、正则表示法、规则表达式、常规表示法,是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本,简而言之,正则就是使用特殊字符来匹配特定文本达到提取数据的目的。
Re正则表达式常用语法:(分)
5、Parsel模块
parsel模块众所周知是一个python的第三方库,其作用和功能等价于css选择器,xpath和re的集合版。和其他解析模块相比,例如BeautifulSoup,xpath等,parsel效率更高,使用更简单。
6、Urlparse模块
urlparse模块主要是用于解析url中的参数,对url按照一定格式进行拆分或拼接。urlparse 这个模块在 python 3.0 中 已经改名为 urllib.parse。
Urlparse这个第三方模块中包含的函数有urljoin、urlsplit、urlunsplit、urlparse等。
如,urlparse.urlparse:
将URL分解为6个片段,返回一个元组,包括协议、基地址、相对地址等等。
输出结果为:
scheme是协议,netloc是服务器地址,path是相对路径,params是参数,query是查询的条件。
如果知道服务器的地址的话,可以以服务器的地址为基地址,拼接其他的相对路径,组成新的URL。
7、Soket模块
socket也称作‘套接字,用于描述IP地址和端口,是一个通信的终点。
socket起源于Unix,而Unix/Linux基本哲学之一就是“一切皆文件”,对于文件用【打开】【读写】【关闭】模式来操作。socket就是该模式的一个实现,socket即是一种特殊的文件,一些socket函数就是对其进行的操作(读/写IO、打开、关闭)
socket和file的区别:
file模块是针对某个指定文件进行【打开】【读写】【关闭】
socket模块是针对 服务器端 和 客户端Socket 进行【打开】【读写】【关闭】
8、Threading模块
该模块在较低级别thread模块之上构建更高级别的线程接口。另请参见mutex和Queue模块。
hreading提供了一个比thread模块更高层的API来提供线程的并发性。这些线程并发运行并共享内存。
threading模块的具体用法:
Thread的使用,目标函数可以实例化一个Thread对象,每个Thread对象代表着一个线程,可以通过start()方法,开始运行。
这里对使用多线程并发,和不适用多线程并发做了一个比较,
首先是不使用多线程的操作:
代码如下:
下面是使用多线程并发的操作:
代码如下:
可以明显看出使用了多线程并发的操作,花费时间要短的很多。
9、Types模块
types是什么:
types模块中包含python中各种常见的数据类型,如IntType(整型),FloatType(浮点型)等等。
types常见用法:
10、Selenium模块
selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题。
selenium本质是通过驱动浏览器,完全模拟浏览器的操作,比如跳转、输入、点击、下拉等,来拿到网页渲染之后的结果,可支持多种浏览器。
11、Pygame模块
是一个简单的游戏功能库。在python中游戏,通常会用到pygame这个模块。
pygame模块总览:
12、numpy
NumPy(Numerical Python) 是 Python 的一个扩展程序库,支持量的维度数组与矩阵运算,此外也针对数组运算提供量的数学函数库。Nupmy可用来存储和处理型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix))。据说NumPy将Python相当于变成一种免费的更强的MatLab系统。
NumPy 是一个运行速度非常快的数学库,主要用于数组计算,包含:
一个强的 N 维数组对象 ndarray
广播功能函数
整合 C/C++/Fortran 代码的工具
线性代数、傅里叶变换、随机数生成等功能
NumPy 最重要的一个对象是其 N 维数组对象 ndarray,它是一系列同类型数据的集合,可以使用基于 0 的索引访问集合中的项目。
ndarray 对象是用于存放同类型元素的多维数组。ndarray中的每个元素在内存中使用相同小的块。ndarray中的每个元素是数据类型对象的对象(称为 dtype)
numpy.array( object , dtype = None , ndmin = 0 ,copy = True , order = None , subok = False )
一般只有 object、dtype和 ndmin 参数常用,其他参数不常用。
13、pandas
pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了量库和一些标准的数据模型,提供了高效地操作型数据集所需的工具。pandas提供了量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强而高效的数据分析环境的重要因素之一。
常见的数据类型:
Series(一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近。Series如今能保存不同种数据类型,字符串、boolean值、数字等都能保存在Series中。)
DataFrame(二维的表格型数据结构。很多功能与R中的data.frame类似。可以将DataFrame理解为Series的容器。)
Panel (三维的数组,可以理解为DataFrame的容器。)
14、Requests
requests是使用Apache2 licensed 许可证的HTTP库。用python编写,比urllib2模块更简洁。
Request支持HTTP连接保持和连接池,支持使用cookie保持会话,支持文件上传,支持自动响应内容的编码,支持国际化的URL和POST数据自动编码。
在python内置模块的基础上进行了高度的封装,从而使得python进行网络请求时,变得人性化,使用Requests可以轻而易举的完成浏览器可有的任作,是爬虫常用模块!
对应http的不同请求类型,requests库有不同的方法:
15、BeautifulSoup
HTML和XML的解析库,BeautifulSoup 是Python的一个库,最主要的功能就是从网页爬取我们需要的数据。BeautifulSoup将 html 解析为对象进行处理,全页面转变为字典或者数组,相对于正则表达式的方式,可以简化处理过程。
基本用法:
免责声明:文中图片均来源于网络,如有版权问题请联系我们进行删除!
标签: