您现在的位置:首页 >> 前端 >> 内容

Selenium读取txt、excel、csv...中文英文字符等文档文件大全

时间:2017/9/20 10:32:00 点击:

  核心提示:这段时间因为工作需要,要熟悉UI层的自动化测试工具,笔者对自动化测试在之前并无了解,但是一番了解下后发现现在关于web UI 最受欢迎的莫过于Selenium了,当然RobotFramework也名列...

这段时间因为工作需要,要熟悉UI层的自动化测试工具,笔者对自动化测试在之前并无了解,但是一番了解下后发现现在关于web UI 最受欢迎的莫过于Selenium了,当然RobotFramework也名列前茅,而参数化也是尤为重要的一点,笔者这几天实现参数化的时候总是遇到很多中文编码、以及数字呈浮点数显示的情况,这里就来谈论一下关于Selenium 如何读取Txt、Excel、Csv..等文件以及如何获得我们想要的格式数据

一 、读取TXT文档

Txt算是比较简单的文档了,不多说直接上代码:

1.单独的关键字,直接读取

Selenium读取txt、excel、csv...中文英文字符等文档文件大全

#coding utf-8
file_info = open('Testing.txt', 'r')
values = file_info.readlines()
file_info.close()
for item in values:
    print item

结果:

Selenium读取txt、excel、csv...中文英文字符等文档文件大全

2.两列关键字,以‘,’逗号分隔

Selenium读取txt、excel、csv...中文英文字符等文档文件大全

代码部分:

file_info = open('Testing.txt', 'r')
values = file_info.readlines()
file_info.close()
for item in values:
    data1 = item.split(',')[0]#第一列
    data2 = item.split(',')[1]#第二列
    print data1, data2

结果如下:

Selenium读取txt、excel、csv...中文英文字符等文档文件大全

Txt格式的是比较简单的,但是如果有多组数据呢?用spilt拆分就没那么方便了,因为以split方法一次只能将字符串拆分为两段,那么针对多组数据就要用到csv和excel啦。

二、读取csv文档

注意csv文档的建立最好是在excel中另存为——>选择csv格式,而不是直接改后缀。

读取csv文档我们需要引入csv库,即import csv

先看一下我们需要读取的文档:

Selenium读取txt、excel、csv...中文英文字符等文档文件大全

OK,接下来我们要访问这些数据:

import csv #访问csv文件需要csv库的支持(本身自带),直接导入即可
my_file = 'Testing.csv' #文件名
values = csv.reader(open(my_file, 'rb'))
for item in values:
    print item #整行读
    print item[0], item[1], item[2] #一个数据一个数据的读

使用item[Index]可以访问具体的那个数据,结果如下:

Selenium读取txt、excel、csv...中文英文字符等文档文件大全

看起来不错,很能满足我们的需求,可以方便的读取多行多列数据,而且针对单个的数据访问也十分方便。但是,But…有些人可能试过,csv是不支持中文的,自己写进中文进去打开就有可能是一堆编码,那么Excel就登场了~

三、读取Excel文件

笔者个人觉得Excel是比较完美的,改进了CSV不支持中文的情况,好的,看一下我们的例子:

Selenium读取txt、excel、csv...中文英文字符等文档文件大全

在Selenium使用Excel读取数据的话我们是需要下载Excel库文件的,即xlrd文件,下载链接:https://pypi.python.org/pypi/xlrd

下载完成解压,在当前目录cmd,输入python setup.py install即可安装成功,也可以直接cmd,输入pip命令:pip install xlrd

安装完成后,直接导入xlrd即可使用相关操作Excel的方法:

import xlrd
my_file = xlrd.open_workbook('Testing.xls')#得到文件
table = my_file.sheets()[0]#得到sheet页
nrows = table.nrows #总行数
ncols = table.ncols #总列数
i = 0
while i < nrows:
    print table.row_values(i)[0], table.row_values(i)[1]
    i = i+1

结果:

Selenium读取txt、excel、csv...中文英文字符等文档文件大全

OK,Excel能够解决中文的问题,但是此处需要注意,不能直接读取整行的数据,只能将数据分开一个一个的读取,例如以上代码换成下面这样:

while i < nrows:
    print table.row_values(i) #读取整行
    i = i+1

结果就会出现编码问题:Selenium读取txt、excel、csv...中文英文字符等文档文件大全

可能大家还注意到了,这里第二列的数字1990,在Selenium就变成了浮点型数字1999.0,之前看过一个解决办法是在Excel文档中,选中单元格,右键单元格格式——>文本.但是笔者发现这样并不能解决问题,至于数字目前笔者的解决办法是代码判断,如果是纯数字就转化为int型。

while i < nrows:
    cell = table.row_values(i)[1] #得到数字列数据
    ctype = table.cell(i, 1).ctype #得到数字列数据的格式
    if ctype == 2 and cell % 1 == 0: #判断是否是纯数字
        cell = int(cell) #是纯数字就转化位int类型
    print table.row_values(i)[0], cell
    i = i+1

接下来我们再看结果:

Selenium读取txt、excel、csv...中文英文字符等文档文件大全

OK,这下圆满啦。

*注意:

1.csv或者excel格式的文件在最初设置数据的时候都要右键——>单元格格式——>文本

2.excel文件的格式必须是后缀名为*.xls

3.excel文档的ctype 分为5种,对应分别是:

empty: 0

string: 1

number:2

date: 3

boolean :4

error:5

Tags:SE EL LE EN 
作者:网络 来源:tt_Litingt