Selenium WebDriver Api 知识梳理-白红宇

Selenium WebDriver Api 知识梳理

阅读量：4943 次

发布时间：2019-06-11

本文共 16700 字，大约阅读时间需要 55 分钟。

之前一直没有系统的梳理WebDriver Api的相关知识，今天借此机会整理一下。

1、页面元素定位

　　1.1、8种常用定位方法　　

# id定位driver.find_element_by_id()# name定位driver.find_element_by_name()# className定位driver.find_element_by_class_name()# tag定位driver.find_element_by_tag_name()# link定位driver.find_element_by_link_text()# partial link定位driver.find_element_by_partial_link_text()# xpath定位driver.find_element_by_xpath()# css定位driver.find_element_by_css_selector()

1.2、实例

以百度输入框为例如下图

# id定位driver.find_element_by_id('kw')# name定位driver.find_element_by_name('wd')# className定位driver.find_element_by_class_name('s_ipt')# tag定位driver.find_element_by_tag_name('input')

注意：由于name、class 、tag等不具有唯一性，所以不能区分不同的元素，所以很少使用。

link 定位与前面介绍的几种定位方法有所不同，它专门用来定位本链接。百度输入框上面的几个文本

链接的代码如下：

通过查看上面的代码，我们发现通过 name 属性定位是个不错的选择。不过我们这里为了要学习 link

定位，通过 link 定位实现如下：

find_element_by_link_text("新闻")find_element_by_link_text("hao123")find_element_by_link_text("地图")find_element_by_link_text("视频")find_element_by_link_text("贴吧")

通过 partial link 定位如下：

find_element_by_partial_link_text("一个很长的")find_element_by_partial_link_text("文本连接")

find_element_by_link_text()方法通过元素标签对之间的部分文本信息来定位元素。

xpath 、css定位

# xpath定位driver.find_element_by_xpath('//*[@id="kw"]')# css定位driver.find_element_by_css_selector('#kw')

通过 class 属性定位：

find_element_by_css_selector(".s_ipt")find_element_by_css_selector(".bg s_btn")

find_element_by_css_selector()方法用于 CSS 语言定位元素，点号（.）表示通过 class 属性来定位元素。

通过 id 属性定位：

find_element_by_css_selector("#kw")find_element_by_css_selector("#su")

井号（#）表示通过 id 属性来定位元素

　　1.3、定位一组元素

WebDriver 还

提供了与之对应的 8 种定位方法用于定位一组元素。

find_elements_by_id()find_elements_by_name()find_elements_by_class_name()find_elements_by_tag_name()find_elements_by_link_text()find_elements_by_partial_link_text()find_elements_by_xpath()find_elements_by_css_selector()

定位一组对象的方法与定位单个对象的方法类似，唯一的区别是在单词 element 后面多了一个 s 表示

复数。

定位一组对象一般用于以下场景：

　批量操作对象，比如将页面所有的复选框都被勾选。

　先获取一组对象，再在这组对象中过滤出需要具体定位的一些对象。比如定位出页面上所有的

checkbox，然后选择最后一个。

如下图通过 css 定位出一组元素，然后获取对应文本，判断是否是自己需要的，然后获取对应下标。

fac_list = self.driver.find_elements_by_css_selector(".w220.ellipsis")            for fac in fac_list:                if fac.text == u'洛阳顺势药业有限公司':                    i = fac_list.index(fac)                    i = i+1                    break            googs_path = ".//*[@id='search_result_list']/li[%d]/div/table/tbody/tr[1]/td[9]/p/a" % i            time.sleep(5)

以上完成了页面元素简单定位，当然这里只是最简单的举例，复杂的定位可以根据需要进行组合，当然也可以借助浏览器插件等工具，进行元素定位，如chrome 的开发者模式，firefox 的 firebug、firepath等工具

2、浏览器操作

　　2.1、控制浏览器大小

# 设置浏览器大小driver.set_window_size(800,800)# 设置浏览器最大化driver.maximize_window()

　　2.2、控制浏览器后退、前进、刷新

# FileName : setWindow.py# Author   : Adil# DateTime : 2018/3/12 16:48# SoftWare : PyCharmfrom selenium import webdriverimport timedriver = webdriver.Chrome()driver.implicitly_wait(1)first_url = "http://www.baidu.com/"driver.get(first_url)time.sleep(5)# 设置浏览器大小driver.set_window_size(800,800)# 设置浏览器最大化driver.maximize_window()# 访问第二个页面second_url = 'http://news.baidu.com/'driver.get(second_url)# 返回（后退）到百度首页print("back to %s"%first_url)   # back to http://www.baidu.com/driver.back()# 前进到新闻页print("forward to %s"% second_url)  # forward to http://news.baidu.com/driver.forward()time.sleep(5)driver.refresh()time.sleep(15)driver.quit()

　　2.3、浏览器滚动

　　　　　　关于浏览器滚动条的滚动，之前，chrome与其他浏览器是不兼容的，

　　　　　　参考 http://www.cnblogs.com/Skyyj/p/7275938.html

　　　　今天尝试发现，chrome 与其他浏览器兼容了，改变了原有的写法。

　　　　上下滚动统一支持如下写法

# 滚动到底部js = "var q=document.documentElement.scrollTop=10000"driver.execute_script(js)time.sleep(5)# 然后滚动到上面js = "var q=document.documentElement.scrollTop=0"driver.execute_script(js)

　　左右滚动

# 设置浏览器窗口大小，长500，高400driver.set_window_size(500,400)time.sleep(5)# 设置横向滚动js = 'window.scrollTo(500,400)'driver.execute_script(js)time.sleep(5)

3、元素操作

　　3.1、元素简单操作

　　　　　　click() 单击、clear()清空、send_keys()文本框输入、submit()提交表单，模拟回车操作

driver.find_element_by_id("idInput").clear()driver.find_element_by_id("idInput").send_keys("username")driver.find_element_by_id("pwdInput").clear()driver.find_element_by_id("pwdInput").send_keys("password")driver.find_element_by_id("loginBtn").click()

　　3.2、鼠标事件

　　　　ActionChains 类提供的鼠标操作的常用方法：

　　　　　　perform() 执行所有 ActionChains 中存储的行为

　　　　　　context_click() 右击

　　　　　　double_click() 双击

　　　　　　drag_and_drop() 拖动

　　　　　　move_to_element() 鼠标悬停

# FileName : mouseSet.py# Author   : Adil# DateTime : 2018/3/12 18:32# SoftWare : PyCharmfrom selenium import webdriver# import ActionChainsfrom selenium.webdriver.common.action_chains import ActionChainsimport timedriver = webdriver.Chrome()# driver.implicitly_wait(1)first_url = "http://www.baidu.com/"driver.get(first_url)# 悬浮 move_to_element()time.sleep(2)driver.maximize_window()time.sleep(2)element1 = driver.find_element_by_xpath(".//*[@id='u1']/a[8]")ActionChains(driver).move_to_element(element1).perform()time.sleep(5)# 右击 context_click()ActionChains(driver).context_click(element1).perform()time.sleep(5)# 双击 double_click()ActionChains(driver).double_click(element1).perform()time.sleep(5)# 拖动 drag_and_drop()#定位元素的源位置element = driver.find_element_by_name("xxx")#定位元素要移动到的目标位置target = driver.find_element_by_name("xxx")#执行元素的拖放操作ActionChains(driver).drag_and_drop(element,target).perform()driver.quit()

　　3.3、键盘事件

　　from selenium.webdriver.common.keys import Keys

　　在使用键盘按键方法前需要先导入 keys 类包。

　　下面经常使用到的键盘操作：

　　send_keys(Keys.BACK_SPACE) 删除键（BackSpace）

　　send_keys(Keys.SPACE) 空格键(Space)

　　send_keys(Keys.TAB) 制表键(Tab)

　　send_keys(Keys.ESCAPE) 回退键（Esc）

　　send_keys(Keys.ENTER) 回车键（Enter）

　　send_keys(Keys.CONTROL,'a') 全选（Ctrl+A）

　　send_keys(Keys.CONTROL,'c') 复制（Ctrl+C）

　　send_keys(Keys.CONTROL,'x') 剪切（Ctrl+X）

　　send_keys(Keys.CONTROL,'v') 粘贴（Ctrl+V）

　　send_keys(Keys.F1) 键盘 F1

　　……

　　send_keys(Keys.F12) 键盘 F12

from selenium import webdriver#引入 Keys 模块from selenium.webdriver.common.keys import Keysdriver = webdriver.Firefox()driver.get("http://www.baidu.com")#输入框输入内容driver.find_element_by_id("kw").send_keys("seleniumm")#删除多输入的一个 mdriver.find_element_by_id("kw").send_keys(Keys.BACK_SPACE)#输入空格键+“教程”driver.find_element_by_id("kw").send_keys(Keys.SPACE)driver.find_element_by_id("kw").send_keys(u"教程")#ctrl+a 全选输入框内容driver.find_element_by_id("kw").send_keys(Keys.CONTROL,'a')#ctrl+x 剪切输入框内容driver.find_element_by_id("kw").send_keys(Keys.CONTROL,'x')#ctrl+v 粘贴内容到输入框driver.find_element_by_id("kw").send_keys(Keys.CONTROL,'v')#通过回车键盘来代替点击操作driver.find_element_by_id("su").send_keys(Keys.ENTER)driver.quit()

4、多frame切换

在 web 应用中经常会遇到 frame 嵌套页面的应用，页 WebDriver 每次只能在一个页面上识别元素，对

于 frame 嵌套内的页面上的元素，直接定位是定位是定位不到的。这个时候就需要通过 switch_to_frame()

方法将当前定位的主体切换了 frame 里。

参看 hao123首页

# 曾经支持的写法# driver.switch_to_frame("iframeu2872032_0")# 最新写法driver.switch_to.frame("iframeu2872032_0")# 切换到该frame下，然后点击操作，到另一页面。driver.find_element_by_xpath('//*[@id="container"]/div[3]/div/a').click()

# 切换到初始framedriver.switch_to.default_content()time.sleep(2)driver.find_element_by_xpath('//*[@id="menus"]/li[2]/a').click()

对于多层frame ，可以使用frame的索引切换

driver.switch_to.frame(3)

如果 iframe没有可用的id 和name属性，还可以使用xpath

# 先通过xpath定位到iframexf = driver.find_element_by_xpath('XXXX')# 再将定位对象传给switch_to.frame(xf)driver.switch_to.frame(xf)...

5、多窗口切换

有时候需要在不同的窗口切换，从而操作不同的窗口上的元素。但 WebDriver 提供了 switch_to.window()方法可以切换到任意的窗口。

看如下代码

# FileName : Switch_to_frame.py# Author   : Adil# DateTime : 2018/3/13 17:49# SoftWare : PyCharmfrom selenium import webdriverimport timedriver = webdriver.Chrome()# driver.implicitly_wait(1)first_url = "http://www.hao123.com/"driver.get(first_url)time.sleep(1)# 曾经支持的写法# driver.switch_to_frame("iframeu2872032_0")# 最新写法driver.switch_to.frame("iframeu2872032_0")# 切换到该frame下，然后点击操作，到另一页面。driver.find_element_by_xpath('//*[@id="container"]/div[3]/div/a').click()# 获取多窗口句柄get_handles = driver.window_handlesprint(get_handles)  #  ['CDwindow-(79057C598F9424652D25D8405B654717)', 'CDwindow-(99F2157CBA34CE7DAE131D3039561013)']# 获取当前窗口句柄get_currentHandle = driver.current_window_handle   # CDwindow-(79057C598F9424652D25D8405B654717)print(get_currentHandle)for handle in get_handles:    if handle != get_currentHandle:        # 最新写法 switch_to.window        driver.switch_to.window(handle)        # 曾经支持的写法        # driver.switch_to_window(handle)print(driver.current_window_handle)# 切换到初始framedriver.switch_to.default_content()time.sleep(2)driver.find_element_by_xpath('//*[@id="menus"]/li[2]/a').click()# 关闭当前句柄页driver.close()time.sleep(5)# 关闭浏览器driver.quit()

6、警告框处理

在 WebDriver 中处理 JavaScript 所生成的 alert、confirm 以及 prompt 是很简单的。具体做法是使用

switch_to_alert()方法定位到 alert/confirm/prompt。然后使用 text/accept/dismiss/send_keys 按需进行操做。

text：获取文本值

accept() ：点击"确认"

dismiss() ：点击"取消"或者叉掉对话框

send_keys() ：输入文本值 --仅限于 prompt,在 alert 和 confirm 上没有输入

框

# 旧式写法driver.switch_to_alert()# 切换到Alter 弹出框上driver.switch_to.alert()# 同意点击确认driver.switch_to.alert().accept()# 取消操作driver.switch_to.alert().dismiss()# 输入文本内容driver.switch_to.alert().send_keys("输入信息！")

7、单选复选框操作

　　7.1、单选： radio

　　首先是定位选择框的位置

　　定位 id，点击图标就可以了，即可完成单选的选择。

　　7.2、复选框： checkbox

　　勾选单个框，比如勾选 selenium 这个，可以根据它的 id=c1 直接定位到点

击就可以了

全部勾选，可以用到定位一组元素，从上面源码可以看出，复选框的

type=checkbox,这里可以用 xpath 语法： .//*[@type='checkbox']

这里注意，敲黑板做笔记了： find_elements 是不能直接点击的，

它是复数的，所以只能先获取到所有的 checkbox 对象，然后通过 for 循环去一

个个点击操作

判断是否选中： is_selected()

from selenium import webdriverdriver = webdriver.Firefox()driver.get("file:///C:/Users/Gloria/Desktop/checkbox.html")# 没点击操作前，判断选项框状态s = driver.find_element_by_id("boy").is_selected()print sdriver.find_element_by_id("boy").click()# 点击后，判断元素是否为选中状态r = driver.find_element_by_id("boy").is_selected()print r# 复选框单选driver.find_element_by_id("c1").click()# 复选框全选checkboxs = driver.find_elements_by_xpath(".//*[@type='checkbox']")for i in checkboxs:i.click()

8、select下拉框操作

　　8.1、二次定位

　　　　1.定位 select 里的选项有多种方式，这里先介绍一种简单的方法：二次定位

　　　　2.基本思路，先定位 select 框，再定位 select 里的选项

# 分两步：先定位下拉框，再点击选项s = driver.find_element_by_id('nr')s.find_element_by_xpath("//option[@value='50']").click()

　　　　还有另外一种写法也是可以的，把最下面两步合并成为一步：

driver.find_element_by_id("nr").find_element_by_xpath("//option[@value='50']").click()

　　8.2、直接定位

　　通过xpath或是css一次性直接定位到 option 上的内容

driver.find.element_by_xpath(".//*[@id='nr']/option[2]").click()

　　8.3、引入Select模块

# 导入 select 模块 Select类from selenium.webdriver.support.select import Select

　　select_by_index() :通过索引定位

通过 select 选项的索引来定位选择对应选项（从 0 开始计数），如选择

第三个选项:select_by_index(2)

s = driver.find_element_by_id('nr')Select(s).select_by_index(2)

　　select_by_value() :通过 value 值定位

通过选项的 value值来定位。每个选项，都有对应的 value 值

第二个选顷对应的 value 值就是"20"：select_by_value("20")

s = driver.find_element_by_id('nr')Select(s).select_by_value(20)

　　　　sl1 = Select(driver.find_element_by_id('cly_province'))        sl1.select_by_value('110000')        time.sleep(2)        #cly_city        sl1 = Select(driver.find_element_by_id('cly_city'))        sl1.select_by_value('110100')        time.sleep(2)        #cly_district        sl1 = Select(driver.find_element_by_id('cly_district'))        sl1.select_by_value('110105')

　　select_by_visible_text() :通过文本值定位

Select 模块里面还有一个更加高级的功能，可以直接通过选项的文本内容来

定位。

定位“每页显示 50 条” ： select_by_visible_text("每页显示 50 条")

s = driver.find_element_by_id('nr')Select(s).select_by_visible_text("每页显示50条")

　　deselect_all() ：取消所有选项

　　deselect_by_index() ：取消对应 index 选项

　　deselect_by_value() ：取消对应 value 选项

　　deselect_by_visible_text() ：取消对应文本选项

　　first_selected_option() ：返回第一个选项

　　all_selected_options() ：返回所有的选项

9、文件下载和上传

　　文件下载请参考

　　文件上传介绍两种方法，

　　请参考：

10、设置元素等待

　　如今大多数的 web 应用程序使用 AJAX 技术。当浏览器在加载页面时，页面内的元素可能并不是同时

被加载完成的，这给元素的定位添加的困难。如果因为在加载某个元素时延迟而造成

ElementNotVisibleException 的情况出现，那么就会降低的自动化脚本的稳定性。

WebDriver 提供了两种类型的等待：显式等待和隐式等待。

　　10.1、显示等待

显式等待使 WebdDriver 等待某个条件成立时继续执行，否则在达到最大时长时抛弃超时异常

（TimeoutException）。

#coding=utf-8from selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.support import expected_conditions as ECdriver = webdriver.Firefox()driver.get("http://www.baidu.com")element = WebDriverWait(driver,5,0.5).until(EC.presence_of_element_located((By.ID,"kw")))element.send_keys('selenium')driver.quit()

WebDriverWait()

它是由 webdirver 提供的等待方法。在设置时间内，默认每隔一段时间检测一次当前页面元素是否存

在，如果超过设置时间检测不到则抛出异常。具体格式如下：

WebDriverWait(driver, timeout, poll_frequency=0.5, ignored_exceptions=None)

driver - WebDriver 的驱动程序（Ie， Firefox，Chrome 等）

timeout - 最长超时时间，默认以秒为单位

poll_frequency - 休眠时间的间隔（步长）时间，默认为 0.5 秒

ignored_exceptions - 超时后的异常信息，默认情况下抛 NoSuchElementException 异常。

until()

WebDriverWait()一般由 until()（或 until_not()）方法配合使用，下面是 until()和 until_not()方法的说明。

until(method, message=’ ’)

调用该方法提供的驱动程序作为一个参数，直到返回值为 Ture。

until_not(method, message=’ ’)

调用该方法提供的驱动程序作为一个参数，直到返回值为 False。

Expected Conditions

在本例中，我们在使用 expected_conditions 类时对其时行了重命名，通过 as 关键字对其重命名为 EC，

并调用 presence_of_element_located()判断元素是否存在。

expected_conditions 类提供一些预期条件的实现。

title_is 用于判断标题是否 xx。

title_contains 用于判断标题是否包含 xx 信息。

presence_of_element_located 元素是否存在。

visibility_of_element_located 元素是否可见。

visibility_of 是否可见

presence_of_all_elements_located 判断一组元素的是否存在

text_to_be_present_in_element 判断元素是否有 xx 文本信息

text_to_be_present_in_element_value 判断元素值是否有 xx 文本信息

frame_to_be_available_and_switch_to_it 表单是否可用，并切换到该表单。

invisibility_of_element_located 判断元素是否隐藏

element_to_be_clickable 判断元素是否点击，它处于可见和启动状态

staleness_of 等到一个元素不再是依附于 DOM。

element_to_be_selected 被选中的元素。

element_located_to_be_selected 一个期望的元素位于被选中。

element_selection_state_to_be 一个期望检查如果给定的元素被选中。

element_located_selection_state_to_be 期望找到一个元素并检查是否选择状态

alert_is_present 预期一个警告信息

除了 expected_conditions 所提供的预期方法，我们也可以使用前面学过的 is_displayed()方法来判断元

素是否可见

#coding=utf-8from selenium import webdriverfrom selenium.webdriver.support.ui import WebDriverWaitdriver = webdriver.Firefox()driver.get("http://www.baidu.com")input_ = driver.find_element_by_id("kw")element = WebDriverWait(driver,5,0.5).until(lambda driver : input_.is_displayed())input_.send_keys('selenium')driver.quit()

lambad 为 Python 创建匿名函数的关键字。关于 Python 匿名函数的使用这里不再进行讲解，请参考

Python 相关教程。

定义 input_为百度输入框，通过 is_displayed()判断其是否可见。

　　10.2、隐式等待

隐式等待是通过一定的时长等待页面所元素加载完成。哪果超出了设置的时长元素还没有被加载测抛

NoSuchElementException 异常。WebDriver 提供了 implicitly_wait()方法来实现隐式等待，默认设置为 0。它

的用法相对来说要简单的多。

#coding=utf-8from selenium import webdriverdriver = webdriver.Firefox()driver.implicitly_wait(10)driver.get("http://www.baidu.com")input_ = driver.find_element_by_id("kw22")input_.send_keys('selenium')driver.quit()

implicitly_wait()默认参数的单位为秒，本例中设置等待时长为 10 秒，首先这 10 秒并非一个固定的等

待时间，它并不影响脚本的执行速度。其次，它并不真对页面上的某一元素进行等待，当脚本执行到某个

元素定位时，如果元素可定位那么继续执行，如果元素定位不到，那么它将以轮询的方式不断的判断元素

是否被定位到，假设在第 6 秒钟定位到元素则继续执行。直接超出设置时长（10 秒）还没定位到元素则抛

出异常。

　　10.3、设置sleep休眠

　　用 sleep()方法，需要说明的是 sleep()由 Python 的 time 模块提供。

　　当执行到 sleep()方法时会固定的休眠所设置的时长，然后再继续执行。sleep()方法默认参数以秒为单

位，如果设置时长小于 1 秒，可以用小数点表示，如：sleep(0.5)

from selenium import webdriverimport timedriver = webdriver.Chrome()# driver.implicitly_wait(1)first_url = "http://www.hao123.com/"driver.get(first_url)time.sleep(1)

11、操作Cookie

有时候我们需要验证浏览器中是否存在某个 cookie，因为基于真实的 cookie 的测试是无法通过白盒和

集成测试完成的。WebDriver 提供了操作 Cookie 的相关方法可以读取、添加和删除 cookie 信息。

　　webdriver 操作 cookie 的方法有：

　　get_cookies() 获得所有 cookie 信息

　　get_cookie(name) 返回有特定 name 值有 cookie 信息

　　add_cookie(cookie_dict) 添加 cookie，必须有 name 和 value 值

　　delete_cookie(name) 删除特定(部分)的 cookie 信息

　　delete_all_cookies() 删除所有 cookie 信息

下面通过 get_cookies()来获取当前浏览器的 cookie 信息

下面贴上代码

# FileName : handleCookie.py# Author   : Adil# DateTime : 2018/3/17 19:38# SoftWare : PyCharmfrom selenium import webdriverimport timeurl = 'https://www.yiyao.cc/'driver = webdriver.Chrome()driver.get(url)driver.maximize_window()# 获取指定cookie的值# cookie = driver.get_cookie()cookies = driver.get_cookies()print("登录前！")print("cookies:")print(cookies)driver.find_element_by_id("new-username").clear()driver.find_element_by_id("new-username").send_keys("username")driver.implicitly_wait(5)driver.find_element_by_id("new-password").clear()driver.find_element_by_id("new-password").send_keys("password")driver.find_element_by_id('home-right-login').click()driver.implicitly_wait(5)# 加一个休眠，这样得到的cookie 才是登录后的cookie,否则可能打印的还是登录前的cookietime.sleep(5)print("登录后！")cookiesAfter = driver.get_cookies()print("cookiesAfter:")print(cookiesAfter)print("cookie")print(driver.get_cookie("domain"))driver.add_cookie({
    'name':'yangyaojun','value':"yangpass"})# 再次查看 cookies，打印出的信息是包含上面添加的内容的print(driver.get_cookies())driver.quit()

delete_cookie() 和 delete_all_cookies()的使用也很简单，前者通过那么删除一个特定的cookie信息，后者直接删除浏览器中所有的cookies()信息。

未完待续......

转载于:https://www.cnblogs.com/BlueSkyyj/p/8550709.html

你可能感兴趣的文章