只会用Selenium爬网页？Appium爬App了解一下

发表于： 2020年4月28日 2020年4月28日
分类： python3, selenium

Appium是一个跨平台移动端自动化测试工具，可以非常便捷地为iOS和Android平台创建自动化测试用例。它可以模拟App内部的各种操作，如点击、滑动、文本输入等，只要我们手工操作的动作Appium都可以完成。在前面我们了解过Selenium，它是一个网页端的自动化测试工具。Appium实际上继承了Selenium，Appium也是利用WebDriver来实现App的自动化测试。对iOS设备来说，Appium使用UIAutomation来实现驱动。对于Android来说，它使用UiAutomator和Selendroid来实现驱动。

Appium相当于一个服务器，我们可以向Appium发送一些操作指令，Appium就会根据不同的指令对移动设备进行驱动，完成不同的动作。

对于爬虫来说，我们用Selenium来抓取JavaScript渲染的页面，可见即可爬。Appium同样也可以，用Appium来做App爬虫不失为一个好的选择。

下面我们来了解Appium的基本使用方法。

一、本节目标

我们以Android平台的微信为例来演示Appium启动和操作App的方法，主要目的是了解利用Appium进行自动化测试的流程以及相关API的用法。

二、准备工作

请确保PC已经安装好Appium、Android开发环境和Python版本的Appium API。另外，Android手机安装好微信App。

三、启动App

Appium启动App的方式有两种：一种是用Appium内置的驱动器来打开App，另一种是利用Python程序实现此操作。下面我们分别进行说明。

首先打开Appium，启动界面如下图所示。

直接点击Start Server按钮即可启动Appium的服务，相当于开启了一个Appium服务器。我们可以通过Appium内置的驱动或Python代码向Appium的服务器发送一系列操作指令，Appium就会根据不同的指令对移动设备进行驱动，完成不同的动作。启动后运行界面如下图所示。

Appium运行之后正在监听4723端口。我们可以向此端口对应的服务接口发送操作指令，此页面就会显示这个过程的操作日志。

将Android手机通过数据线和运行Appium的PC相连，同时打开USB调试功能，确保PC可以连接到手机。

可以输入adb命令来测试连接情况，如下所示：

adb devices -l
如果出现类似如下结果，这就说明PC已经正确连接手机。

List of devices attached
2da42ac0 device usb:336592896X product:leo model:MI_NOTE_Pro device:leo
model是设备的名称，就是后文需要用到的deviceName变量。我使用的是小米Note顶配版，所以此处名称为MI_NOTE_Pro。

如果提示找不到adb命令，请检查Android开发环境和环境变量是否配置成功。如果可以成功调用adb命令但不显示设备信息，请检查手机和PC的连接情况。

接下来用Appium内置的驱动器打开App，点击Appium中的Start New Session按钮，如下图所示。

这时会出现一个配置页面，如下图所示。

需要配置启动App时的Desired Capabilities参数，它们分别是platformName、deviceName、appPackage、appActivity。

platformName：它是平台名称，需要区分Android或iOS，此处填写Android。
deviceName：它是设备名称，此处是手机的具体类型。
appPackage：它是App程序包名。
appActivity：它是入口Activity名，这里通常需要以 . 开头。
在当前配置页面的左下角也有配置参数的相关说明，链接是https://github.com/appium/appium/blob/master/docs/en/writing-running-appium/caps.md。

我们在Appium中加入上面4个配置，如下图所示。

点击保存按钮，保存下来，我们以后可以继续使用这个配置。

点击右下角的Start Session按钮，即可启动Android手机上的微信App并进入到启动页面。同时PC上会弹出一个调试窗口，从这个窗口我们可以预览当前手机页面，并可以查看页面的源码，如下图所示。

点击左栏中屏幕的某个元素，如选中登录按钮，它就会高亮显示。这时中间栏就显示了当前选中的按钮对应的源代码，右栏则显示了该元素的基本信息，如元素的id、class、text等，以及可以执行的操作，如Tap、Send Keys、Clear，如下图所示。

点击中间栏最上方的第三个录制按钮，Appium会开始录制操作动作，这时我们在窗口中操作App的行为都会被记录下来，Recorder处可以自动生成对应语言的代码。例如，我们点击录制按钮，然后选中App中的登录按钮，点击Tap操作，即模拟了按钮点击功能，这时手机和窗口的App都会跳转到登录页面，同时中间栏会显示此动作对应的代码，如下图所示。

接下来选中左侧的手机号文本框，点击Send Keys，对话框就会弹出。输入手机号，点击Send Keys，即可完成文本的输入，如下图所示。

我们可以在此页面点击不同的动作按钮，即可实现对App的控制，同时Recorder部分也可以生成对应的Python代码。

下面我们看看使用Python代码驱动App的方法。首先需要在代码中指定一个Appium Server，而这个Server在刚才打开Appium的时候就已经开启了，是在4723端口上运行的，配置如下所示：

server = 'http://localhost:4723/wd/hub'
用字典来配置Desired Capabilities参数，代码如下所示：

desired_caps = {
'platformName': 'Android',
'deviceName': 'MI_NOTE_Pro',
'appPackage': 'com.tencent.mm',
'appActivity': '.ui.LauncherUI'
}
新建一个Session，这类似点击Appium内置驱动的Start Session按钮相同的功能，代码实现如下所示：

from appium import webdriver
from selenium.webdriver.support.ui import WebDriverWait

driver = webdriver.Remote(server, desired_caps)
配置完成后运行，就可以启动微信App了。但是现在仅仅是可以启动App，还没有做任何动作。

再用代码来模拟刚才演示的两个动作：一个是点击“登录”按钮，一个是输入手机号。

看看刚才Appium内置驱动器内的Recorder录制生成的Python代码，自动生成的代码非常累赘，例如点击“登录”按钮的代码如下所示：

el1 = driver.find_element_by_xpath("/hierarchy/android.widget.FrameLayout/android.widget.LinearLayout/android.widget.FrameLayout/android.view.View/android.widget.FrameLayout/android.widget.LinearLayout/android.widget.FrameLayout/android.widget.RelativeLayout/android.widget.RelativeLayout/android.widget.Button[1]")
el1.click()
这段代码的XPath选择器路径太长，选择方式没有那么科学，获取元素时也没有设置等待，很可能会有超时异常。所以我们修改一下，将其修改为通过ID查找元素，设置延时等待，两次操作的代码改写如下所示：

wait = WebDriverWait(driver, 30)
login = wait.until(EC.presence_of_element_located((By.ID, 'com.tencent.mm:id/cjk')))
login.click()
phone = wait.until(EC.presence_of_element_located((By.ID, 'com.tencent.mm:id/h2')))
phone.set_text('18888888888')
综上所述，完整的代码如下所示：

from appium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

server = 'http://localhost:4723/wd/hub'
desired_caps = {
'platformName': 'Android',
'deviceName': 'MI_NOTE_Pro',
'appPackage': 'com.tencent.mm',
'appActivity': '.ui.LauncherUI'
}
driver = webdriver.Remote(server, desired_caps)
wait = WebDriverWait(driver, 30)
login = wait.until(EC.presence_of_element_located((By.ID, 'com.tencent.mm:id/cjk')))
login.click()
phone = wait.until(EC.presence_of_element_located((By.ID, 'com.tencent.mm:id/h2')))
phone.set_text('18888888888')
一定要重新连接手机，再运行此代码，这时即可观察到手机上首先弹出了微信欢迎页面，然后模拟点击登录按钮、输入手机号，操作完成。这样我们就成功使用Python代码实现了App的操作。

四、API

接下来看看使用代码如何操作App、总结相关API的用法。这里使用的Python库为AppiumPythonClient，其GitHub地址为https://github.com/appium/python-client，此库继承自Selenium，使用方法与Selenium有很多共同之处。

1. 初始化

需要配置Desired Capabilities参数，完整的配置说明可以参考https://github.com/appium/appium/blob/master/docs/en/writing-running-appium/caps.md。一般来说，配置几个基本参数即可，如下所示：

from appium import webdriver

server = 'http://localhost:4723/wd/hub'
desired_caps = {
'platformName': 'Android',
'deviceName': 'MI_NOTE_Pro',
'appPackage': 'com.tencent.mm',
'appActivity': '.ui.LauncherUI'
}
driver = webdriver.Remote(server, desired_caps)
这里配置了启动微信App的Desired Capabilities，这样Appnium就会自动查找手机上的包名和入口类，然后将其启动。包名和入口类的名称可以在安装包中的AndroidManifest.xml文件获取。

如果要打开的App没有事先在手机上安装，我们可以直接指定App参数为安装包所在路径，这样程序启动时就会自动向手机安装并启动App，如下所示：

from appium import webdriver

server = 'http://localhost:4723/wd/hub'
desired_caps = {
'platformName': 'Android',
'deviceName': 'MI_NOTE_Pro',
'app': './weixin.apk'
}
driver = webdriver.Remote(server, desired_caps)
程序启动的时候就会寻找PC当前路径下的APK安装包，然后将其安装到手机中并启动。

2. 查找元素

我们可以使用Selenium中通用的查找方法来实现元素的查找，如下所示：

el = driver.find_element_by_id('com.tencent.mm:id/cjk')
在Selenium中，其他查找元素的方法同样适用，在此不再赘述。

在Android平台上，我们还可以使用UIAutomator来进行元素选择，如下所示：

el = self.driver.find_element_by_android_uiautomator('new UiSelector().description("Animation")')
els = self.driver.find_elements_by_android_uiautomator('new UiSelector().clickable(true)')
在iOS平台上，我们可以使用UIAutomation来进行元素选择，如下所示：

el = self.driver.find_element_by_ios_uiautomation('.elements()[0]')
els = self.driver.find_elements_by_ios_uiautomation('.elements()')
还可以使用iOS Predicates来进行元素选择，如下所示：

el = self.driver.find_element_by_ios_predicate('wdName == "Buttons"')
els = self.driver.find_elements_by_ios_predicate('wdValue == "SearchBar" AND isWDDivisible == 1')
也可以使用iOS Class Chain来进行选择，如下所示：

el = self.driver.find_element_by_ios_class_chain('XCUIElementTypeWindow/XCUIElementTypeButton[3]')
els = self.driver.find_elements_by_ios_class_chain('XCUIElementTypeWindow/XCUIElementTypeButton')
但是此种方法只适用于XCUITest驱动，具体可以参考：https://github.com/appium/appium-xcuitest-driver。

3. 点击

点击可以使用tap()方法，该方法可以模拟手指点击（最多五个手指），可设置按时长短（毫秒），代码如下所示：

tap(self, positions, duration=None)
其中后两个参数如下。

positions：它是点击的位置组成的列表。
duration：它是点击持续时间。
实例如下所示：

driver.tap([(100, 20), (100, 60), (100, 100)], 500)
这样就可以模拟点击屏幕的某几个点。

对于某个元素如按钮来说，我们可以直接调用cilck()方法实现模拟点击，实例如下所示：

button = find_element_by_id('com.tencent.mm:id/btn')
button.click()
4. 屏幕拖动

可以使用scroll()方法模拟屏幕滚动，用法如下所示：

scroll(self, origin_el, destination_el)
可以实现从元素origin_el滚动至元素destination_el。

它的后两个参数如下。

original_el：它是被操作的元素。
destination_el：它是目标元素。
实例如下所示：

driver.scroll(el1,el2)
可以使用swipe()模拟从A点滑动到B点，用法如下所示：

swipe(self, start_x, start_y, end_x, end_y, duration=None)
后面几个参数说明如下。

start_x：它是开始位置的横坐标。
start_y：它是开始位置的纵坐标。
end_x：它是终止位置的横坐标。
end_y：它是终止位置的纵坐标。
duration：它是持续时间，单位是毫秒。
实例如下所示：

driver.swipe(100, 100, 100, 400, 5000)
这样可以实现在5s时间内，由(100, 100)滑动到 (100, 400)。

可以使用flick()方法模拟从A点快速滑动到B点，用法如下所示：

flick(self, start_x, start_y, end_x, end_y)
几个参数说明如下。

start_x：它是开始位置的横坐标。
start_y：它是开始位置的纵坐标。
end_x：它是终止位置的横坐标。
end_y：它是终止位置的纵坐标。
实例如下所示：

driver.flick(100, 100, 100, 400)
5. 拖曳

可以使用drag_and_drop()将某个元素拖动到另一个目标元素上，用法如下所示：

drag_and_drop(self, origin_el, destination_el)
可以实现将元素origin_el拖曳至元素destination_el。

两个参数说明如下。

original_el：它是被拖曳的元素。
destination_el：它是目标元素。
实例如下所示：

driver.drag_and_drop(el1, el2)
6. 文本输入

可以使用set_text()方法实现文本输入，如下所示：

el = find_element_by_id('com.tencent.mm:id/cjk')
el.set_text('Hello')
7. 动作链

与Selenium中的ActionChains类似，Appium中的TouchAction可支持的方法有tap()、press()、long_press()、release()、move_to()、wait()、cancel()等，实例如下所示：

el = self.driver.find_element_by_accessibility_id('Animation')
action = TouchAction(self.driver)
action.tap(el).perform()
首先选中一个元素，然后利用TouchAction实现点击操作。

如果想要实现拖动操作，可以用如下方式：

els = self.driver.find_elements_by_class_name('listView')
a1 = TouchAction()
a1.press(els[0]).move_to(x=10, y=0).move_to(x=10, y=-75).move_to(x=10, y=-600).release()
a2 = TouchAction()
a2.press(els[1]).move_to(x=10, y=10).move_to(x=10, y=-300).move_to(x=10, y=-600).release()
利用以上API，我们就可以完成绝大部分操作。更多的API操作可以参考：https://testerhome.com/topics/3711。

五、结语

本节中，我们主要了解了Appium的操作App的基本用法，以及常用API的用法。

崔庆才

静觅博客博主，《Python3网络爬虫开发实战》作者

tingyuxinsheng@gmail.com

1294

tingyuxinsheng@gmail.com

发表评论 取消回复

发表评论取消回复