简述
Selenium是个针对浏览器的可编程的自动化工具,通过一致的编程接口用于控制浏览器打开URL、点击页面上链接等。尤其适合做机械的、重复的、固定的操作。有Java, Python, C#, Ruby等多种编程接口。
在实际使用中,推荐把Selenium安装在单独的机器(如虚拟机)上,而在其它的机器上通过编程接口操纵它们。没错,这里用的是“它们”,即你可以有很多Selenium机,而只在(另外的)一台机器上跑控制主机(叫“Selenium Client”)。这样你可以使用同样的客户端代码,操纵多个不同系统下的Server.
安装
[JDK] 因为Selenium依赖Java环境,需要事先安装JDK,并确认已设置好环境变量PATH.
[服务端] 下载安装Selenium服务器端,官方下载页的 Selenium Standalone Server,在服务器端适合的目录里,比如保存为 C:\tools\selenium\selenium-server-standalone-3.xxx.yy.jar ,设置一个启动脚本 run_selenium_server.bat (推荐放到windows启动项中),内容为如下一行
java -jar C:\tools\selenium\selenium-server-standalone-3.xxx.yy.jar
[浏览器] 各种现代浏览器都是支持的,推荐使用Firefox ESR版。安装好浏览器,把浏览器的安装目录放到PATH环境变量中。典型PATH变量示例:
C:\Program Files\Common Files\Oracle\Java\javapath;C:\ProgramData\Oracle\Java\javapath;%SystemRoot%\system32;%SystemRoot%;%SystemRoot%\System32\Wbem;%SYSTEMROOT%\System32\WindowsPowerShell\v1.0\;C:\Program Files\Mozilla Firefox
[Driver] 在官方下载页的 Third Party Drivers, Bindings, and Plugins ,找您浏览器的驱动,下载,然后解压缩到浏览器的安装目录中。
使用
参考官方下载页的 Selenium Client & WebDriver Language Bindings ,有多种编程语言。
Python版编程接口 https://seleniumhq.github.io/selenium/docs/api/py/index.html
某些问题
如果浏览器的更新到版本,旧的Driver可能不再适配(比如客户端不能正常启动服务端的浏览器),就要下载新版本Driver并覆盖掉旧版。