幼敏 發表於 2020-12-4 12:14:00

微软最强 Python 自动化工具开源了!不用写一行代码!

<p><img src="https://upload-images.jianshu.io/upload_images/1466987-ef86c2640ba4508d?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240"></p>
<h2 id="1-前言">1. 前言</h2>
<p>最近,微软开源了一款非常强大的 Python 自动化依赖库:playwright-python</p>
<p>它支持主流的浏览器,包含:Chrome、Firefox、Safari、Microsoft Edge 等,同时支持以无头模式、有头模式运行</p>
<p>playwright-python&nbsp;提供了同步、异步的 API,可以结合 Pytest&nbsp;测试框架使用,并且支持浏览器端的自动化脚本录制</p>
<p>项目地址:</p>
<p>https://github.com/microsoft/playwright-python</p>
<h2 id="2-准备">2. 准备</h2>
<p>在实战之前,我们只需要 2 步</p>
<p>第 1 步,安装 playwright-python 依赖库</p>
<pre><code>#&nbsp;安装依赖库
pip3&nbsp;install&nbsp;playwright
</code></pre>
<p>第 2 步,安装主流的浏览器驱动</p>
<p>这样,会将&nbsp;Chromeium、Firefox、Webkit 浏览器驱动下载到本地</p>
<pre><code>#&nbsp;安装浏览器驱动
python&nbsp;-m&nbsp;playwright&nbsp;install
</code></pre>
<h2 id="3-实战一下">3. 实战一下</h2>
<p>3-1&nbsp;录制脚本</p>
<p>我们先查看录制脚本的命令说明</p>
<p><img src="https://upload-images.jianshu.io/upload_images/1466987-13a58d132a6737bb?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240"></p>
<p>其中</p>
<ul>
<li>
<p>python -m playwright codegen&nbsp; 录制脚本</p>
</li>
<li>
<p>--help&nbsp; 帮助文档</p>
</li>
<li>
<p>-o&nbsp;&nbsp;生成自动化脚本的目录</p>
</li>
<li>
<p>--target 脚本语言,包含 JS 和 Python,分别对应值为:python 和 javascript</p>
</li>
<li>
<p>-b&nbsp; 指定浏览器驱动</p>
</li>
</ul>
<p>比如:</p>
<pre><code># 我们通过下面命令打开 Chrome 浏览器开始录制脚本
# 指定生成语言为:Python(默认Python,可选)
# 保存的文件名:1.py(可选)
# 浏览器驱动:webkit(默认webkit,可选)
# 最后跟着要打开的目标网站(默认仅仅是打开浏览器,可选)
python -m playwright codegen --target python -o '1.py' -b webkit https://www.baidu.com
</code></pre>
<p>接着,在浏览器模拟搜索一次的操作,然后关闭浏览器</p>
<p><img src="https://upload-images.jianshu.io/upload_images/1466987-92d1969d8a181b9f?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240"></p>
<p>最后,自动化脚本会自动生成,保存到文件中</p>
<pre><code>from playwright import sync_playwright

def run(playwright):
    browser = playwright.webkit.launch(headless=False)
    context = browser.newContext()

    # Open new page
    page = context.newPage()

    # Go to https://www.baidu.com/
    page.goto("https://www.baidu.com/")

    # Fill input
    page.fill("input", "AirPython")

    # Press Enter
    # with page.expect_navigation(url="https://www.baidu.com/s?ie=utf-8&amp;f=8&amp;rsv_bp=1&amp;rsv_idx=1&amp;tn=baidu&amp;wd=AirPython&amp;fenlei=256&amp;rsv_pq=a1739d870005eec3&amp;rsv_t=e640wwS33ra1Koivxvy1WyTxyknRwnllWiw4JBqIYd/KUN/WKpWLtL2b2+0&amp;rqlang=cn&amp;rsv_enter=1&amp;rsv_dl=tb&amp;rsv_sug3=21&amp;rsv_sug1=18&amp;rsv_sug7=100&amp;rsv_sug2=0&amp;rsv_btype=i&amp;inputT=6199&amp;rsv_sug4=6199"):
    with page.expect_navigation():
      page.press("input", "Enter")

    # Close page
    page.close()

    # ---------------------
    context.close()
    browser.close()

with sync_playwright() as playwright:
    run(playwright)
</code></pre>
<p>3-2&nbsp;同步</p>
<p>同步的关键字为:sync_playwright</p>
<p>比如,我们依次使用三个浏览器内核打开浏览器,然后百度一下,接着对在搜索界面截图,最后关闭浏览器</p>
<pre><code>from time import sleep

​from playwright import sync_playwright

# 注意:默认是无头模式

with sync_playwright() as p:
    # 分别对应三个浏览器驱动
    for browser_type in :

      # 指定为有头模式,方便查看
      browser = browser_type.launch(headless=False)
      page = browser.newPage()
      page.goto('http://baidu.com')

      # 执行一次搜索操作
      page.fill("input", "AirPython")
      with page.expect_navigation():
            page.press("input", "Enter")

      # 等待页面加载完全
      page.waitForSelector("text=百度热榜")

      # 截图
      page.screenshot(path=f'example-{browser_type.name}.png')

      # 休眠5s
      sleep(5)

      # 关闭浏览器
      browser.close()
</code></pre>
<p>需要指出的是,playwright-python 内置的 API&nbsp;基本上囊括常见的自动化操作</p>
<p>3-3&nbsp;异步</p>
<p>异步步的关键字为:async_playwright</p>
<p>结合&nbsp;asyncio,我们同时执行上面的操作</p>
<pre><code>import asyncio

from playwright import async_playwright

# 异步执行
async def main():
    async with async_playwright() as p:
      for browser_type in :
            # 指定为有头模式,方便查看
            browser = await browser_type.launch(headless=False)
            page = await browser.newPage()

            await page.goto('http://baidu.com')

            # 执行一次搜索操作
            await page.fill("input", "AirPython")
            await page.press("input", "Enter")

            # 等待页面加载完全
            await page.waitForSelector("text=百度热榜")

            # 截图
            await page.screenshot(path=f'example-{browser_type.name}.png')

            await browser.close()


asyncio.get_event_loop().run_until_complete(main())
</code></pre>
<h2 id="4-最后">4. 最后</h2>
<p>事实上,Playwright 是一个跨语言的自动化框架,支持 Python、Java、JS 等</p>
<p>Playwright 相比传统的自动化框架 Selenium 来说,在 Context 上下文及 API 使用上,显得更简洁且强大,更加详细的功能可以通过阅读原文去解锁</p>
<p>更多 Python 自动化、爬虫相关的原创技术干货,可以关注公众号 <strong>AirPython</strong> 来解锁!</p>
<p><strong>推荐阅读</strong><br>
带你用 Python 实现自动化群控(入门篇)</p>
<p>这些自动化场景,批处理完全可以取代 Python</p>
<p>我用几行 Python 自动化脚本完美解决掉了小姐姐的微信焦虑感</p>


</div>
<div id="MySignature" role="contentinfo">
    分享 Python 自动化及爬虫、数据分析实战干货,欢迎关注。<br><br>
来源:https://www.cnblogs.com/xingag/p/14085148.html
頁: [1]
查看完整版本: 微软最强 Python 自动化工具开源了!不用写一行代码!