Python使用DrissionPage实现自动化处理的简单入门指南

寒江翁 發表於 2026-1-9 08:15:54

Python使用DrissionPage实现自动化处理的简单入门指南

<div id="navCategory"><h5 class="catalogue">目录</h5><ul class="first_class_ul"><li><a href="#_label0">一、DrissionPage是什么？</a></li><li><a href="#_label1">二、快速安装</a></li><li><a href="#_label2">三、5分钟上手基础操作</a></li><ul class="second_class_ul"><li><a href="#_lab2_2_0">1. 初始化浏览器会话</a></li><li><a href="#_lab2_2_1">2. 元素定位与操作</a></li><li><a href="#_lab2_2_2">3. 获取页面数据</a></li><li><a href="#_lab2_2_3">4. 完整示例：百度搜索</a></li></ul><li><a href="#_label3">四、进阶功能速览</a></li><ul class="second_class_ul"><li><a href="#_lab2_3_4">1. 智能等待机制</a></li><li><a href="#_lab2_3_5">2. 切换窗口/iframe</a></li><li><a href="#_lab2_3_6">3. 文件上传</a></li><li><a href="#_lab2_3_7">4. 执行JavaScript</a></li></ul><li><a href="#_label4">五、常见问题解决</a></li><ul class="second_class_ul"><li><a href="#_lab2_4_8">1. 元素找不到？</a></li><li><a href="#_lab2_4_9">2. 如何处理登录弹窗？</a></li><li><a href="#_lab2_4_10">3. 如何截图保存？</a></li><li><a href="#_lab2_4_11">4. 无头模式设置</a></li></ul><li><a href="#_label5">六、学习资源推荐</a></li><ul class="second_class_ul"></ul><li><a href="#_label6">七、总结</a></li><ul class="second_class_ul"></ul></ul></div><p>在Python自动化领域，Selenium和Requests是两个常用工具，但各有局限。<strong>DrissionPage</strong>巧妙结合了两者优势，既能用浏览器自动化处理动态页面，又能通过HTTP请求提升效率。本文将带你从零开始，用10分钟掌握DrissionPage的核心用法。</p>
<p class="maodian"><a name="_label0"></a></p><h2>一、DrissionPage是什么？</h2>
<p>DrissionPage是一个<strong>混合驱动的网页自动化库</strong>，核心特点：</p>
<ul><li><strong>双引擎驱动</strong>：支持Selenium（浏览器渲染）和Requests（HTTP请求）无缝切换</li><li><strong>简洁API</strong>：类似jQuery的选择器语法，操作更直观</li><li><strong>智能等待</strong>：自动处理元素加载延迟</li><li><strong>多浏览器支持</strong>：Chrome/Firefox/Edge等</li></ul>
<p>适合场景：</p>
<ul><li>网页数据采集</li><li>自动化测试</li><li>表单填写</li><li>文件上传/下载</li><li>任何需要模拟用户操作的场景</li></ul>
<p class="maodian"><a name="_label1"></a></p><h2>二、快速安装</h2>
<div class="jb51code"><pre class="brush:bash;">pip install DrissionPage
</pre></div>
<p>如果使用Selenium模式，需额外下载对应浏览器的WebDriver（如chromedriver）</p>
<p class="maodian"><a name="_label2"></a></p><h2>三、5分钟上手基础操作</h2>
<p class="maodian"><a name="_lab2_2_0"></a></p><h3>1. 初始化浏览器会话</h3>
<div class="jb51code"><pre class="brush:py;">from DrissionPage import ChromiumPage# 以Chrome为例

# 启动浏览器（无头模式可加headless=True）
page = ChromiumPage()

# 访问网页
page.get('https://www.baidu.com')
</pre></div>
<p class="maodian"><a name="_lab2_2_1"></a></p><h3>2. 元素定位与操作</h3>
<div class="jb51code"><pre class="brush:py;"># 通过ID定位搜索框并输入内容
search_box = page.ele('#kw')# CSS选择器语法
search_box.input('Python自动化')

# 通过文本定位按钮并点击
search_btn = page.ele('text:百度一下')
search_btn.click()
</pre></div>
<p class="maodian"><a name="_lab2_2_2"></a></p><h3>3. 获取页面数据</h3>
<div class="jb51code"><pre class="brush:py;"># 获取标题
print(page.title)

# 获取当前URL
print(page.url)

# 获取元素文本（如第一条搜索结果）
first_result = page.eles('div.result').text
print(first_result)
</pre></div>
<p class="maodian"><a name="_lab2_2_3"></a></p><h3>4. 完整示例：百度搜索</h3>
<div class="jb51code"><pre class="brush:py;">from DrissionPage import ChromiumPage

# 初始化
page = ChromiumPage()
page.get('https://www.baidu.com')

# 操作
page.ele('#kw').input('DrissionPage')
page.ele('text:百度一下').click()

# 获取结果
results = page.eles('div.result c-container')
for i, result in enumerate(results[:3], 1):
print(f"{i}. {result.text.split('\n')}")

# 关闭浏览器
page.close()
</pre></div>
<p class="maodian"><a name="_label3"></a></p><h2>四、进阶功能速览</h2>
<p class="maodian"><a name="_lab2_3_4"></a></p><h3>1. 智能等待机制</h3>
<div class="jb51code"><pre class="brush:py;"># 等待元素出现（最多10秒）
element = page.wait('@div.loading', timeout=10)# @表示CSS选择器

# 等待页面标题包含特定文本
page.wait('title:结果页面')
</pre></div>
<p class="maodian"><a name="_lab2_3_5"></a></p><h3>2. 切换窗口/iframe</h3>
<div class="jb51code"><pre class="brush:py;"># 切换到新标签页
page.switch_to.new_tab('https://example.com')

# 切换到iframe
page.switch_to.frame('iframe_id')# 或通过索引page.switch_to.frame(0)
</pre></div>
<p class="maodian"><a name="_lab2_3_6"></a></p><h3>3. 文件上传</h3>
<div class="jb51code"><pre class="brush:py;"># 直接操作隐藏的file input
upload_input = page.ele('input')
upload_input.send_keys(r'C:\test\file.jpg')
</pre></div>
<p class="maodian"><a name="_lab2_3_7"></a></p><h3>4. 执行JavaScript</h3>
<div class="jb51code"><pre class="brush:py;"># 获取页面JS变量
window_width = page.run_js('return window.innerWidth')
print(f"窗口宽度: {window_width}")

# 修改页面样式
page.run_js('document.body.style.backgroundColor = "lightblue"')
</pre></div>
<p class="maodian"><a name="_label4"></a></p><h2>五、常见问题解决</h2>
<p class="maodian"><a name="_lab2_4_8"></a></p><h3>1. 元素找不到？</h3>
<ul><li>检查选择器是否正确（推荐使用浏览器开发者工具复制CSS选择器）</li><li>添加显式等待：<code>page.wait('@selector', timeout=10)</code></li><li>确认元素是否在iframe中</li></ul>
<p class="maodian"><a name="_lab2_4_9"></a></p><h3>2. 如何处理登录弹窗？</h3>
<div class="jb51code"><pre class="brush:py;"># 示例：处理基本认证弹窗
page.set_auth('username', 'password')
page.get('https://example.com/protected')
</pre></div>
<p class="maodian"><a name="_lab2_4_10"></a></p><h3>3. 如何截图保存？</h3>
<div class="jb51code"><pre class="brush:py;">page.save('screenshot.png')# 保存当前页面截图
</pre></div>
<p class="maodian"><a name="_lab2_4_11"></a></p><h3>4. 无头模式设置</h3>
<div class="jb51code"><pre class="brush:py;"># 启动时添加参数
page = ChromiumPage(headless=True)# 无界面模式
</pre></div>
<p class="maodian"><a name="_label5"></a></p><h2>六、学习资源推荐</h2>
<ul><li><strong>官方文档</strong>：<a href="https://github.com/g1879/DrissionPage" rel="external nofollow"target="_blank">GitHub - DrissionPage</a>（含完整API参考）</li><li><strong>选择器练习</strong>：使用浏览器开发者工具的<code>Copy selector</code>功能快速获取元素定位方式</li><li><strong>实战项目</strong>：尝试自动化登录知乎/微博等网站（注意遵守robots协议）</li></ul>
<p class="maodian"><a name="_label6"></a></p><h2>七、总结</h2>
<p>DrissionPage通过<strong>统一API</strong>简化了网页自动化流程，无论是简单的数据抓取还是复杂的交互操作都能轻松应对。对于初学者，建议从以下步骤开始：</p>
<ul><li>掌握基础元素操作（点击/输入/获取文本）</li><li>学会使用等待机制处理动态内容</li><li>尝试组合多个操作完成完整流程</li></ul>
<p>掌握这些核心概念后，你可以快速扩展到文件上传、自动化测试等更复杂的场景。现在打开IDE，开始你的第一个DrissionPage自动化项目吧！</p>

頁: [1]

圆梦公社's Archiver

Python使用DrissionPage实现自动化处理的简单入门指南