胡笳 發表於 2020-9-7 14:08:00

用易语言写个简单的小爬虫其中的关键点

<h2 id="一请求头">一.请求头</h2>
<p>ctrl+L快捷键创建变量</p>
<table>
<thead>
<tr>
<th>变量名</th>
<th>类型</th>
</tr>
</thead>
<tbody>
<tr>
<td>协议参数</td>
<td>类_POST数据类</td>
</tr>
<tr>
<td>请求头数据</td>
<td>文本型</td>
</tr>
</tbody>
</table>
<p>协议参数.添加 (“v”, “4.52.0”)</p>
<p>请求头数据 = 协议参数.获取协议头数据 ()</p>
<h2 id="二请求参数比如post">二.请求参数比如post</h2>
<table>
<thead>
<tr>
<th>变量名</th>
<th>类型</th>
</tr>
</thead>
<tbody>
<tr>
<td>请求data参数</td>
<td>类_POST数据类</td>
</tr>
<tr>
<td>请求data提交内容</td>
<td>文本型</td>
</tr>
</tbody>
</table>
<p>请求data参数.添加 (“type”, “0”)</p>
<p>请求data提交内容 = 请求data参数.获取JSON文本 ()</p>
<h2 id="三进行请求">三.进行请求</h2>
<p>调用<code>网页_访问S</code>方法</p>
<pre><code class="language-python">.子程序 网页_访问S, 文本型, , 源码由[洫蜘蛛]提供,使用WinHttp的 API方式访问网页,如果返回是“?”请查询返回协议头是否有“Content-Encoding: gzip“表示gzip压缩过网页,可用 网页_GZIP解压()命令解压,如果返回是乱码,则返回原始文本,请自行转换编码,失败返回空文本,请取出状态文本。
.参数 网址, 文本型, , 完整的网页地址,必须包含http://或者https://
.参数 访问方式, 整数型, 可空 , 0=GET 1=POST 2=HEAD3=PUT4=OPTIONS5=DELETE6=TRACE7=CONNECT
.参数 提交信息, 文本型, 可空 , POST专用
.参数 提交Cookies, 文本型, 参考 可空 , 设置提交时的cookie
.参数 返回Cookies, 文本型, 参考 可空 , 返回的Cookie
.参数 附加协议头, 文本型, 可空 , 一行一个请用换行符隔开,建议填写常量值或文本值,防止因传参引发错误
.参数 返回协议头, 文本型, 参考 可空 , 返回的协议头
.参数 禁止重定向, 逻辑型, 可空 , 默认不禁止网页重定向
.参数 网站登录用户名, 文本型, 可空 , 自动登录网页用户名 如路由器
.参数 网站登录密码, 文本型, 可空 ,
.参数 代理地址, 文本型, 可空 , 代理地址,格式为 8.8.8.8:88
.参数 代理帐号, 文本型, 可空 ,
.参数 代理密码, 文本型, 可空 ,
.参数 超时时间, 整数型, 可空 , 可以被省略,单位:秒,默认30秒,如果提供大于0的数值,则修改操作超时时间。
.参数 返回重定向, 文本型, 参考 可空 , 可以被省略,提供参数时只能提供文本型变量,用于当发生重定向时取回页面重定向的地址。
.参数 返回状态文本, 文本型, 参考 可空 ,
.参数 返回原始数据, 字节集, 参考 可空 , 可以被省略,返回原始网页编码
.参数 是否自动合并更新Cookie, 逻辑型, 可空 , 默认为真,自动合并更新
.参数 是否补全必要协议头, 逻辑型, 可空 , 当附件协议头为空时自动添加必要的UA协议头 默认为真,假将不再添加非传入协议头
.参数 字节集提交, 字节集, 可空 , 提交字节集数据
.参数 是否处理协议头大小写, 逻辑型, 可空 , 将协议头中的键名首字母处理为大写默认为真
</code></pre>
<h2 id="四返回内容改成utf8编码">四.返回内容改成utf8编码</h2>
<p>编码_utf8到gb2312(返回值)</p>
<h2 id="五展示效果图涉及一些加密打码请谅解">五.展示效果图(涉及一些加密打码请谅解)</h2>
<p><img src="https://img2020.cnblogs.com/blog/1672402/202009/1672402-20200907140709178-1702596590.png" alt="" loading="lazy"><br>
<img src="https://img2020.cnblogs.com/blog/1672402/202009/1672402-20200907140720412-802569920.png" alt="" loading="lazy"></p><br><br>
来源:https://www.cnblogs.com/pythonywy/p/13626559.html
頁: [1]
查看完整版本: 用易语言写个简单的小爬虫其中的关键点