易语言爬取网页内容方法

黄超波 發表於 2019-1-22 14:31:50

写个辅助工具的时候需要提取网页里面的某些内容，我这里便把方法告诉大家，希望对大家有所帮助，记得投票给我哦！
<img alt="" src="https://img.jbzj.com/file_images/article/201901/2019012214282255.jpg" />
1、在新建的windos窗口程序中画：
两个编辑框、一个按钮。
再添加模块如图中三步！
我们来实现，在一个编辑框中输入网址后，点击按钮，然后取到指定内容到编辑框2中。
<img alt="" src="https://img.jbzj.com/file_images/article/201901/2019012214282256.jpg" />
<img alt="" src="https://img.jbzj.com/file_images/article/201901/2019012214282257.png" />
2、比如我们来取百度某贴吧一个帖子内的内容！如下图中的“跑遍数码城，XXXXX”。
我们在该页面上右键---->查看网页源码（或查看源文件）。
<img alt="" src="https://img.jbzj.com/file_images/article/201901/2019012214282258.jpg" />
3、在打开的源文件内容中按CTRL+F组合键查找“跑遍数码城”，我们只要一个开文中一部分就行了！找到对应的文字后，我们找到和网页中完全对应的那部分代码。
PS：可能会出现几个被找到的内容，但是只要找到你需要取的那段全部对应部分就行。
<img alt="" src="https://img.jbzj.com/file_images/article/201901/2019012214282259.jpg" />
<img alt="" src="https://img.jbzj.com/file_images/article/201901/2019012214282260.jpg" />
4、复制正文中的前面的部分代码，不要复制太多的内容，待会我们用正文前的内容找到中间的内容。
然后在易语言中新建一个文本常量，把复制到的内容粘贴到“常量值”里面去。
<img alt="" src="https://img.jbzj.com/file_images/article/201901/2019012214282261.jpg" />
<img alt="" src="https://img.jbzj.com/file_images/article/201901/2019012214282262.png" />
<img alt="" src="https://img.jbzj.com/file_images/article/201901/2019012214282363.png" />
5、然后我们去复制正文后面的一小段代码，同样新建一个文本常量，然后粘贴到常量值里面去。
<img alt="" src="https://img.jbzj.com/file_images/article/201901/2019012214282364.png" />
<img alt="" src="https://img.jbzj.com/file_images/article/201901/2019012214282365.png" />
6、此时我们回到编程程序中，点击按钮，在生成的“_按钮1_被单击”子程序下面新建一个文本型变量“得到的内容”，然后输入以下代码：
得到的内容＝网页_访问s (编辑框1.内容)编辑框2.内容＝文本_取出中间文本 (得到的内容, #常量1, #常量2)
PS：第一行是把把编辑框中的网址打开后得到的网页源码赋值给“得到的内容”这个文本变量。
第二行则是对“得到的文本”进行取中间文本操作，文本_取出中间文本（）是一个程序！它能取出中间内容的程序！
<img alt="" src="https://img.jbzj.com/file_images/article/201901/2019012214282366.png" />
7、最后我们把程序调试运行一下，点击按钮“取内容”，是不是成功了呢？打开其他帖子取也是有效的，只要你取前后代码是正确的！
如果你是需要网页的源码，只要使用程序“ 网页_访问s()”,就然后把它赋值输出就OK了。当然!括号里面要有网页地址！
<img alt="" src="https://img.jbzj.com/file_images/article/201901/2019012214282367.jpg" />

 <div class="art_xg">
 您可能感兴趣的文章:<ul><li>易语言编写网页刷点击程序</li><li>易语言获取网页源码的方法</li><li>易语言网页填表操作</li><li>易语言进行网页操作方法</li><li>易语言表白网页生成器源码</li><li>易语言修改指定网页为浏览器主页的代码</li></ul>
 </div>

 </div>

頁: [1]

圆梦公社's Archiver

易语言爬取网页内容方法