乐在逍遥游 發表於 2014-9-11 11:26:50

帝国cms采集图文方法技巧

<p>帝国cms是我们用得比较多得PHP的建站系统,在建站过程中,如果自己没有信息源,只能靠手工不断的重复copy和粘贴,这样费时费力,于是我们就要使用帝国cms自带的采集功能来完成信息的录入。为了深入了解帝国cms采集功能,下面我们以&ldquo;新浪各地新闻&rdquo;栏目为例来进行实战采集。</p>
<p>一、增加采集节点</p>
<p>1、添加节点:<br /><img alt="1.jpg" width="132" height="66" src="https://img.jbzj.com/file_images/article/201409/2014091111345312.jpg" /><br />2、选择要增加采集的栏目:<br /><img alt="2.jpg" width="232" height="141" src="https://img.jbzj.com/file_images/article/201409/2014091111345313.jpg" /></p>
<p>3、进入增加节点表单:</p>
<p><img alt="3.jpg" width="613" height="344" src="https://img.jbzj.com/file_images/article/201409/2014091111345314.jpg" /></p>
<p><br />4、在节点名称框里起个名字,然后把要采集的新浪各地新闻列表地址copy过来:</p>
<p><img alt="4.jpg" width="469" height="164" src="https://img.jbzj.com/file_images/article/201409/2014091111345315.jpg" /></p>
<p><img alt="4-1.jpg" width="616" height="189" src="https://img.jbzj.com/file_images/article/201409/2014091111345316.jpg" /></p>
<p><br />5、下来发现好多选项,如&ldquo;采集页面地址方式二,内容页地址前缀...&rdquo;先不要理他,后面再一一详解,直接拉到 &ldquo;信息链接区域正则&rdquo;这里:</p>
<p><img alt="5.jpg" width="615" height="320" src="https://img.jbzj.com/file_images/article/201409/2014091111345317.jpg" /></p>
<p><br />6、这里是设置采集的列表信息链接区域正则,我们点击查看新浪各地新闻列表&ldquo;源文件&rdquo;:</p>
<p><img alt="6.jpg" width="436" height="478" src="https://img.jbzj.com/file_images/article/201409/2014091111345318.jpg" /></p>
<p>&nbsp;<br />7、把源文件代码copy到Dreamweaver里,在Dreamweaver里选定要采集的信息链接区域:</p>
<p><img alt="7.jpg" width="616" height="466" src="https://img.jbzj.com/file_images/article/201409/2014091111345319.jpg" /></p>
<p><br />8、切换到Dreamweaver代码方式,</p>
<ul>就是信息链接区域:
    <p>&nbsp;</p>
    <p><img alt="8.jpg" width="617" height="302" src="https://img.jbzj.com/file_images/article/201409/2014091111345320.jpg" /></p>
    <p>9、得到信息链接区域正则:</p>
    <p><img alt="9.jpg" width="612" height="135" src="https://img.jbzj.com/file_images/article/201409/2014091111345321.jpg" /></p>
    <p>10、得到信息页链接正则:&nbsp;</p>
    <p><img alt="10.jpg" width="612" height="134" src="https://img.jbzj.com/file_images/article/201409/2014091111345322.jpg" /></p>
    <p>&nbsp;</p>
    <p>11、注意:如果信息页链接是相对地址,例如,那么&ldquo;内容页地址前缀&rdquo;要加域名:</p>
    <p><img alt="11.jpg" width="475" height="42" src="https://img.jbzj.com/file_images/article/201409/2014091111345323.jpg" /></p>
    <p>12、现在要采集内容页的标题和内容:</p>
    <p><img alt="12.jpg" width="615" height="516" src="https://img.jbzj.com/file_images/article/201409/2014091111345324.jpg" /><br />&nbsp;</p>
    <p>13、查看新闻页&ldquo;源文件&rdquo;,找title标签:</p>
    <p><img alt="13.jpg" width="547" height="211" src="https://img.jbzj.com/file_images/article/201409/2014091111345325.jpg" /></p>
    <p><br />14、取得标题正则:</p>
    <p><img alt="14.jpg" width="572" height="167" src="https://img.jbzj.com/file_images/article/201409/2014091111345326.jpg" /></p>
    <p><br />15、这里是要采集的内容区域:</p>
    <p><img alt="15.jpg" width="614" height="178" src="https://img.jbzj.com/file_images/article/201409/2014091111345327.jpg" /></p>
    <p><br />16、取得新闻内容正则:</p>
    <p><img alt="16.jpg" width="490" height="203" src="https://img.jbzj.com/file_images/article/201409/2014091111345328.jpg" /><br />(注意:新闻内容正则里的 d_id='*' 用了通配符,因为每一篇新闻的d_id值是不同的,所以可以用*来代替它,&ldquo;*&rdquo;可以代替任意字符。)</p>
    <p>17、点击提交按钮就完成了整个采集节点:</p>
    <p><img alt="6-6.JPG" width="86" height="31" src="https://img.jbzj.com/file_images/article/201409/2014091111345329.jpg" /></p>
    <p>&nbsp;</p>
    <p>二、预览采集节点是否正确<br />1、提交按钮后返回管理节点:</p>
    <p><img alt="1.jpg" width="615" height="155" src="https://img.jbzj.com/file_images/article/201409/2014091111345330.jpg" /></p>
    <p><br />2、点击&ldquo;预览&rdquo;采集,进入节点预览结果:</p>
    <p><img alt="2.jpg" width="584" height="120" src="https://img.jbzj.com/file_images/article/201409/2014091111345331.jpg" /><br />3、采集内容页列表:<br /><img alt="3.jpg" width="614" height="242" src="https://img.jbzj.com/file_images/article/201409/2014091111345332.jpg" /></p>
    <p><br />4、采集内容页页面:</p>
    <p><img alt="4.jpg" width="615" height="356" src="https://img.jbzj.com/file_images/article/201409/2014091111345333.jpg" /></p>
    <p>&nbsp;</p>
    <p>三、采集<br />1、预览采集节点无误后,然后返回&ldquo;管理节点&rdquo;,点击&ldquo;开始采集&rdquo;链接就开始进行采集:<br /><img alt="1.jpg" width="614" height="155" src="https://img.jbzj.com/file_images/article/201409/2014091111345334.jpg" /></p>
    <p>2、系统正在采集中:</p>
    <p><img alt="2.jpg" width="516" height="99" src="https://img.jbzj.com/file_images/article/201409/2014091111345335.jpg" /></p>
    <p><br />3、采集完后显示本地临时入库的信息,这时可以对临时入库的信息进行修改或者删除:</p>
    <p><img alt="3.jpg" width="614" height="352" src="https://img.jbzj.com/file_images/article/201409/2014091111345336.jpg" /></p>
    <p><br />4、修改信息页面如图:</p>
    <p><img alt="4.jpg" width="556" height="451" src="https://img.jbzj.com/file_images/article/201409/2014091111345337.jpg" /></p>
    <p><br />5、对采集的信息进行审核并入库,点击&ldquo;入库全部信息按钮&rdquo;:</p>
    <p><img alt="5.jpg" width="615" height="353" src="https://img.jbzj.com/file_images/article/201409/2014091111345338.jpg" /></p>
    <p><br />6、确定操作:</p>
    <p><img alt="6.jpg" width="262" height="197" src="https://img.jbzj.com/file_images/article/201409/2014091111345339.jpg" /></p>
    <p><br />7、信息入库完毕提示:</p>
    <p><img alt="7.jpg" width="521" height="128" src="https://img.jbzj.com/file_images/article/201409/2014091111345340.jpg" /></p>
    <p>信息入库完毕后下来点击&rdquo;管理信息&ldquo;:</p>
    <p><img alt="8.jpg" width="373" height="102" src="https://img.jbzj.com/file_images/article/201409/2014091111345341.jpg" /></p>
    <p>我们可以看到刚刚采集入库的新闻信息:</p>
    <p><img alt="9.jpg" width="615" height="389" src="https://img.jbzj.com/file_images/article/201409/2014091111345342.jpg" /></p>
    <p>最后到&ldquo;数据更新&rdquo;刷新首页、栏目、和内容页就可以完成网站的信息采集了。</p>
    <p>由于帝国cms采集功能非常强大,一时半刻也说不完,下一讲将继续讲解其他功能的使用和技巧。</p>
</ul>
<p>以上就是整理互联网内容给大家带来的分析介绍,如果大家想了解更多相关内容,请持续关注本站,本站小编将在第一时间为大家带来更好的经典内容。更多精彩内容,尽在jb51.net琼殿技术社区!</p>
頁: [1]
查看完整版本: 帝国cms采集图文方法技巧