一個大型的資訊網(wǎng)站在發(fā)表文章時,如果是一條條的文章網(wǎng)上發(fā),這不僅浪費時間,效率還不高,這時為了提高更新網(wǎng)站的效率,就出現(xiàn)了火車頭采集器,可是火車頭采集規(guī)則怎么寫呢?接下來就由小編來詳細(xì)的介紹吧。
火車頭采集規(guī)則寫法介紹
步驟一:新建一個文章采集節(jié)點
登錄后臺,依次點擊 采集>>采集節(jié)點管理>>增加新節(jié)點>>選擇普通文章>>確定
步驟二 :填寫采集列表規(guī)則
1.節(jié)點名稱:隨便(注意你要能分清哦,因為節(jié)點多了的話,有可能會搞得自己混亂)
2.目標(biāo)頁面編碼:看目標(biāo)頁面的編碼
3.匹配網(wǎng)址:去到采集目標(biāo)列表頁面,查看它的列表規(guī)則!比如說很多網(wǎng)站的列表的第一面跟其它內(nèi)頁是有很大的差別的,所以我一般不采集目標(biāo)列表的第一頁!
最好是從第二頁開始(雖然可以找出第一頁,但很多的網(wǎng)站是根本沒第一頁的,所以,這里就不說怎么找第一頁了)
4.區(qū)域結(jié)束的HTML:在采集目標(biāo)列表頁打開源代碼!在要采集的文章標(biāo)題后面的附近找一段在本頁是唯一并且其它要采集的的頁面也是唯一的html標(biāo)簽!
寫好了,點擊保存信息并進(jìn)入下一步!如果寫正確了規(guī)則的話,那這些就會出現(xiàn)一個有內(nèi)容的網(wǎng)址獲取規(guī)則測試
再按下一步!進(jìn)入填寫采集內(nèi)容規(guī)則
步驟三:采集內(nèi)容規(guī)則
1.文章標(biāo)題:在文章標(biāo)題前后找兩個標(biāo)簽,能識別出標(biāo)題的!
2.文章內(nèi)容:在文章內(nèi)容前后找兩個標(biāo)簽,能識別出內(nèi)容的!我采集的網(wǎng)站的文章內(nèi)容前后唯一標(biāo)簽是<div class=”content”>…<ul class=”page clearfix”>,所以就寫成<div class=”content”>[內(nèi)容]<ul class=”page clearfix”>!
其它的功能,也不用管!這里只分享怎么能采到文章!然后,點擊保存配置并預(yù)覽,如果前面的列表規(guī)則跟內(nèi)容規(guī)則都寫對了的話,那現(xiàn)在就會預(yù)覽到內(nèi)容了!
點擊僅保存,如果你要馬上采集的話,也可以點擊隔壁的保存并馬上采集!

火車頭采集規(guī)則導(dǎo)入方法
1.導(dǎo)入規(guī)則方法一
右鍵點擊剛才新建的分組,選擇“導(dǎo)入任務(wù)至該分組”(記住:不是“導(dǎo)入分組規(guī)則”),在彈出的對話框中選擇已經(jīng)采集規(guī)則文件(后綴為.ljobx)。
2.導(dǎo)入規(guī)則方法二
也可以選擇剛才新建的分組,然后依次點擊菜單“分組”->“導(dǎo)入任務(wù)至該分組” 在彈出的對話框中選擇已經(jīng)采集規(guī)則文件(后綴為.ljobx)。
3.導(dǎo)入分組規(guī)則
如果你手上的規(guī)則文件后綴名為“.lgrp”,那么你需要通過菜單或右鍵快捷菜單選擇“導(dǎo)入分組規(guī)則”,而不是“導(dǎo)入任務(wù)至該分組”。
好了,有關(guān)火車頭采集規(guī)則寫法就介紹到這里了,當(dāng)然想要掌握這個寫法的可不是馬上就能完成的事情,是需要在不斷的實踐中去掌握和運用的,所以想要掌握格則寫法的,現(xiàn)在就開始練習(xí)吧。如果想了解更多的內(nèi)容,歡迎關(guān)注我們文軍營銷的官網(wǎng)。
推薦閱讀
火車頭采集圖片方法 火車頭采集圖片步驟是什么 | 文軍營銷言歸正傳,火車頭使用的步驟是:新建站點—新建任務(wù)—填寫你要采集的網(wǎng)站文章列表—點下面的開始測試網(wǎng)址—如果有采集到很多文章,看各個地址相同部分(如system/2012/03/07),點返回修改,把system/2012/03/07這部分加到“文章內(nèi)容必須包含”那里,再測試一下,就可以采集到3月7日的文章地址了—前面準(zhǔn)備好網(wǎng)址后接下來火車頭采集器教程步驟 火車頭采集器使用教程介紹 | 文軍營銷1點擊右下角的“網(wǎng)址采集測試”, 2測試后,如果網(wǎng)址是這么顯示出來的,那就是采集成功了。點擊其中一個網(wǎng)址左邊的“+”符號,可以看到該欄目頁面采集到的內(nèi)容。 火車頭采集器教程之?dāng)?shù)據(jù)采集步驟 火車采集器采集數(shù)據(jù)是分成兩個步驟的,一是采集數(shù)據(jù),二是發(fā)布數(shù)據(jù)。這兩個過程是可以分開的。 1、采集數(shù)據(jù),這個包括采集...火車頭采集器教程步驟 火車頭采集器使用教程介紹 | 文軍營銷1點擊右下角的“網(wǎng)址采集測試”, 2測試后,如果網(wǎng)址是這么顯示出來的,那就是采集成功了。點擊其中一個網(wǎng)址左邊的“+”符號,可以看到該欄目頁面采集到的內(nèi)容。 火車頭采集器教程之?dāng)?shù)據(jù)采集步驟 火車采集器采集數(shù)據(jù)是分成兩個步驟的,一是采集數(shù)據(jù),二是發(fā)布數(shù)據(jù)。這兩個過程是可以分開的。 1、采集數(shù)據(jù),這個包括采集...