《如何添加dedecms類型網(wǎng)站采集功能?》要點:
本文介紹了如何添加dedecms類型網(wǎng)站采集功能?,希望對您有用。如果有疑問,可以聯(lián)系我們。
相關(guān)主題:dedecms教程
如何添加dedecms類型網(wǎng)站采集功能?請閱讀下文.
1.登陸dedecms后臺→采集——采集節(jié)點管理——增加新節(jié)點
2.比如我們采集的普通文章,我們選擇普通文章,然后確定
3.進入了采集的設(shè)置頁面,填寫節(jié)點名稱,就是給這個新節(jié)點取個名字,你可以任意填寫,自己清楚就行.
4.打開想要采集的文章列表頁.利用快捷鍵ctrl+U或者鼠標右鍵——查看源文件找到目標頁面編碼,就在charset后面)
5.填寫列表網(wǎng)址獲取規(guī)則看看文章欄目列表第一頁的地址【比如http://www.123.com/xinwenzixun/list_2_2.html和http://www.123.com/xinwenzixun/list_2_3.html】
6.從這里可以發(fā)現(xiàn)list_2_后面的數(shù)字不一樣,其他的都一樣,所以我們可以這樣寫http://www.123.com/xinwenzixun/list_2_(*).html就是把1換成了(*)因為這里只有2頁,所以我們就填從1到2每頁遞增當然是1了,2-1...是等于1吧
7.填寫文章網(wǎng)址匹配規(guī)則了,回到文章頁、CTRL+U快捷鍵或者鼠標右鍵查看源文件找到文章列表頁區(qū)域開始的HTML,就是找開始的標志.如圖,在用ctrl+F快捷鍵,查看是否是整篇文章中唯一的開始標簽.同理,我們可以找到文章結(jié)束的標簽.
a.文章列表頁內(nèi)容開始標簽
a.文章列表頁內(nèi)容結(jié)束標簽
8.根據(jù)上面找出的開始標簽以及結(jié)束標簽,寫著下面對應(yīng)的方框中,然后點擊保留并且測試按鈕,你會發(fā)現(xiàn)單純這樣文章內(nèi)容是不能采集的,所以我們還需要接著往下瀏覽.
9.點擊最上面的【內(nèi)容配置】根據(jù)你需要的填寫對應(yīng)的內(nèi)容
10.比如采集相關(guān)文章的標題,我們可以利用鍵盤快捷鍵CTRL+U或者鼠標右鍵查看源代碼,找到文章的標題,在利用ctrl+F快捷鍵查看是否是唯一的一個代碼標簽,如果是,就添加在對應(yīng)的方框里面,如果不是,在查找附近的,直到唯一的標簽為止.
11.同理,添加內(nèi)容的開始標簽以及結(jié)束標簽.值得提示的是,我們在采集別人網(wǎng)站文章的時候,有時候是需要過濾掉別人的信息的,這個時候 可以點擊【過濾規(guī)則】最右邊的常用規(guī)則.
12.具體的圖片在下面,根據(jù)具體的情況來選擇,點擊確定就可以了,當然我們在最后的時候還需要點擊【保留并且測試】,這樣才可以保留采集規(guī)則.
歡迎參與《如何添加dedecms類型網(wǎng)站采集功能?》討論,分享您的想法,維易PHP學院為您提供專業(yè)教程。
轉(zhuǎn)載請注明本頁網(wǎng)址:
http://www.snjht.com/jiaocheng/11642.html