首页 | 站长资讯 | 网赚交流 | 站长知道 | 商业源码 | SEO | 故事 | 网站建设 | 免费资源 | 虚拟主机 | 采集器下载 | 百度XML | GloogleXML

查看完整版本: 你懂论坛数据采集吗?不会使用我来教你

admin 2007-11-15 21:24

你懂论坛数据采集吗?不会使用我来教你

xiugoo采集器软件基本设置教程
xiugoo采集器支持Discuz!、5d6d、6KBBS、PHPWind、LeadBBS、DVBBS、乔客、BBSXP、94kkbbs这几种类型的论坛,一套软件有一套软件的使用规则,下面就如何配置好xiugoo采集软件为大家做一个介绍!
xiugoo采集维护王、xiugoo采集移动王和xiugoo同步采集器的设置都是一样的,软件的设置保存在软件文件夹中的这几个文档:[color=seagreen]LUNTAN0.TXT、LUNTAN2.TXT、LUNTAN3.TXT、LUNTAN.TXT[/color]本文档中,大家配置好以后把这几个文本备份一下,以后下载新升级的软件的话把配置好的这几个文本覆盖新的文本就可以了。您只需配置好采集维护王后把以上文件覆盖到采集移动王里面的文件,就可以不用配置采集移动王了,同步采集器也一样!
首先到xiugoo采集的网站下载适合与您的论坛的软件(比如您的论坛是Discuz!的您就下Discuz!的软件,是DVBBS的就下载DVBBS的)。下载以后运行。Discuz!包里面含有两个软件,[color=red]标准版[/color]指的是常用的GBK编码的论坛;[color=red]UTF-8版[/color]指的是不常用的UTF8编码的论坛,大家不要搞错,否则发贴会出现乱码。[color=blue]默认[/color]桌面的是标准版!
======================================================================================================================
下面就采集维护王的配置为大家做个简单介绍:
一、论坛后台配置:
开始使用软件前,请各位登录论坛后台,为即将开始的神奇采集之旅做一点小小的配置:
请到后台取消所有的发帖限制如帖子内容最小字数显示、帖子内容最大限制、论坛防灌水机制等等,以DZ5.5为例,具体需设置:
1、后台--基本设置--服务器优化--“发帖灌水预防(秒)”修改为0--提交
2、后台--基本设置--用户权限--“帖子最小字数(字节)”“和帖子最大字数(字节)”分别设置为0和10000000000--提交
3、有主题分类的板块,建议取消发帖必须归类!也可不做修改,不过在用软件发帖的时候必须要设置发布到分类的序号,下面会做详细说明!
[color=red]其他类型[/color]论坛同理操作!!!
======================================================================================================================
二:软件使用配置:
运行采集维护王(特别说明:第一次登录软件,打开速度会略慢,请耐心等待)
1.对步骤一(网站设置)进行配置;
论坛名称:   填写您的论坛名称即可
论坛首页地址:      填写您的论坛的主页地址
论坛会员登陆地址:  填的是您的论坛会员登陆的地址
论坛类型:          指的是您论坛的版本,比如说Discuz!论坛,您的是5.5版的就选择对应5.5,5.0则选择5.0,如果您的论坛开启了伪静态功能,网址类似这样:[url=http://xiugoo.5d6d.com/thread-127527-1-1.html][color=#0000ff]http://xiugoo.5d6d.com/thread-127527-1-1.html[/color][/url]  以.html结尾的,请选择[color=red]网页[/color]类型论坛,否则选标准论坛类型!UTF-8编码的选择对应的UTF-8类型,千万别弄错哦!其他论坛程序也请选择对应版本即可!

2.对步骤二([color=red]版块及发贴网址设置[/color])进行配置:
这一步大家比较容易出错,因为很多朋友不仔细看导致[color=red]错误[/color],请大家[color=red]注意[/color]:
A、论坛版块要求上面和下面的顺序一一对应,而且名字相同。
B、网址上面要求填的是该版块的地址,就是您访问这个版块的时候IE地址栏显示的地址,而下面要求填的是该版块的发贴地址,就是您在该版块发表帖子的时候IE地址栏显示的地址,很多朋友把上面和下面的地址都填一样了,这是错误的。
C、每个版块一行,板块名称和对应地址中间至少留30-35个空格,否则容易出错,建议按软件默认空格填写!
可以把论坛所有板块全部写入进去,建议30个板块以内较好!
3.对步骤三(已注册会员设置)进行配置:要求设置在那里的会员帐号密码都是已经在您的论坛注册了的,而且每个会员帐号、密码要在同一行,填完一个会员帐号密码后要回车,帐号和密码之间的空格要10个空格左右。
4、对步骤一、二、三设置完以后,请点击“增加在线人数会员上线”,如果显示能成功登陆上线并进入您设置了的版块的话,那说明步骤一、二、三基本设置正确,没什么错误了。
5、检验正确后我们继续进行下一步骤,步骤四:文章的采集和发贴,
A、依次点击“批量采集各网站帖子文章”,“采集后文章管理”,“全选”,“选择删除”(把我们软件里面带有的旧的帖子先全部删除了,然后再采集新的帖子),“返回退出”
B、然后点“采集来源设置选取”,点一个您要采集的目标网站
C、找“主论坛对应板块选取”,选择采集该网站的文章后要发送到您的论坛的哪个版块,设置好后点添加保存修改。(此为关键,否则帖子无法准确发布到您指定的板块)
D、在设置好并需要采集目标网站前打勾
E、点击“退出返回”(注意:是退出返回,不是保存修改);
F、设置采集其他参数解释:
【[color=blue]只采集更新部分[/color]】:勾选的话,软件会记住这次已经采集过的帖子,在下次采集的时候,会有效过滤已经采集过的老贴,建议勾选!
【[color=blue]采集延时[/color]】:指采集第一贴后过几秒钟再采集下一贴,一般设置为0,部分网站采集速度过快而导致采集内容不完整或重复帖较多时,可以根据情况更改为3秒或5秒不等!
【[color=blue]某一贴最大回帖数[/color]】:主要指采集论坛带回复的帖子,一个主贴最多采集多少回复!软件默认是只采集第一页的回帖部分的!建议设置为10个回复以内,如不需采集回复,可设置为0;(特别说明下:软件发布一个主贴的时间和发布一个回帖的时间是一样的,如果回帖太多的话,会影响到主贴发帖速度!
【[color=blue]采集*贴转下一采集[/color]】:设置每一个采集规则需要一次采集多少帖子,采集维护王一般是在三页限制内,可以看目标站每页有多少帖子,如果一页有40帖,那么最多一次可以采集120贴!(移动王则可以一次采集目标论坛的所有帖子,设置为一次采集多少页即可!采集功能太过强大,建议慎用哦!o(∩_∩)o...)
【[color=blue]超链接[/color]】:建议默认勾选,因为目前软件内自带采集规则全部是按超链接模式编写的!什么是超链接就不用我多解释了吧!
【[color=blue]本地化文件[/color]】:本功能主要用来采集带附件的帖子,可以将附件本地化,然后通过FTP上传到论坛空间!支持图片、压缩、影音常用格式及BT、flash、exe、txt、doc等,需要本地化什么就类型就勾选什么类型(注意,必须开启超链接采集),点击采集开始,会提示您采集后的附件放到网站哪个目录,比如我的网站地址[url=http://www.xiugoo.com/][color=#800080]www.xiugoo.com[/color][/url],附件需要放到bbs目录下的bt123文件夹,那么填写的路径就是[url=http://www.xiugoo.com/bbs/bt123/][color=#0000ff]http://www.xiugoo.com/bbs/bt123/[/color][/url],注意bt123后必须带“/”;点“OK”后窗口提示:本地化文件是用本软件下载还是用工具下载,建议点“否”,用工具下载!采集结束后请到维护王或移动王的download文件夹内打“开本地化文件原地址列表.txt”注意看下是文档时间是否为本次下载的时间,然后用软件批量下载里面的文件,上传到原先设定的目录即可!
如果选择用本软件下载附件,附件下载后会直接放到file文件夹内,采集结束上传附件到指定空间位置即可!(此采集方式会比较占用资源,部分网站速度慢的,有可能对导致软件假死,移动王不建议用此方式!)

6、点击采集开始,采集完毕后可以点击“[color=magenta]采集后文章管理[/color]”,删除或修改部分垃圾帖子,如目标站的公告、板块等!修改删除完毕后,返回到软件起始界面,点击“[color=magenta]批量发帖[/color]”--“采集到硬盘的帖子文章管理”--“全选”--“退出返回”--设置发帖信息:
【[color=blue]发表分类[/color]】:指采集帖子需发布到指定板块的某个主题分类,填写该主题分类的序号即可,没有主题分类的默认为0!
【[color=blue]发后删帖[/color]】:帖子发布完成后自动从硬盘删除该帖子信息,建议勾选
【[color=blue]发帖默认成功[/color]】:建议勾选,可有效跳过无效帖(无效帖指:如标题或内容超过论坛默认设置长度的帖子以及内容为空的帖子)
【[color=blue]发帖时是否将原帖回帖部分当作回帖一起发送[/color]】:这个无需解释了吧!呵呵
【[color=blue]查看人数[/color]】:指发布帖子时在多少数值内随机增加帖子查看人数,建议不要设置过大,会影响到发帖速度
【[color=blue]帖子中间插入广告[/color]】:可以是文字或图片广告,无特别需要,无需填写!
【[color=blue]百度优化老贴变新帖批量发帖[/color]】:此功能的使用方法本教程暂不放出,会出专门教程,也看而已自行摸索测试!
7、做完以上步骤之后,最后神圣的一个按钮就是“开始批量发帖”了!这个我就不说了,是人应该都知道做什么用的了!  o(∩_∩)o...哈哈
最后一步:登录论坛看发帖效果,偷着乐! :-)  ^_^  o(∩_∩)o...
以上为整个软件采集发布的设置使用过程,还有几个不错的功能:
1、点击“[color=darkslateblue]全自动会员在线、点贴、回帖、发帖[/color]”,仔细看下出来的界面,上面的解释应该是非常清楚明白的,我就不多语了,各位可自行测试使用,以达到自己最想要的结果!
2、“[color=darkorchid]批量增加帖子人气数[/color]”和“[color=darkorchid]向各论坛网站发帖宣[/color]传(论坛集合)”这些都很简单,因为时间关系,不做详细说明了!可自行测试摸索使用!
软件带有500多个采集目标的,大家如果认为没有适合自己的可以自行添加,采集规则编写也非常的简单,我会另外开帖写下采集规则的教程的![color=red]现在新版有规则套用了,更方便大家了![/color]
                                                                                                           祝各位站长使用愉快!站长群29481975

爱客者 2007-11-20 14:23

用过了!:P

admin 2007-11-20 14:30

谢谢大家支持

admin 2007-12-9 18:41

文字教材:)

Gary2036 2008-9-28 13:10

偶啥时才能熬出头啊.现在金钱好少,好少,慢慢做吧。

龙逆天 2008-10-5 20:10

扯淡啊,感觉你在开玩笑啊

泡泡小新 2008-10-7 18:10

本来我决定不在社区回任何帖子了,但是看了你的帖子,我告诉自己这个帖子是一定要回的

qishudj 2008-10-14 09:10

呵呵 大家好奇嘛 来观看下~~~~

xing75 2008-10-21 20:10

一个个全都骑到老大头上来了... 我也来骑一下。

漂亮妞妞 2008-12-23 15:31

好贴就是好贴。。。

jcfdxj 2009-1-2 05:55

顶。。。。。。。。。。

qmdqqin 2009-1-8 16:16

qmdqqin

我也支持啊![xiugoo11] [xiugoo21] [xiugoo20] [xiugoo23] [xiugoo23] [xiugoo23]

qmdq001 2009-1-8 16:42

[xiugoo15] 学习了,支持
页: [1]
查看完整版本: 你懂论坛数据采集吗?不会使用我来教你