欢迎访问分类目录网
快审联系QQ:158925126当前位置:分类目录网 » 站长资讯 » 技术教程 » 文章详细 订阅RssFeed

易大师采集器使用技巧【图文教程】

来源:本站原创 浏览:1311次 时间:2017-08-10

1、停止采集器

检查采集器

ps axu | grep java

输入 kill 5756    注释:5756是采集器运行ID  每一次都会不同!


2、更换采集规则

采集器规则下载地址:http://www.yispider.com

用winscp软件上传新的采集规则--规则的目录是rules

然后编辑采集器目录中的collect.ini

将   rule_name=23zw.xml    注释:填写新的规则名称

3、启动采集器

先输入cd进入根目录,再 cd /usr/local/yispider   到采集器目录

再输入启动采集器的命令  java -jar spider.jar -ca &

1. 不带参数启动, 默认为采集规则中指定的所有小说, 即同-ca参数
2. 正常采集规则中指定的所有小说使用参数 -ca启动
3. 如果只采集部分小说, 可使用-c 111,222,333 或者-c 111-222启动采集器, 前者意思为采集目标站章节号为111,222,333的小说, 后者意思为采集目标站章节号从111到222之间的所有小说
4. 如果采集中出现了一些空章节, 或者小说封面、简介、进度、分类错误, 可以使用修复采集 -ra启动, 可指定修复内容
5. 如果只修复部分小说, 可使用-r 111,222,333 或者-c 111-222启动采集器, 参数含义类似-c, 只是-c为采集指定小说, -r为修复指定小说
6. 使用-r或-ra进行修复采集时可同时制定需要修复的选项, -cover,-intro,-top,-sub,-keywords,-degree,-etxt,-txt,以上参数分别对应封面图片, 小说简介, 小说大类,小说细类, 关键词, 写作进度, 空章节(只修复空章节), txt文本(无论本地是否存在对应的章节内容, 只要指定txt则重新采集)
7. 如果启动需要单独指定采集时使用的规则, 可使用-rule xxxx.xml参数(必须同时制定-ca -c -ra -r四个命令之一), 其中xxxx.xml为rules文件夹下的规则名, 注意这里的参数需要使用文件全名, 即带了后缀的, 如果不知道怎么看文件后缀, 请使用谷歌或者度娘

注意:退出采集器,一定要输入 exit 回车,不然容易造成采集器骤停!


4、建立默认封面

进入根目录,建一个cover文件夹

在这个文件夹里面放一张封面大小的jpg图片,同时将该图片命令为nocover.jpg

5、首页推荐

在区块里面可以修改各类小说的展示形式,可以自定义,也可以选择标准小说,然后按排行、推荐等方式展示,具体的视频已经做了演示。

6、语言包的更改

语言包如有变动,需要重启TOMCAT

重启的命令就是 service tomcat restart


公司企业大全

推荐站点