第一步、系统配置-全局模式设置
类型 | 支持模式 | 说明 |
网页蜘蛛爬行域名模式 | 黑名单 白名单模式 | 黑名单: 黑名单的内容不采集, 其他内容采集。 白名单: 只采集白名单的内容,其他的内容不采集。 和手机黑名单 的规则一样 |
网页蜘蛛爬行目录模式 | ||
网页蜘蛛爬行扩展名模式 | ||
网页蜘蛛采集模式 | 域名模式 不限制模式 仅路径模式 | 域名模式: 只是域名,不带任何路径 例如: http://www.123.com 仅路径模式: 收录入库的必须要带路径 例如: http://www.123.com/123/ 包含http://www.123.com/123/sss.html 不限制模式:就是上述2种一起收录 |
蜘蛛状态 | 停止 启动 | 启动: 启动蜘蛛自动运行,包含(URL爬行,采集,入库等) 停止: 停止蜘蛛,停止工作,包含(URL爬行,采集,入库等) |
蜘蛛模式 | 顺序模式 循环模式 | 顺序模式: 按照ID由小到大这样排序,到最后没数据,自动停止,等待有新数据后,接着ID继续跑。 循环模式: 按照ID由小到大这样排序,到最后没数据,重新由ID1开始爬行。 |
蜘蛛名称 | 浏览器的 USERAGENT | 默认: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36 实例一: Mozilla/5.0 (compatible;swspider/1.0;+https://www.alibw.com) 实例二: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3947.100 Safari/537.36 www.alibw.com |
上一篇:没有了!
下一篇:第二步、系统状态 - 系统状态