神箭手是一款功能强大、使用简单的爬虫工具、网页追逐者,能快速自动抓取网页内容,为玩转大数据的用户提供智能化的数据收集服务,比起同类软件更高效。本站提供神箭手官方免费下载。
功能介绍
1、可以建立专属的爬虫系统。
2、可以配置网上的爬虫程序。
3、可以查看爬虫代码示例。
4、爬虫的数量是可以新建多个的。
5、支持API接口学习。
6、支持数据清洗,将管理的数据清除。
7、显示代码库,找到需要的代码内容。
8、提供分布式存储在云服务器。
9、支持自定义爬虫程序。
使用方法
1、登录神箭手客户端
打开安装好的神箭手客户端,输入神箭手账号和密码,登录进入控制台;
2、创建点选模式的爬虫
点击“新建应用”》选择“爬虫”,点击“下一步”》选择“自己开发”》选择“点选模式”,输入爬虫名称,点击“创建”;
3、点选要爬取的数据
打开创建的爬虫,进入打开点选面板;
在点选面板中,进行点选操作;
首先,输入一个包含所需数据的url(比如 https://www.leiphone.com/news/201712/WxtDEEQEXXDZLYev.html ),回车加载显示内容;
然后,在显示的网页内容中,点击选择要采集的数据,比如选择采集文章的标题和内容;
点击左侧的高级设置,可以设置爬虫的列表页、内容页url正则表达式、是否自动JS渲染等,提高爬虫效率;
4、启动爬虫
完成点选后,点击开始爬取,稍等一会,爬虫就会自动开始运行了。