IMGspider – 图片采集抓取插件

Description

IMGspider(图片蜘蛛)是一款用于WordPress文章图片抓取的WordPress插件,支持JPG, JPEG, PNG, GIF, BMP, TIF等常见图片爬取下载,实现一键抓取文章内容所有引用图片到本地服务器。

该插件能够帮助WordPress站长在转载其他网站的文章时,快速将转载的文章内容中的站外图片抓取到本地服务器,而无需手动下载逐一上传,大大提升了站长的工作效率,并且IMGspider图片采集插件支持自动和手动采集两种模式,且支持代理服务器采集。

全新的版本更是加入了采集图片选项、过滤规则及全局扫描等设置选项,进一步丰富图片采集功能。

1.基础设置。

  • 支持自动或者手动采集模式:自动采集模式,即保存或者发布文章时,采集插件会执行自动采集外链图片任务;手动采集模式,即需要在编辑文章时,手动执行外链图片采集任务。

  • 支持设置采集第一张图片为特色图片,该功能目的在于方便使用需要设置特色图片的网站主题的站长,站长可以根据实际需求选择启用或者关闭该功能选项。

  • 代理服务器,IMGspider默认提供了一个图片采集代理服务器,站长也可以自行增加配置代理服务器,并可以设置一个默认的采集图片代理服务器。

2.图片选项。

IMGspider图片蜘蛛插件支持自定义一些采集图片参数选项,包括:

  • 尺寸规则-支持定义采集图片的最终宽度,可选择原尺寸采集又或者定义一个最大宽度;
  • 文件名规则-支持选择系统命名、保留原文件名及自定义命名规则;
  • 标题及替代文本-允许站长替换采集图片的原title和ALT值;
  • 对齐方式-站长可以根据主题风格来定义采集回来的图片的对齐方式。

3.过滤规则。

插件提供多种过滤规则,以便过滤一些特定的外链图片,包括:

  • 支持过滤特定顺序的图片;
  • 支持过滤特定尺寸图像,尤其是一些小图像;
  • 支持过滤特定格式图像;
  • 支持过滤特定域名图像,防止采集插件将CDN或者图库图片也采集到本地;
  • 支持图片采集去重规则,即相同外链图片地址仅采集一次,并自动替换为同一本地图片URL地址。

4.全局扫描。

该功能的主要目的是方便部分站长对已发布文章的外链图片进行全局检测,实现一键采集已发布文章、页面及媒体的外链图片。

Notes

IMGspider插件是一款简单易用的WordPress文章图片抓取下载插件,实现对转载文章图片一键抓取下载到本地服务器.

闪电博(wbolt.com)专注于WordPress主题和插件开发,为中文博客提供更多优质和符合国内需求的主题和插件。此外我们也会分享WordPress相关技巧和教程。

除了百度搜索推送管理插件外,目前我们还开发了以下WordPress插件:

如果你在WordPress主题和插件上有更多的需求,也希望您可以向我们提出意见建议,我们将会记录下来并根据实际情况,推出更多符合大家需求的主题和插件。

致谢!

闪电博团队

Screenshots

  • 插件基本设置界面截图.
  • 插件采集图片选项设置界面截图.
  • 采集图片过滤规则设置界面截图.
  • 已发布文章外链图片全局扫描界面截图.
  • 文章编辑器采集图片窗口截图.
  • 文章编辑器图片抓取成功界面截图.

Installation

方式1:在线安装(推荐)

  1. 进入WordPress仪表盘,点击“插件-安装插件”:
  2. 关键词搜索“IMGspider”,找搜索结果中找到“IMGspider”插件,点击“现在安装”;
  3. 安装完毕后,启用”IMGspider”插件.
  4. 通过“设置”->“IMGspider” 进入插件设置界面进行插件参数设置.

方式2:上传安装

FTP上传安装
1. 解压插件压缩包imgspider.zip,将解压获得文件夹上传至wordpress安装目录下的 /wp-content/plugins/目录.
2. 访问WordPress仪表盘,进入“插件”-“已安装插件”,在插件列表中找到“IMGspider”,点击“启用”.
3. 通过“设置”->“IMGspider” 进入插件设置界面.

仪表盘上传安装
1. 进入WordPress仪表盘,点击“插件-安装插件”;
2. 点击界面左上方的“上传按钮”,选择本地提前下载好的插件压缩包imgspider.zip,点击“现在安装”;
3. 安装完毕后,启用”IMGspider”插件;
4. 通过“设置”->”IMGspider”进入插件设置界面.

关于本插件,你可以通过阅读IMGspider插件教程学习了解插件安装、设置等详细内容。

FAQ

采用自动采集模式,发布文章后依然使用的是外链图片?

当使用自动采集模式时,文章在保存发布时如果采集图片失败,会使用原图片地址。基于这种情况,我们有以下建议:(1)改为手动采集模式,确保每张图片采集成功;(2)使用自动采集模式,应该定时采用全局扫描来排查已发布文章是否存在外链图片,如果有,则批量采集;(3)自动采集模式下,根据采集图片服务器地理位置,来判断是否设置默认代理服务器。

采集模式为自动模式,使用的是代理服务器还是本地服务器?

如果未设置默认代理服务器,则用本地服务器;如果设置了默认代理服务器,则使用默认代理采集。

全局扫描的批量采集使用的采集服务器是哪个?

全局扫描批量采集的服务器选择跟随自动采集模式,参考上一个FAQ。

为什么使用闪电博代理采集图片失败了?

闪电博代理作为共享的代理服务器,如果当前使用的用户较多,可能会导致采集图片延时而失败;闪电博代理服务器也不适宜采集国内服务器图片。因此,当采集图片失败时,建议切换采集模式进行重复尝试。

为什么要配置自定义代理服务器?

如果站点需要抓取大量的海外网站图片时,且默认代理无法满足需求,建议使用自主搭建的代理服务器,图片加速效果会更佳。毕竟插件提供的默认代理服务器,可能由于使用的站长过多,加速效果不明显。

Reviews

There are no reviews for this plugin.

Contributors & Developers

“IMGspider – 图片采集抓取插件” is open source software. The following people have contributed to this plugin.

Contributors

Changelog

1.2.1

  • 新增批量采集可选采集方式;
  • 优化插件设置界面菜单展示样式;
  • 优化批量采集按钮展示方式,未选择采集地址时不可操作;
  • 优化批量采集地址列表,采集地址过多时以查看更多的方式展示;
  • 优化批量采集状态,方便用户了解当前进度;
  • 优化批量采集性能;
  • 优化批量采集图片采集成功地址展示形式。

1.2.0

  • 新增特色图片设置功能;
  • 新增定义代理服务器,支持使用本地服务器及代理服务器采集图片;
  • 新增指定顺序图片过滤规则;
  • 新增特定尺寸图像过滤规则;
  • 新增图像格式过滤规则;
  • 新增图像域名排除规则;
  • 新增相同地址图片去重规则,防止采集相同图片;
  • 新增已发布文章全局扫描功能,批量采集已发布文章外链图片;
  • 取消插件启用关闭设置,采用WordPress插件禁用机制;
  • 修复插件一些已知bug。

1.1.2

  • 优化图片采集规则,解决部分网站限制WP采集图片403 Forbidden报错问题

1.1.1

  • 优化代理服务器模式采集图片规则
  • 解决部分CDN图片无法采集问题

1.1.0

  • 新增图片采集模式,支持手动或者自动采集;
  • 代理服务器支持加密代理服务器配置
  • 新增采集图片选项设置,支持设置采集图片尺寸规格/文件名规则/标题及代替文本/对齐方式等。

1.0.1

修正WordPress v5.3兼容性问题

1.0.0

  • 新增JPEG, JPG, PNG&GIF等常见图片格式支持
  • 新增图片爬取默认代理服务器功能
  • 新增图片爬取自定义代理服务器配置功能
  • 新增图片队列下载功能