主要功能与特色
- 支持自定义字段:抓取内容可以发布到 WordPress 的自定义字段中,便于进一步管理和展示。
- 自动化内容抓取:Scrapes 可以从任意网站抓取内容并自动发布到您的 WordPress 网站,支持文本、图片、视频等多种类型。
- 多源抓取:支持从多个来源抓取内容,用户可以灵活设置不同的网站和内容类型,丰富网站内容。
- 抓取频率设置:用户可自定义抓取频率,按小时、天或周自动更新,确保网站内容保持新鲜。
- 无需编程:直观的界面使用户无需编程知识即可设置抓取规则和发布方式,轻松上手。
最低要求:
Scrapes 旨在提供最佳性能,即使在共享主机提供的最低系统配置下也是如此。但是,服务器的硬件规格、服务器与源站点的连接速度、服务器上定义的某些限制、同时运行的任务数量等问题都是影响性能的因素。最低要求如下所列。
- PHP 5.2.4+(建议PHP7.*,php8可能会报错无法使用。)
- PHP 的 dom、mbstring、iconv、json 和 simplexml 扩展
- 可配置 PHP 的最大执行时间
- WordPress 3.5+
- Google Chrome、Firefox、Safari 或 Microsoft Edge 用于管理面板
可以从任何网站爬取内容吗?
Scrapes 可以从几乎所有网站和 RSS 源中提取内容,但下面提到的网站类型除外。您可以通过试用我们产品的现场演示或联系我们来了解您计划抓取的目标是否合适。
- 内容应在页面打开时加载。不支持 JavaScript / Ajax 技术和后加载的页面内容。
- 在列表页上,应该有一个“分页”或“下一页”按钮,用于重定向到下一页。部分支持加载动态内容而无需更改地址(例如按“加载更多”按钮或使用无限滚动)的内容页。
- 在列表页面上,链接应按特定顺序排列并指向详细信息页面。不支持列出未按特定顺序放置链接的页面、以弹出窗口打开页面而不是链接重定向页面、或使用 JavaScript/Ajax 技术在页面加载操作后加载内容。
- 从列表页面重定向到的详细信息页面应具有相同的 HTML 页面结构,并且必须是有效的 HTML。具有不同 HTML 页面结构的无效详细信息页面可能不受支持。
- 我们的 WordPress RSS 聚合器插件可能不支持具有无效 XML 结构的 RSS 和 Atom 提要。
可以运行多个任务吗?
我们的 WordPress 自动博客插件没有限制添加无限数量的任务,但是每个任务在处理过程中可能会消耗 10 – 30 MB 的 RAM,考虑到您的服务器资源,如果您同时运行太多任务,它们可能会变慢或无法正常工作。
为了减少性能损失并防止 IP 禁令,我们建议您减少任务或编辑它们以在不同的时间范围内运行。
是否完全支持WooCommerce?
它可以根据您想要的目标自动创建“简单”、“外部”和“虚拟” WooCommerce 产品,但目前不完全支持“分组”、“变量”和“可下载”产品类型和产品属性。