怎么采集wordpress上的文章

一、安装WP-AutoPost

您可以通过从您的WP-AutoPost.ORG帐户下载ZIP文件手动安装WP-AutoPost。

如果您想手动安装WP-AutoPost,请按照下列步骤操作:

登录您的WP-AutoPost.ORG帐户。

转到“账户”部分。

下载您需要的WP-AutoPost插件(ZIP文件)。

将下载的 ZIP文件上传到您网站的’wp-contents/plugins’目录。

解压该ZIP文件。这将创建一个目录。

登录到您的网站,转到“插件”,并启用它。

二、创建任务及基本设置

创建任务

点击“新建任务”后,输入任务名称,即可创建新任务,创建好新任务之后可以在任务列表中查看到该任务,就可对该任务进行更多设置。

基本设置

点击“设置”之后,可在“基本设置选项卡”下,进行如下设置:

任务名称:修改任务名称

分类目录:该任务采集文章发布到的分类目录

作者:该任务采集文章的发布作者,必须是wordpress里的注册用户

更新时间间隔:间隔多长时间检测一次该采集任务下是否有新文章可以更新

字符集:采集目标网站的字符集编码,默认为UTF8,如果目标网页字符集编码不是UTF8,抓取的网页会出现乱码,设置正确的字符集即可解决该问题(如何正确设置字符集)

下载远程图片:如果该任务下采集的文章里包含图片,可以选择是否下载远程图片到本地服务器,选择下载远程图片可以做以下更多设置:

将下载的图片保存到wordpress媒体库中

将图像保存到 Flickr

将图像保存到七牛云存储

将下载的**张图片自动设为特**片

下载的图片自动添加水印,可添加文本水印或图片水印

选择设置图片地址的属*(如果包含源图片地址的属*不是src,可以在这里做设置)

下载远程附件:如果该任务下采集的文章里包含其他类型附件,可以选择是否下载这些附件文件到本地服务器,选择下载后可以做以下更多设置:

将下载的附件信息保存到wordpress媒体库中

自动标签:选择是否使用自动标签

标签列表:使用自动标签后如果文章包含列表里的关键词,将自动添加标签

匹配完整的单词:该设置对英文文章有效,中文文章请勿启用该设置

自动摘要:可自动将文章中**段或前面几段文字设为摘要

发表状态:采集发布后文章的状态,可以是:已发布,草稿,等待复审

手动选择*采集:选择是,将手动选择哪些文章可以采集并发布

三、文章来源设置

文章来源设置

在该选项卡下我们需要设置文章来源的文章列表网址及具体文章的匹配规则

Auto Get Rss插件

这个插件可以在程序上自由的更新,发布文章,还可以订阅和供稿。

2、Caffeinated Content插件

想做二次开发的可以使用这个插件,可以起到搜索,翻译的功能。

3、WP-o-Matic插件

4、WP Robot

这个插件是一个基于wordpress平台的内容采集工具。wp robot是一个款英文站工具,如果主题选择好,会自动去搜索相关帖子主题支持采集yahoo answers的德语、法语、英语和西班牙语。

5、FeedWordPress

这个插件用的很不错,主要是读取feed来实现你的*文更新的,并且是以全文的形式。优点是插件更新升级很及时!建议不要用汉化包,就用英文版WordPress和 FeedWordPress原插件!插件下载后需要在后台控制面板**,并根据需要定制功能。

6、Friends RSS Aggregator(FRA)

Friends RSS Aggregator(FRA)这个插件可以通过RSS聚合,也只是现实文章的标题,发布日期等。

7、 inlineRSS

这个插件可支持RSS, RDF, XML or HTML等几种格式,通过Inlinefeed可以让Rss源的文章现实在特定文章内。

8、autoblogged

这个插件可以自动根据关键词获得YouTube及Yahoo answer等内容,进而实现*客内容自动发布的目的,可以建立你自己的*客群(blog farm),通过这个插件你可以生成视频、图片或者文章*客等。

9、smartrss

这个插件可以随心所欲地把自己喜欢的RSS里面的文章自动发布到自己的wordpress*客上,使得 wordpress具有了类似于有些 CMS的自动采集功能。

10、BDP RSS Aggregator

这个插件可以可以聚合多个blog的内容。适用于拥有多个*客的blogger,或者资源聚合和分享类的blogger,以及群组blogger,聚合多个*客的内容一文。

喜欢自己做个网站或者*客的,可以选择wordpress,操作方便快捷。

对于WordPress用户来说,面对内容创作的挑战,采集是一种有效获取优质资源的途径。不过,采集并非简单的抄袭,而是以他人内容为参考,进行优化和创新。以下是如何实现**采集的步骤:

首先,了解采集概念,它涉及下载和分析其他网站的源代码。必备工具包括火车头采集工具,Office套件,以及WordPress插件Import Export Lite。

确定采集目标,比如进入分类页面,观察URL结构和翻页逻辑。如果遇到防采集设置,尝试调整URL规则。接着,使用火车头编写规则,批量添加URL,设定分页参数,测试并确定总页数,然后确定文章链接的固定格式。

采集时,检查源代码中的内容,处理可能的登录验证。在规则中指定所需内容的标签范围,确保数据的完整*。采集完成后,检查数据格式,将其整理成CSV文件,导入WordPress,通过Import Export Lite插件进行导入,注意字段映射和更新选项。

特别强调,所有操作应在测试环境中进行,避免对生产环境造成影响。若遇到问题,可以寻求专业帮助。这样,通过科学的采集方法,WordPress用户就能**获取和整合优质内容了。

在WordPress创建新*客时,为迅速充实内容,批量采集资源是一种便捷方法。主要途径有两种:利用插件和第三方工具。

对于插件采集,WordPress市场提供了众多**选择,如WP-AutoPost Pro、Scrapes、wp-automatic、可汗采集等,它们在WordPress后台安装方便,可设置自动采集和发布,适合于简单需求,但可能功能相对有限,采集速度较慢,且不支持多级采集。

相比之下,第三方工具如火车头/高铁采集器和蓝天采集器,采用exe或在线php程序,功能强大,能进行多级和多页采集,**度高,支持各种资源类型。然而,它们的使用门槛较高,采集的数据需要额外设置发布模块才能导入到WordPress中,速度较快。

总结来说,选择哪种采集方式取决于你的具体需求。如果你对操作简单、初步填充内容足够,插件可能是好选择。而如果你需要深度采集和更全面的资源集成,第三方工具可能更适合。记住,关键在于根据自己的实际需求来挑选*合适的工具。

相关文章
在线客服
微信联系
客服
扫码加微信(手机同号)
电话咨询
返回顶部