主动推送的好处就是比搜索引擎的爬虫获取的快,我觉得唯一的好处就这个吧,当然这是个人见解,应该不仅是这个,但是推送仅规推送,内容终究为王的时代才是最要的,现在百度搜索出来的关键字都是内容重复的,这一点我感觉越来越恶心,特别是一些关键的技术原因,当你搜索出问题时发现所有的答案居然都是一致,按着人家的去改写都不成功。明明是几分钟就能解决的问题,硬是因为这些无用的答案浪费了好多时间,希望这种问题能解决,算了,以下是个写的脚本,已经开源可以到github找到。
一、获取各大网站的api接口
由于我没有做适配,必须要三个网站的api接口,不然运行会出问题。如果你仅想推送一个或者两个,自己修改代码,注意文件数据是按三个来的,修改时要注意函数里面的修改,如果有需要,加群或者邮件发我吧,有时间再改。
百度的api接口连接:https://ziyuan.baidu.com/linksubmit/index
注意api接口是下面这样的:
必应的api接口:https://www.bing.com/webmasters/
必应的api接口需要你申请,在登录后在右上角,从右开始第二个,设置里面,如图:
神马的api地址:https://zhanzhang.sm.cn/
具体就不演示,自己看源码里面也是有的
二、sitemap地址
我的是使用插件生成的url地址列表,在爬取的时候可能不适配你的,可以自己想办法生成url,当文件名存在就不会去爬取地址,但地址更新问题赖得管,等我什么时候文章数量到一百个,应该就会更新了。
文件名为:txt_url.txt,一行一个url地址列表,注意数据问题,多出空格或者其他都有可能在推送过程中出问题,如下图:
三、运行
需要python 3的环境,还需要下载request模块,上图中也看到了我使用的是青龙面板去运行的,青龙面板主要起着一个定时的作用,我个人脚本没有去做这个,后期关于定时这一块的都是青龙面板去解决,安装可以看我之前的教程,windows很少出现文件读写权限问题,linux的需要自己添加文件的读写权限,以下是运行的日志:
当然啦,想windows自带的定时运行linux的宝塔带的定时运行等等多的是,只是他们有些你都看不到运行日志,运行成功没有出问题,在txt_run.txt 哪里会有结果的,如我运行了三天的结果:
最终结果还是以搜索引擎平台为主,由于必应的接口是北京时间早上八点才更新,所以当时都是在八点的: