Rss,英文全称“Really Simple Syndication”,中文译为“简易信息聚合”,又称为“聚合内容”。是某种基于XML标准,在互联网被广泛采用的主题内容包装和投递协议。feed,指Rss中的feed,指rss中用于收发该信息内容来源地刷新的接口。简单来说,就是一个名为feed的接口,通过它我们可以得到网站上的简单数据内容。
上周末一不小心发现了一个使用wordpress建立的H网,作为一名思想觉悟正常的新青年,怎么能容忍存在这种网站呢,很不幸,被我举报了。当然在举报之前我肯定得认真核实一下,以免误报。然而该站所有视频都是收费的,进入后只能看到要求开通vip的提示,然后就有了今天的文章。
由于该站内容极少,只存在几十个字符,所以在feed中,完全可以显示出来,并且这位站长的技术也不是很好,居然将视频直链输出到了feed数据中,那么我们如何通过feed得到我们想要的数据呢?
feed接口
获取最新文章数据
具体几篇要看站长怎么设置的。
默认结构:https://域名/?feed=rss2
伪静态:https://域名/feed/
获取某分类数据
默认结构的分类地址一般为 /cat=分类id ,伪静态结构一般为 /category/分类别名(slug)
默认结构:https://域名/?cat=3&feed=rss2
伪静态:https://域名/feed/
获取某标签数据
默认结构的标签地址为 /?tag=标签名 ,其他结构为 /tag/标签名 ,比如标签为“phpmyadmin”的feed地址
默认结构:https://域名/?tag=phpmyadmin&feed=rss2
伪静态:https://域名/tag/phpmyadmin/feed/
获取搜索关键词数据
比如搜索词为“代码狗”的feed地址,下面的地址我没有url编码,实际访问中是需要对中文编码的,浏览器会自动编码。
默认结构:https://域名/?s=代码狗&feed=rss2
伪静态:https://域名/search/代码狗/feed/
获取某个作者数据
默认结构的作者页面链接为 /?author=作者id ,伪静态结构为 /author/作者用户名
默认结构:https://域名/?author=1&feed=rss2
伪静态:https://域名/author/daimadog/feed/
获取评论数据
默认结构:https://域名/?feed=comments-rss2
伪静态:https://域名/comments/feed/
获取某文章评论数据
默认结构的feed地址为 /?feed=rss2&p=文章id ,伪静态结构为文章地址后加/feed
默认结构:https://域名/?feed=rss2&p=622
伪静态:https://域名/5654.html/feed
评论 (2)