给网站加了个自动rss聚合

生活随记  ·  2025-05-04

最近给网站加了两个自动化功能,都是基于现有评论体系延伸出来的。原本只是想简化友链管理流程,没想到最后整出了个半自动化的内容聚合系统。所谓半自动是因为所有的评论都需要经过审核。

友链这块的逻辑比较简单,所有在本站发表过评论的用户默认视为友链对象。过滤掉广告和违规信息后直接通过审核,审核通过的友链会实时展示在友链页。为了保持动态更新,友链页每24小时会重新生成一次,数据存储在PHP序列化文件,这比每次查数据库省事很多。目前看到最有趣的副作用是,由于自己账号活跃度最高,稳稳占据着友链榜榜首的位置。

点击这里去 博友圈

RSS聚合功能则是连带产生的需求。最初考虑过手动维护友链库,但考虑到后续扩展性就做了自动化处理。核心逻辑是每12小时遍历友链库,自动识别目标网站的RSS源。现在支持的路径模式包括/rss、/feed、/rss.xml、/index.xml等常见形式,评论填写的网址是https://address.com/也能自动识别到https://blog.address.com匹配上面的任意形式。抓取到的文章会经过敏感词过滤,命中敏感词的内容会被直接屏蔽。毕竟咱网站运行在中华大地要遵守中华大地的法律法规。

新增友链完全依赖用户自主行为,不需要人工审核RSS地址,系统会自动筛选出有效的订阅源。最终呈现的聚合页面按发布时间倒序排列,所有文章集中在同一页展示,省去了分页的必要性。

 

 
版权属于: 全局变量

 

评论  (评论须知)
leon
leon

这聚合功能挺不错

全局变量
全局变量

这样只要是在我网站上评论了,通过审核基本隔天就可以在博友圈中看到。

Yang
Yang

冒个泡,这个功能很有意思呀

全局变量
全局变量

这样不用一个一个的去翻友联,有更新12小时就会同步过来。包括你的

雅余
雅余

还是挺实用的,可以少装一个rss阅读器。

全局变量
全局变量

嗯,还可以为友联增加来访。

dujun
dujun

界面清爽

全局变量
全局变量

我不喜欢圆角改天有时间把圆角也改了

寻鹤
寻鹤

我好像一直都没有这种想法,做成rss内置在页面里,现在有空才用folo看看

全局变量
全局变量

自己来写博文时可以一览所有链接的最新博文。这样比folo方便,当然这里的rss只是仅限博客内的博友链接。

Zhang
Zhang

相较原版主题改了好多内容啊,整体感觉更美观更实用了

全局变量
全局变量

主体没改,就是改了字体、直角之类的。我看不来圆角。

白熊阿丸
白熊阿丸

这个不错。
有些网站的RSS订阅路径没采用常见的标准路径,而是将RSS地址嵌入在HTML代码中的标签内,例如:
rel="alternate" type="application/rss+xml"
rel="alternate" type="application/rdf+xml"
rel="alternate" type="application/atom+xml"
等形式。这些标签提供了指向RSS、RDF或Atom格式订阅源的链接。
可以通过这个办法识别自定义的路径。

全局变量
全局变量

我不是通过页面内声明的rss链接来获取的,而是通过一个评论者填写的域名自动给他生成十几种rss链接形式,其中有一种得到响应并xml解析成功就代表获取到了正确的rss链接地址。你说的这种只有极少数会在页面声明。我就看到有些博主页面上即没有rss链接,html代码中也没有任何feed相关的代码,但我通过自动给他生成实际中rss链接成功的获取到了信息。

白熊阿丸
白熊阿丸

嗯,我说的是很多「本地RSS阅读器」探测RSS地址的做法,如果只输入域名,他们优先是通过解析首页的HTML中的这些标签,来识别RSS地址。实际上很多博客系统都自带输出这个功能了,像是wordpress或者typecho搭建的博客,首页都包含了这串代码。反而是那些自己生成的静态博客、自定义比较强的博客没有在首页代码里声明。

全局变量
全局变量

很多年没用过本地rss了,现在都这么高级了?改天电脑上下载个试试😂。还是有很多没有在源码里声明的。所以,我一开始就没想过从源码里面嗅探rss。

静风说
静风说

正纳闷评论都没填rss地址是怎么获取的,原来是这样做的。

全局变量
全局变量

我没有建怎么的有链数据表,填也没地方填🤣

似水流年
似水流年

速度相当快啊!

全局变量
全局变量

啥快?手?😂🤣

似水流年
似水流年

网页速度很快,聚合页也很快。

全局变量
全局变量

聚合页没实时读rss。网页我还是觉得有点慢。

CopyRight 2025, CopyRight iLogs.Cn. All Rights Reserved. Powered by 我的日志
湘ICP备14010395号-6 | 湘公网安备43062302000172号 | 投诉建议 | 特别声明 | RSS 订阅 | 域名工具
笔墨迹 | 博客录 | BlogFinder | blogsclub | 博友圈 |