您现在的位置是:亿华云 > 知识
一日一技:Bug分析,假删除导致文章发布成功却打不开的问题
亿华云2025-10-04 03:22:01【知识】4人已围观
简介公司有一个内部博客,大家可以在上面创建自己的账号,然后写文章在全公司分享。昨天这个内部博客开通了API,因此我准备写一个Python程序,把自己公众号文章都搬运上去。然后我就发现这个API接口有一个b
公司有一个内部博客,日技大家可以在上面创建自己的分发布账号,然后写文章在全公司分享。析假昨天这个内部博客开通了API,删除因此我准备写一个Python程序,导致的问把自己公众号文章都搬运上去。文章
然后我就发现这个API接口有一个bug。成功并且根据它的却打现象,猜到它问题出在哪里。不开
我先来简单描述一下现象。日技
假设我硬盘上现在有50个Markdown文件。分发布现在我要把它发布到网站上。析假简化代码如下:
import glob
import requests
for path in glob.glob(blog/*.md):
with open(path) as f:
article = f.read()
requests.post(https://xxx.yyy.com/post?删除token=abcasdf, json={ content: content})发布完成以后,文章确实都已经在网页上出现了,导致的问并且每篇文章都能正常显示。文章但我粗略浏览了一下,发现里面有一些文章的末尾带上来我的微信公众号二维码。我不想让公司的人知道我的公众号,所以准备修改一下文章。
有一些文章有二维码,有一些没有,一个一个改起来很麻烦,所以我做了两步操作。首先写了一个程序,扫描所有Markdown文件,发现二维码就删掉。源码库然后,我直接在网站上把刚刚发布的所有文章都删了(懒得去看哪篇有二维码,哪篇没有,干脆全删了重发)。
接下来,我再次运行程序批量重新发布文章。2秒钟以后发布完成。
本来一切看起来都很正常,但是当我到网站上查看的时候,发现有很多文章点开以后,都提示『该文章已经删除』。
我一开始在想是不是我的程序写得不对,漏掉了这些文章。我重新单独一篇一篇发布这篇文章,API接口返回发布成功,可在网页上还是显示文章已经删除。
然后我一篇一篇检查这些发布失败的文章,发现有一个共同的特点:他们是一开始就没有二维码的文章。相当于这些文章我在网站上删除以后原样重新又发了一次。
那我就有了一个初步的猜测,大概知道原因是亿华云什么了:
因为每篇文章有一个docid,当第一次发布文章的时候,这个docid就是文章正文内容的md5值。只要文章完全一样,连续发多少次,它的docid都一样。这样就可以防止出现重复文章。(更新的时候,需要用户主动提供docid,避免重新生成新的)。
这个网站的删除功能,肯定是假删除。也就是当我点了删除文章的按钮时,文章其实依然在数据库里面,只不过增加了一个字段removed=True。网页显示文章的时候,查询条件肯定是col.find({ removed: { "$ne": True}}),所以就不会把这些被软删除的文章显示出来。
API发布新文章的时候,云服务器提供商肯定使用的是更新操作。并且使用了upsert=True。
以MongoDB为例,这个API背后的逻辑肯定是这样的:
def post_article(docid, article_info):
mongo.update_one({ _id: docid}, { $set: article_info}, upsert=True)upsert=True的作用,是先检查数据是否存在,如果存在就更新,如果不存在就插入。
第一次发布的时候,文章不存在,直接插入,正常。如果用户正常使用修改接口,修改了正文,因为用户主动提供了docid,所以也能正常更新。
但如果用户先删除了数据,此时数据库中,增加了一个字段removed=True。然后用户又原封不动重新发一次文章。那么docid肯定还是原来那个。这条文章已经在数据库中存在了。于是逐一更新了每个字段。但是新发布的字段里面是没有removed这个字段的,所以更新的时候不会更新它,它还在数据库里面。所以就出现了发布成功,但是打开新闻又提示文章已经删除。
我去问了一下做这个API的同学,果然它的bug原因跟我设想的一模一样。
这个bug解决方法非常简单,发布新文章的时候,把update_one改成replace_one就可以了:
def post_article(docid, article_info):
mongo.replace_one({ _id: docid}, { $set: article_info}, upsert=True)很赞哦!(37)
相关文章
- 公司在注册域名时还需要确保邮箱的安全性。如果邮箱不安全,它只会受到攻击。攻击者可以直接在邮箱中重置密码并攻击用户。因此,有必要注意邮箱的安全性。
- 使用Python开发鸿蒙应用--2021.01.07直播图文
- 掌握6大模块、7个核心概念!帮你搞定Mycat中间件
- 微容器完胜大容器?
- 因为域名解析需要同步到DNS根服务器,而DNS根服务器会不定时刷,只有DNS根服务器刷新后域名才能正常访问,新增解析一般会在10分钟左右生效,最长不会超过24小时,修改解析时间会稍微延长。
- NumPy新增函数注释等功能,支持Python 3.7+
- 动态规划:关于多重背包,你该了解这些!
- Try-Catch-Finally中的4个巨坑,老程序员也搞不定!
- 为啥修改dns服务器?dns服务器与域名有何联系?
- 中台之后,微服务是否也会被玩死?