软删除的主要目的是避免使用 delete 语句,导致一些数据丢失的重大问题,合理的数据库备份归档习惯可以避免这个问题。
我们比较常用的方法是用另一个归档表,避免 status <> 'delete' 或 deleted 判断,不然很简单的查询操作都需要判断是否删除,比如 select count(id) from message_table ,更不用提复杂查询了。
select count(id) from message_table
归档表 + 测试用例覆盖可以解决大部分删除场景
Python3.5 之后就有了,Python 的 type hint 是语言支持的,比 ts 支持 js 更好,只是很多 python2 库不能支持,ts 是微软维护的,生态和 js 其实有点割裂
pycorrector 这个是现成的,挺好用,国人开源的,也有微信交流群,问题交流还是比 较及时
单独判断 UA 的话没法确定是否为真实的 “某某爬虫”,严格的话要对客户端 IP 做 DNS 分析确定,有很多爬虫伪造 googlebot 去爬别人的内容,比如 fake-useragent 之类
数据可视化的话可以试试这些:
Matplotlib 一般够用了,平时可以看 cheat sheet 速查一些方法:cheatsheet
如果对编码一致性和显示一致性的自定义能力要求较高的话,还是 matlab 好