ES和mongo选型的问题
做一个资源库,专门存储爬虫爬到的各种文章,提供给别人在线阅览和搜索。由于数据量比较大团队纠结到底用Mongo存储还是ES
题主的业务背景是文章搜索,选型上倾向于es.个人的想法如下:
(1)虽然mongo和es都支持全文搜索,但是es天然就是为了搜索而生的,全文搜索上还是会优先选择es
(2) 在深度学习时代,搜索匹配经历了从:item matching --> vector matching的发展,新版本的es支持密集向量索引,如果题主后面想引入密集特征搜索,也可以直接复用es(虽然有更为专业的faiss等特征检索框架,但是从方便开发的角度来说,es同时支持可以减少开发量)
(3)es的工具丰富,有可视化的kibana,同时也有适合做日志的logtash,感觉可以一套撸下来
本人没有很深的数据库背景,所以有些不对的地方就请大家指正拉