ES和mongo选型的问题

做一个资源库,专门存储爬虫爬到的各种文章,提供给别人在线阅览和搜索。由于数据量比较大团队纠结到底用Mongo存储还是ES

mongodb
128 views
Comments
登录后评论
Sign In
·

客户端主要是读请求吧? mongo 不太适合大量查询请求场景,延迟太高了

·

题主的业务背景是文章搜索,选型上倾向于es.个人的想法如下:

(1)虽然mongo和es都支持全文搜索,但是es天然就是为了搜索而生的,全文搜索上还是会优先选择es

(2) 在深度学习时代,搜索匹配经历了从:item matching --> vector matching的发展,新版本的es支持密集向量索引,如果题主后面想引入密集特征搜索,也可以直接复用es(虽然有更为专业的faiss等特征检索框架,但是从方便开发的角度来说,es同时支持可以减少开发量)

(3)es的工具丰富,有可视化的kibana,同时也有适合做日志的logtash,感觉可以一套撸下来

本人没有很深的数据库背景,所以有些不对的地方就请大家指正拉

·

不太清除你们细节场景,有条件还是做下基准测试(Clickhouse 也可以加进去对比),只做数据检索的话还都行,如果后续要做数据聚合统计,感觉还是 es 好做一点