Langchain 我也没有深度体验,只是之前很火我就用用看。
存的数据不是用来训练 LLM 的,而是向量索引。
向量数据库你可以认为只是机械的做 L2 或者 cos 近邻搜索,不是新东西,只是随着 AI 火起来,市场对 SaaS 的向量数据库需求大,导致大量创业公司(主要是工程工作量),在存数据到数据库前需要做一个 embedding,不同模型的效果差异很大,openai 的 embedding 质量很好。