的语义相似度计算方法,以确保检索到的 chunk 与查询具有高度的相关性。最后是生成步骤,它将

原始查询和检索到的 chunk 一起输入到预训练的 transforr 模型(如 gpt 或 bert)中,生成最

终的答案或文本。这个模型结合了原始查询的语义信息和检索到的相关上下文,以生成准确、连贯

且相关的文本。

rag 的概念和初步实现是由 douwe kie、patrick lewis 和 ethan perez 等人在 2020 年首次

提出的。他们在论文《retrieval-augnted neration for knowled-tensive nlp tasks》

中详细介绍了 rag 的原理和应用,随后谷歌等搜索引擎公司已经开始探索如何将 rag 技术应用到搜

索结果的生成中,以提高搜索结果的准确性和相关性。在医疗领域,rag 技术可以帮助医生快速检

索医学知识,生成准确的诊断建议和治疗方案。

24 文本相似度计算