钻研职员开源中文文本嵌入模子,填补中文向量文本检索规模的空缺
时间:2024-10-27 10:18:44 来源:Virginia Sara(h)网 作者:知识 阅读:690次
源头 :DeepTech深科技
不断以来,钻研职员中文基于向量的开源空缺文本检索是紧张的钻研议题之一。随着 GPT 的文本文泛起 ,向量检索的嵌入意思变患上愈发紧张 。
由于 GPT 运用的模填模 Transformer 模子的自己特色 ,导致模子只能从牢靠长度的补中本检高下文中天生文本。那末,量文当咱们需要模子感知更广漠的索规高下文时,理当奈何样做呢 ?
规模内通用的钻研职员中文处置妄想是,将历史对于话概况规模语料中的开源空缺相关知识经由向量检索,再填补到 GPT 模子的文本文高下文中