表 1: 2002 年 TREC 问题。
检索通道 通过使用作为查询问题 问:什么是阿拉斯加的州鸟? 答:柳雷鸟 通道 1 :官方阿拉斯加的州鸟是柳雷鸟 通道 2 :本系列被摄制柳松鸡 拍下 ...公园在阿拉斯加 通道 3 :柳松鸡是相当大的鸟,非常小的鸡。
考虑表 1 中描述的例子,通道 1 中的证据很明显的表示“柳雷鸟”作为一个正确的答 案,因为句子结构与问题相似以及关键词在通道中有提到使得答案很变的很明确。
与此相反,通道 2 和通道 3 中的证据不是那么明显,因为这两个通道描述了关于“柳雷鸟”的其他方面。
此外,“柳雷鸟“通道 2 中没有提到,这使得它更难被提取。
但是,如果我们利用通道 1 中“柳雷鸟“的标签,这两个标签作为候选答案的概率会提高。
在通道 3 中,“柳”和“松鸡”很容易被分离,但把通道 1 中的“柳雷鸟”作为候选答案边界将会被修改。
其结果是,找到正确答案的频率将会提高。
这有助于提高正确回答问题的可能性。