content_views"
class="htmledit_views">
召回率和准确率是
class="tags" href="/tags/ShuJuWaJue.html" title=数据挖掘>数据挖掘中预测、
class="tags" href="/tags/HuLianWang.html" title=互联网>互联网中的
class="tags" href="/tags/SouSuoYinQing.html" title=搜索引擎>搜索引擎等经常涉及的两个概念和指标。
召回率:Re
call
c;又称“查全率”——还是查全率好记
c;也更能体现其实质意义。
准确率:Pre
cision
c;又称“精度”、“正确率”。
以检索为例
c;可以把搜索情况用下图表示:
A:检索到的
c;相关的
(搜到的也想要的)
B:检索到的
c;但是不相关的
(搜到的但没用的)
C:未检索到的
c;但却是相关的
(没搜到
c;然而实际上想要的)
D:未检索到的
c;也不相关的
(没搜到也没用的)
如果我们希望:被检索到的内容越多越好
c;这是追求“查全率”
c;即A/(A+C)
c;越大越好。
如果我们希望:检索到的
class="tags" href="/tags/WenDang.html" title=文档>文档中
c;真正想要的、也就是相关的越多越好
c;不相关的越少越好
c;这是追求“准确率”
c;即A/(A+B)
c;越大越好。
“召回率”与“准确率”虽然没有必然的关系(从上面公式中可以看到)
c;在实际应用中
c;是相互制约的。要根据实际需求
c;找到一个平衡点。
往往难以迅速反应的是“召回率”。我想这与字面意思也有关系
c;从“召回”的字面意思不能直接看到其意义。“召回”在中文的意思是:把xx调回来。“召回率”对应的英文“re
call”
c;re
call除了有上面说到的“order sth to return”的意思之外
c;还有“remember”的意思。
Recall:the ability to remember sth. that you have learned or sth. that has happened in the past.
当我们问检索系统某一件事的所有细节时(输入检索
class="tags" href="/tags/QUERY.html" title=query>query查询词)
c;Re
call指:检索系统能“回忆”起那些事的多少细节
c;通俗来讲就是“回忆的能力”。“能回忆起来的细节数” 除以 “系统知道这件事的所有细节”
c;就是“记忆率”
c;也就是re
call——召回率。简单的
c;也可以理解为查全率。