2012年11月21日星期三

数据挖掘 : 实用机器学习技术

系统A有100个文件,其中40个为相关文件

系统B有400个文件,其中80个为相关文件

哪个系统更好呢?

  • 错误的肯定:被返回但却不相关的文件数

  • 错误的否定:相关的但却没有被返回的文件数


所对应的成本决定

  • 精度 = 检索到的相关文件数量 / 检索到的文件总数量

  • 召回率 = 检索到的相关文件数量 / 相关文件总数量

没有评论:

发表评论