2017年3月11日星期六

笔记: 《大数据》chap 8 web广告

在线算法:在对未来一无所知时,对当前每个元素进行决策

在线算法分配广告:当搜索查询到达时,立刻选择跟搜索结果一起显示的广告

google adwords : 一条广告的价值等于出价和点击率的乘积

几个参数:广告商为搜索查询设置的投标价格,广告点击率,广告商的预算,搜索查询显示的广告数目上限

收益比(竞争率):在线算法收益 / 最优离线算法收益

贪心算法:选择出价最高的广告商

Balance算法:选择出价最高且剩余预算最多的广告商

当出价和预算为任意值时,Balance算法不能对所有出价大小设置合理的权重

一般性的Balance算法:考虑剩余的预算比例,选择 x(1-e^f)最高的广告商,其中,x是出价,f是预算节余比例

还可以乘上点击率,作为最终结果

文档词hash匹配投标

文档词排序:低频词按字典序,高频词按频率升序

投标词排序:按上述次序的第1个关键值hash

按文档词w做hash,找出命中的投标:

  • 如果已经是投标最后一个词,则放到匹配投标表里
  • 如果不是最后一个词,则投标状态+1,再将投标中的下一个词做hash表示该投标

没有评论:

发表评论