我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:大家发高手网 > 短整数 >

产品策略算法——神奇的对数

归档日期:05-13       文本归类:短整数      文章编辑:爱尚语录

  作为一个数学渣,实在无力从对数的起源开始一番复杂的推导然后再得出结论。直接给出一个判断吧——

  长尾分布的特点是,少数的item集中了大量的份额,但是在数值上,尾部的item的数值下降非常缓慢,不会直接下降为零。这么说可能有点苍白,那么举几个例子好了。

  人的收入,年收入1万~10万的人是大多数,年收入10万~100万的比较少,年收入大于1000万的更少,但是年收入大于1000万的人却占据了社会财富的大多数份额。

  电商中,店铺销量最高的店铺占据了GMV的大多数,商品头部爆款占据了GMV的大多数。

  自然界,对于地震的衡量是使用对数的,地震等级每相差2级,能量增加1000倍。

  人的感觉上的强度,大约和刺激强度的对数成正比。比如,我们感觉声音大了一倍,不是因为声源功率增加了一倍,而是声源功率增加了一个数量级。

  在《Feed流设计:怎样用策略掌控用户视线》中,介绍了一个来自Reddit的核心排序算法,在兼顾了Feed流中头部都是热门数据的基础上,能够自动完成数据的更新。

  在《【搜索Case分享】五分钟,教你优化知乎搜索》中,最终给出的用户搜索排序算法,既保证了用户之间的关注关系得到了尊重,也保证了用户的搜索相关度得到了尊重,同时也保证了粉丝数和赞同数能起到作用。

  其中a代表根据需求需要调整的参数,M代表业务数据,M之所以要+1,一方面是历史的进程,另一方面也是为了保证

  为正值。这个公式是为了平衡长尾分布的业务数据与有界的关键性数据之间的关系。

  这个公式之所以说万能,是因为大部分产品数据都可以分为长尾分布的业务数据,或者有界的关键数据。比如搜索就是典型的例子,长尾的业务数据就是销量或者点击量,有界的关键性数据就是文本相关度。

  这个时候肯定是要用到GMV(销售额),也需要用到DSR(detail seller rating,就是宝贝描述,服务态度,发货速度这些)。上面我们已经讨论了,淘宝的销量是数量差别是非常大的。大店铺每月销售额10亿的数量级,小的精品店10万销售额也不错。如果单纯用销量去排列,很多精品店无法挖掘,如果单纯用DSR排列,则不考虑GMV,这无法体现大店铺的优势。

  这个问题中,DSR是有界性关键指标,GMV为长尾分布的业务数据。那么排序公式可以是:

  ACB,比较起来就比较公平,一个店铺的命运当然要考虑自己的努力(DSR),但是也好考虑历史的进程(GMV)。

  这个时候既要考虑这一年收获了多少赞,也需要考虑这个人的答案质量,假如粗暴地认为答案质量度为(阅读+5*点赞+15*收藏)/曝光次数,如果只考虑质量度,笔耕不辍的人怎么办?如果只考虑收货赞的数量,那么一些长期抖机灵没营养的人可能会占便宜。

  这个问题中,质量度是有界性关键指标,点赞数为长尾分布的业务数据。那么排序公式可以是:

  在这个例子中主观评分的是否顺眼为关键性指标(假设为1~5),财富值为重要的业务指标。那么排序公式为:

  这个时候我们发现这个公式没有解决问题,荷西不是最高的。三毛会选择千万富翁。

  hmmm,这就是为什么我说这个公式是一个几乎万能的公式,而不是万能的公式。因为总有些异常的case需要进一步处理。

  这确实是一个几乎万能的公式,但是M值怎么选取,X值怎么选取,参数怎么制定,就需要产品经理对业务有自己的思考了。业务理解力是前提,公式的灵活运用,都是在业务理解力的前提下才能发挥作用。

  理解公式是一个层次,灵活运用公式是一个层次,而在灵活运用公式的同时,再加上对业务的思考,则又是另一个层次了。

  本文在使用的案例的都是比较理想案例,在真实案例中,数据往往不能直接比较,而是设置不同的参数,那么有什么常见的阐述设置情形呢?又有什么常见的参数设置方法呢?

  请教:“这个问题中,质量度是有界性关键指标,点赞数为长尾分布的业务数据。那么排序公式可以是”这句话种的“质量度”是不是应是“阅读数”啊?

  人人都是产品经理(是以产品经理、运营为核心的学习、交流、分享平台,集媒体、培训、社群为一体,全方位服务产品人和运营人,成立8年举办在线+期,线+场,产品经理大会、运营大会20+场,覆盖北上广深杭成都等15个城市,在行业有较高的影响力和知名度。平台聚集了众多BAT美团京东滴滴360小米网易等知名互联网公司产品总监和运营总监,他们在这里与你一起成长。

本文链接:http://buffaloruse.net/duanzhengshu/328.html