生活资讯
费米估算 、费米估算法的原理
2023-04-06 02:00  浏览:56

费米估算是什么?

费米估算指的是解决未知结果的估算问题,将复杂的问题拆解成小的、可知结果的部分。将拆解出来的简单部分赋予实际意义,如果还不能得出结果,那就继续再拆解,直到拆解后的所有部分问题变成一个常识问题或者是比较容易解决的,从而将一个未知结果的问题逐步变得清晰。

在费米估算过程中,不是只有一次估算,会产生一系列的估算。比如估算芝加哥有1/3家庭有钢琴,同时也会估算一架钢琴平均5年调一次音。这些估算有的过高有的过低,相乘之后会相互抵消,回归到较为准确的平均值。

扩展资料

费米估算步骤:

1、明确问题。

2、分析是需求端问题还是供给端问题,或者两个角度都不是。

3、问题拆解,列公式。

4、计算。

对问题进行拆解时,提倡按照不重不漏(MECE,Mutually Exclusive Collectively Exh***sted)的原则,将问题层层拆解成子问题,从而找到问题的根源。

费米估算问题套路详解

有这样的一个故事:

在一次芝加哥大学课堂上,费米问学生。芝加哥市有多少调琴师,学生们一脸茫然。费米提示把这个问题 “分解成一些便于操作的小问题,然后鼓起勇气作猜测和假设”。

芝加哥有多少居民?可靠的估算是300万;平均每个家庭有多少人?4人;多少家庭有钢琴?大概三分之一,那么全市大约就有25万架钢琴;一架钢琴隔多长时间需要调音?平均5年,那么芝加哥平均每年有5万架次的钢琴需要调音;每个调音师每天能为多少架钢琴调音?4架;假设他一年工作250天,那么他每年约为1000架钢琴调音。

由此,费米和学生们推测,芝加哥市大概有50位钢琴调音师。

事后有人用电话号码簿加以验证,实际统计的结果与费米的猜测十分接近。

费米估算指的是解决未知结果的估算问题, 将复杂的问题拆解成小的、可知结果的部分。

将拆解出来的简单部分赋予实际意义, 如果还不能得出结果,那就继续再拆解 ,直到拆解后的所有部分问题变成一个常识问题或者是比较容易解决的,从而将一个未知结果的问题逐步变得清晰。

在将复杂的问题拆解成小的、可知结果的部分过程中,可能会存在估算,那么这样的估算会不会给最终结果带来很大的误差呢?

比如前面例子中,费米估算芝加哥有1/3家庭有钢琴,如果当时估算的是1/4,那结果就会不准确了吗?

其实在费米估算过程中,我们不是只有一次估算,我们会产生一系列的估算。比如估算芝加哥有1/3家庭有钢琴,同时也会估算一架钢琴平均5年调一次音。这些估算有的过高有的过低,相乘之后会相互抵消,回归到较为准确的平均值。

费米估算不是万能的,有个很重要的前提,我们的估算值是有实际数据或者生活经验支撑的。估算值不能偏离实际结果太远,要从实际结果、常识出发。比如费米在估算芝加哥每个家庭有4个人,换成我们来估算的话,我们不能拍脑袋直接估算芝加哥每个家庭有10个人。

这种脱离实际常识、数据的估算其实是瞎猜,瞎猜怎么能对呢?

最近在分析些产品面试题,发现一些大厂喜欢出这样的估算题目,比如:

这类问题称为Market Sizing问题,有些同学在面试时碰到这类问题,如果没有提前了解这类题型,难以找到比较好的回答思路。

这类Market Sizing题型正好可以通过费米估算的法则来解决,将未知的数逐步拆解成已知的部分,从而将一个未知结果的问题逐步变得清晰。

Market Sizing问题在运用费米估算时,主要是通过需求端、供给端、供需端等角度切入将问题拆解。

费米估算思路

在进行费米问题估算时,需要谨记的一点在于“ 将难获得的数据拆分为易获得的数据 ”, 同时,对拆解后的部分赋予数值时, 避免改变数值真实范围 (按照数据或者经验来赋予较为准确的范围),这并不是一件困难的事情,因为——费米估算是有逻辑套路的。我们从需求端、供给端、供需端三个方面给出案例。

问:“2018年中国消费了多少升啤酒”

(需求端?供给端?供需端?)

要分清楚这个数据是供应端是瓶颈,还是需求端是瓶颈等。这些类别的不同将有着不同的解题思路。 供给端就是从企业的供给能力出发,评估企业能够支持多大的市场规模。而如果是需求端,通常就和人口之类的挂钩了。

那么,很明显,中国啤酒的消费量属于“需求端是瓶颈。

列出你的一些常识,从而启发解题方向。通常来讲,每个人的解题思路会因为自己常识的不同而不同。估算能力本质就是将一个复杂的问题,一步步拆成贴近自己常识范围内的题目去解。

构建计算逻辑树,咨询公司又叫它issue tree。我思考了几种思路:

在建立issue tree之前,要讲一个重要的原则,咨询公司叫MECE(读me see),全称是“Mutually Exclusive Collectively Exh***stive”,翻译成中文就是“相互独立,完全穷尽”。我们习惯简称为“不重不漏”。

在按照 MECE 原则将某个整体(不论是客观存在的还是概念性的整体)划分为不同的部分时,必须保证划分后的各部分符合以下要求:

因此,我所列的计算逻辑的要素必须是符合MECE原则。现在开始一步步列出计算逻辑树, 黑色背景代表已经可以在常识范围内进行估算了,深蓝色背景代表则反之。

由于我主要在夏季喝啤酒,因此,我以夏季的日消耗量来进行估算,这也符合我的常识。前面提到,冬季是啤酒淡季,夏季是旺季,因此公式变为:

由于直接估算消耗的体积比较不直观,我们转而估算瓶数,最后再转回体积,公式变为:

而某场所夏季的日消耗瓶数还需要继续拆解,以KTV场所为例:

酒吧单间场所覆盖人数的估算方法和KTV一样。小餐馆较多,无法使用相同的办法。这时候可以取用深圳家中小区人口数和附近饭店的数量去进行估算。

根据MECE原则,还有一个其它场所需要预估。其他消费场所的消耗瓶数,则为以上四种消费场所总消耗瓶数的某个百分比即可。至此,整个计算逻辑树如下,树根已经为黑色背景可估算了。

1)计算“单间场所覆盖人数”

老家县城城区人口约20万人,KTV印象中在5 - 15家左右,酒吧1~3家,取个均值,算下来:KTV单位覆盖人数=20W人/10家KTV=2W人。酒吧单位覆盖人数=20W人/2家酒吧=10W人。

深圳家中小区加上园区办公楼估算有5000人左右,附近饭店在约有10家。因此,小餐馆单位覆盖人数=5000人/10家餐馆=500人。家庭单位覆盖人数直接取3人,三口之家。

2)计算“目标消费人群数量”

KTV,酒吧,小餐馆,我理解农村是比较少的,忽略不计。前面讲到我的常识中,农民是8亿人口,那么这三种场所的目标消费人群为6亿(14亿-8亿),家庭则为完整的14亿。

计算“单间场所日消耗瓶数”,即“平均每天消费人次” X “人均消费瓶数”。

以下数据均为估算:

3)两个快速计算的技巧

至此,计算都比较简单。那么后面的计算过程如果按照传统的计算,将会非常耗时且容易出错,在面试过程中这么操作是不现实的,为了应对这种情况,《Case Interview Secrets 》给出了两个技巧:

计算“场所数量”,即“目标消费人群数量” ÷ “单间场所覆盖人数”。

计算“各场所啤酒夏季日消耗瓶数”,即“单间场所日消耗瓶数”乘“场所数量”。

计算“最终结果”:

算完以上之后,由于KTV和酒吧占比很小,所以你可以放心取整数了。四种场所总计=2700千瓶+540千瓶+240百万瓶+70百万瓶≈(2.5+0.5+240+70)百万瓶约等于310百万瓶

那么以上,我们估算了四个主要消费场所的量,我已经很难想到其它大的消费场所了,因此我估算其他场所只占消耗量的10%。则总计=310+310*10%=310+31约等于340百万瓶。

前面提到我是按照旺季的消耗量去预估的,因此数据是偏高的。我需要打一个季节折扣。这个折扣我根据自己的理解设定为80%。

则总计=340x80%=340x100%-340x20%=340-68约等于=340-70=270百万瓶。

一年365天,则一年总计=270x365=250x400=100000百万瓶=1000亿甁。

每瓶容积为0.45升,则 中国2018年啤酒消耗量=1000X0.45=450亿升。

我用excel精确计算后的结果为453亿升,可谓相当接近了。

朋友告知第三方给出的数据在400-450亿升之间。能够碰巧在这个区间也需要一部分运气。《Case Interview Secrets 》作者谈到,这类估算问题,如果与真实数据误差在20%以内,就算是非常完美的估算结果了。当然更加重要的还是解题的思路。一步步将未知的问题拆成若干自己相对已知的范围里去解题。

供给端:

楼下星巴克一年卖咖啡收益?

1、列常识

2、逻辑树(拆解公式)

3、数据整合,得到最终结果

星巴克一年营业额 =一杯咖啡均价X(每天闲时产能+每天忙时产能)X365天 =30X(480+192)X365 =736 万

供需结合:

以小见大

“香港有多少个自助提款机?”

被面试的学生来自港中文大学,知道港中文约有10000名师生,有5台ATM取款机。

在 "供给与需求满足一定比例" 的假设下,推测一台ATM机能够满足2000人的取款需求。

全香港大概有700万人口,需要3500台ATM机

以大见小

“XX县城有多少金融行业从业人员?”

作出假设:全国大概800W金融行业从业人员

在【供给与需求满足一定比例】的假设下,800W金融从业人员服务与14亿中国人,1个金融从业人员可以服务175人。

XX县城的金融从业人员数量=XX县城总人数/175

常见的费米估算问题都可以套用以上三种方法进行解答。在实际的面试过程中,更加推荐大家从需求端或者供给端出发,进行公式的拆解。一定要记住:关注拆解的过程,可适当引用“瞎诌”的假设数据,不用管结果的正确性!!看完费米估算的思路,有兴趣的朋友们可以拿出纸和笔,做做题呀~~~(1)估算永和豆浆一年的油条销量?(2)上海理发店有多少tony老师?(3)长沙一年的燃油税费是多少?(这是我面网易考拉的原题)

Emmm……好像很多人表示,不知道怎么获取XX城市有多少人的信息,怎么估计每个年龄阶段的人数占比信息……其实吧,这些数据是要背的(对的,你没看错,要背……)。在面试网易考拉的时候,面试官让我推算长沙一年燃油税费,我在做数据假设的时候说道长沙有800W人,这时候面试官小哥哥翻出手机开始查,完了抬头看着我说:你数据感挺不错(哈哈哈内心偷笑中)

引用文章:

费米估算 | 产品面试中的估算问题解法

费米问题 | 如何快速评估一个价值范围?

你的城市有多少理发店?费米估算问题套路详解(1)

你的城市有多少理发店?费米估算问题套路详解(2)

费米是怎样用一把纸片估算出了核弹的爆炸当量的?

这个消息是至今在《Nuclear Files》可以找到原文报道,原文如下:

about 40 seconds after the explosion the air blast reached me. I tried to estimate its strength by dropping from about six feet ***all pieces of paper before, during, and after the passage of the blast wave. Since, at the time, there was no wind I could observe very distinctly and actually measure the displacement of the pieces of paper that were in the process of falling while the blast was passing. The shift was about 2 1/2 meters, which, at the time, I estimated to correspond to the blast that would be produced by ten thousand tons of T.N.T.。

翻译成汉语就是在爆炸后40秒后,爆炸波传过来,费米尝试用从六英尺高抛落纸片来估计它的强度,当时没有风,费米可以很清楚地看到爆炸过程中纸张的位移,纸片被改变方向移动了2.5米,当时费米估计的当量是一万吨TNT爆炸的当量

这就是人们认为费米撒纸屑算原子弹的当量的来源,这段话中费米自己描述的模型很简单,直接从这里判断出原子弹的爆炸当量根本不可能,这个模型不是简单的自由落体,纸屑受到爆炸波的扰动轨迹是复杂的,除非之前费米已经做过好多次试验了。不然违反物理规律,有点超纲了。我宁愿相信这是费米说的一句玩笑话,当时拿没拿纸,谁又知道呢?一万吨当量当然不是爆炸后费米才知道的。、

作为20世界杰出的物理学家,费米也被誉为“原子能之父”,作为核反应堆攻关小组组长带领建造了世界上***座人工核反应堆。费米在1939年初看到中子可以引起有原子的裂变理论后就果断的意识到这可能应用于军事上了,建议美国政府发展原子武器。后来计入到“曼哈顿”计划中,费米是主要的的科学顾问,在设计原子弹时当然早就知道自己设计的原子弹当量了,所以这这只是费米开的一个玩笑罢了。

费米估算(Fermi Estimate)

A Fermi estimate is one done using back-of-the-envelope calculations and rough generalizations to estimate values which would require extensive ***ysis or experimentation to determine exactly.

Physics is celebrated for its ability to make extremely accurate predictions about tough problems, but accuracy comes with the cost of difficulty in calculations. If the math is too complex to perform, it is usually a good idea to relax demands and accept an approach that is imprecise but can help to forward.

Fermi is celebrated for his fast and excellent calculations with little or no concrete data. In one well-known example, when the first atomic bomb was detonated during Manhattan Project, Fermi dropped a few scraps of paper as the shock wave from the detonation passed. After some coarse calculation, Fermi estimated the power of the blast from the motion of the scapes as they fell. Fermi's guesstimate of 10 kilotons of TNT was remarkably close to the now-established value of 20 kilotons, even though the estimate was 50% off the actual number.

What is the size of market for razors in China? How many trash cans are there in Beijing? How many piano tuners are there in the world? Such non-standard problems are called "Fermi problems", which are very bewildering to many people, at least if we want to guess the answer in one step.

One distinctive feature of the fermi problem is that precision is impossible to achieve quickly, but it's easier to arrive at a fast estimate of the range for the right answer. Before investing a big effort to measure something with precision, problem-solvers can estimate answers approximately - and only then determine if it's essential to do the extra steps to arrive at the accurate answer.

In real life, especially the business world, many problems are too complicated to give an accurate answer immediately. In ***yzing such problems, precision is impossible to achieve quickly, but we can quickly estimate the range of correct answers. Hence before putting much effort into calculating anything with precision, make a rough estimate of the answer, then decide whether it's worth investigating further.

下面以一道案例讲解费米估算:

中国人一年消费多少猪肉?

Most of people are really bad with huge numbers, and thus we need to first decompose the target metric into ***all components. When decomposing a huge metric, we have two approaches: decompose it by formula or b y some common features, such as gender, age, education, country, etc.

在这,很明显,我们可以先根据计算公式拆解中国一年猪肉的总消费量, 如下:

而 中国平均每人猪肉消耗量 又可以根据中国人每日的食肉摄入类别进行拆解,因为中国人的蛋白质来源不仅限于猪肉,还有其他的蛋白质类别。

目前,未知的两个参数为 percentage of consumption of pork per person per d*** 和 total consumption of meat per person per d*** . 迅速获得一个精确的数值肯定不可能,所以我们需要根据经验来估计这两个参数。

首先,一个标准的牛排重量为120g-150g,所以午餐和晚餐都摄入一个牛排重量的肉类的情况下,每人每天消耗的肉量大约为240g。当然,我们无法确定是否也有早餐含有肉类的情况,但是根据生活经验,中国人的早餐大部分由鸡蛋和面粉类食物构成。To move forward, 我们这里做一个简单的假设: 中国人基本上在中午和晚上会摄入肉类食品。

其次,我们可以将中国每天的肉类摄入量进行拆解,从而大致估计猪肉的消耗占比。如下图

这里为们可以make a wild guess about the percentage of pork consumption. 鉴于中国人的主要摄入肉类为猪肉,我们不妨猜测猪肉的消耗占总肉类消耗的50%。因此,可以得出中国平均每人每天的猪肉消耗量大约为:

Using the estimate, we can give an approximate answer of the yearly consumption of pork in China:

所以,最后估计给出的数值是6132万吨猪肉。网上搜索, 新闻 里给出的数值为5600多万吨猪肉。我们估计出的数值虽然相差好几百万吨,但是其实已经是一个比较准确的数值。

对于此题,我们还可以从多个不同角度出发,将中国人的猪肉的消耗占比进行进一步的拆解,例如地区和年龄。上述的计算暗含的假设是猪肉的消耗在全中国各地和不同的年龄阶层都一致。所以我们可以练习,如何从这两个角度出发,将指标进行进一步的拆解。

地区

如果从省份的角度划分的话,计算会变得复杂要估计的数字也很多,因为中国总共有34个省级行政区。因此,不妨直接把中国划分成 沿海地区,西北地区,和其他 ,这里的其他就是指非西北和沿海地区。这么划分的理由是,西北地区以牛羊肉为主要蛋白质来源,而沿海地区依靠海鲜。

沿海地区主要依赖海鲜为生,我们可以猜测猪肉的消耗量占比为20%;同理,西北地区主要食用牛羊,依然可以猜测猪肉的消耗占到20%。而其他地区,以猪肉消耗同时消耗淡水产品,所以我猜测60%。此时,中国的猪肉年消耗量为:

很容易发现,未知的参数为 西北地区人口,沿海地区人口,和其他地区人口 。鉴于西北地区地广人稀,我们肯定猜测较小的数值,而沿海地区和非沿海地区是中国的人口密集区,所以我会猜词一个很大的数值。西北地区大约有1亿人,沿海省份主要包括了:广西,广东,澳门,香港,福建,浙江,江苏,山东和辽宁。鉴于省份不是所有省市靠海,这里我保守猜测沿海地区的人有3亿,所以其余地区为10亿人口。所以,最终结果为:

年龄的拆解思路与地区大致一致。

Reference:

费米估算-超市关门时货架上的可乐瓶数

信息提炼:

    9月15日  非节假日,客流量不会暴涨

    周六        非工作日,客流量会相对多一点

    晚23:59   此时超市已关门

故要估算超市关门时货架上还剩多少瓶330毫升的红色听装可口可乐。

由于货架缺货,店员会进行补货,假设可乐货源充足,且卖出3/4后,店员就会补满货架;假设货架为4排,每排可放置6瓶可乐,满货架有4x6=24瓶可乐,则可知每卖出18瓶就需补货;超市营业时间为9点-21点,共12h。

可知公式: 超市关门时货架上还剩多少瓶330毫升的红色听装可口可乐=满货架可乐-最后一次补货后的售出 

                  最后一次补货后的售出=最后一次补货到关门的时间x平均每小时售出的可乐数量

                  平均每小时售出的可乐数量=每小时客流量x购买可乐的比例x购买可乐的瓶数

假设周六当天平均每小时客流量为100人,购买可乐比例2%,购买瓶数为1瓶,即平均每小时售出的可乐数量=100x2%x1=2瓶;

又可知卖出18瓶可乐需要9h,根据营业时间只有12h,知道从开门到9h后,就需要最后一次补货,因此最后一次补货到关门的时间=12-9=3h,可知最后一次补货后的售出=3x2=6瓶。

最后,估算出超市关门时货架上还剩多少瓶330毫升的红色听装可口可乐=24-6=18瓶     

费米估算题目汇总

费米估算: Top-down,bottom-up法则

top-down:从宏观层面,由上层往下推。bottom-up:由某个点横向切入,反推上去。

全国人数x4-12岁人口比例×参加英语培训的比例×参加线上培训的比例

从上层往下推:全国14亿人民,4—12岁的人口占8/80,其中10%参加英语培训,这其中10%参加在线英语培训

即:140000000x1/10x10%x10%=140万

【牛客上小伙伴的答案:链接:

中国所有航班一天承运的客流量

=中国所有机场一天的客流量

  从供应思考当天机场能够提供多少乘客的运输:

  乘客客流量

  =机场数目X机场当天起降的飞机数量X每架飞机实际乘客数

  =机场数目X机场跑道数量X机场跑道开放时长/每架飞机起降需要花费的平均时长X每架飞机可承载人数X上座率

  假设:

    机场数目:150个 

    跑道:3个 

    每架飞机起降需要花费的平均时长:5min 

    机场跑道开放时长:6:00-2:00(隔天)共计20h 

    每架飞机可承载人数:飞机一般有三种大小,但中型大型居多,假设分别占比8:2,可承载人数200:400 

    上座率:假设飞机平均上座率为60% 

  则:150X3X20h/5minX(0.8X200+0.2X400)X0.6

  =1200万】

我的思路:全国总人口14亿,十分之一的人有乘坐飞机的需求,假设这些人平均每年飞机出行两次

14亿x1/10x2x1/365=76.7w

从需求端推算:

北京人口为2000w,其中10—50岁的人口占1/2,假设这些人每周点2次外卖,每个外卖小哥一天可送40单,美团外卖与饿了么市场占比约为2:1

20000000x1/2x2/7÷40x2/3=47620

从需求端考虑:

广州人口*有打车需求的人员比例*打车频率÷出租车运载量

广州人口数1500w,假设12-60岁的人有打车的需求,平均每周打车一次,一辆出租车一天工作12h,非空载时间占70%,平均一趟所需20min

1500w*48/80*1/7/(12*0.7*3)=5.1w

对于酒店来讲,普遍是供应大于需求,从供应角度来看更为方便。

北京总面积1.7万平方公里,假设居住面积占总面积的60%,一家酒店的辐射面积是0.5平方公里,三星级以上的九点占所有酒店的20%

1.7w*60%*2*20%=4000家

从需求端思考:

成都总人数为1600w,男女比例1:1,男性一个月去一次理发店,女性三个月去一次理发店,一家理发店一天营业10h,平均每家理发店三名理发师,一位顾客平均理发时间60min,

需求侧:每天需要理发的人数为——800w*1/30+800w*1/90=34w人

供给侧:每天每家理发店可服务的人数为——10*3÷1=30人

所以成都的理发店总量约为:34w÷30=1.13w家

费米估算我个人认为对于结果精确度的要求较低,重点在于模型构建,找出切入点,列出算式。

注意思考要全面,如计算小学里打王者荣耀的人数时,要注意小学中不光有学生,还有老师及领导。

关于费米估算和费米估算法的原理的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。

发表评论
0评