最近忙于写学年论文,一直没时间更新 Blog 。不过,我却并没有停止在网上闲逛的习惯。这几天会慢慢把最近看到的有意思的东西写下来。今天学到的一个比较有趣的东西就是:平均等待时间往往大于平均间隔时间的一半。
比方说,有这么一趟公交车,平均每 10 分钟发一班车,但具体的发车时间是很不固定的。如果你在某个时刻来到车站,等到下一班车平均要花多久呢?很多人或许都觉得,平均等待时间应该是 5 分钟,毕竟平均间隔时间是 10 分钟嘛。然而事实上,平均等待时间是大于 5 分钟的。这是因为,10 分钟的发车间隔只是一个平均值,实际间隔有时是几分钟,有时是十几分钟。如果你出现在车站的时刻,正好位于几分钟的间隔中,你的平均等待时间显然就会小于 5 分钟;但如果你出现在车站的时刻,正好位于较长的间隔中,那么你的平均等待时间就会大于 5 分钟。关键就在这里:你出现在车站的时刻,更有可能落在了较长的发车间隔中。因而,平均等待时间会偏向于大于 5 分钟的情况。
那么,如果公交车发车的时间足够随机,概率均等地分布在时间轴上(假设平均间隔仍是 10 分钟),那么当你来到车站时,平均需要多久才能等到公交车呢?答案或许很出人意料——平均等待时间就是 10 分钟。下面我们就来证明这一点。
首先注意到,如果发车间隔依次为 X1, X2, …, Xn ,出现在车站的时刻不同,等候时间也会不同,其函数图象大致是锯齿形的。而平均等待时间,就是这个函数图象的平均高度,或者说所有阴影部分的面积和(也就是 X1, X2, …, Xn 的平方和的一半)除以这段时间总长(也就是 X1, X2, …, Xn 的和)。如果用 W 来表示平均等待时间的话,则
另外,由于公交车的发车时间是完全随机的,因而发车间隔长度服从指数分布 λe-λx ,它的平均值 μ = 1/λ ,方差 σ2 = 1/λ2 ,后者正好是前者的平方。如果把上述所有 X 的方差记作 Var(X),那么
但是
因此
也就是
所以说
这就表明,平均等待时间就是平均间隔时间!
当然,转念一想,你会发现这其实并不难理解。由于发车时间是完全随机的,过去的都已经过去了,并不会对未来造成影响。也就是说,当你开始等车时,知道前面那趟车已经走了很久了,并不意味着下一班车就会更快到来。不管你出现在时间轴的什么位置,等到下一班车的期望时间都是一样的——平均的间隔时间。
参考资料:
http://mahalanobis.twoday.net/stories/3486587/
http://en.wikipedia.org/wiki/Exponential_distribution
总算更新啦~
有时候直觉很重要
排队论
显然,但不太好说。
某国公交到站时间按秒算。。
另外,由于公交车的发车时间是完全随机的,因而发车间隔长度服从指数分布 λe-λx ,它的平均值 μ = 1/λ ,方差 σ2 = 1/λ2 ,后者正好是前者的平方。
这个方差对某国的公交车来说实在太大了,和楼上一样,到站时间真的可以精确到秒的。我的个人感觉是7分钟间隔的车,平均就等个3分钟左右。
为什么是指数分布?
好像简单模型的话就是指数分布的memoryless性质。类似的还有,假如加州洛杉矶地区发生大地震的期望时间是20年,如果这个发生地震的时刻是指数分布的话,那么就算过了19年,大地震没发生,问下次发生大地震的期望时间,还是20年。
哈哈,上学期统计导论课的内容~
假设你总是在上一辆车刚离开时到达车站,那么,你的平均等待时间应该和平均发车时间是一致的。但是,不可能总是这么倒霉的,所以,你等车的平均时间不可能是平均发车时间,一定会比这个值小才合理。
终于更新blogg了
指数分布是因为等待时间no memory!
看了一下给的链接,
或许这样更好理解
同一趟公交车,每个站之间的距离不同,需要等待的时间也就不同,
所以乘客在等车时,有可能落进长间隔等车区,也有可能落进短间隔区,
而因为乘客等车时,下一班车离站的距离(或时间)是随机的,比如,
在一个全时需要3分钟的车站,我去到开始等车时,下一班车可能离这站还有的时间(1分钟、2.5分钟,或2.999分钟,我恰好错过了上班车)是随机的,
所以,我的期待等车时间是3/2=1.5分钟,
所以,总的等待时间应该是 总的间隔时间(即一条公交线上,所有车站间的行车时间的平均)的一半,即5分钟
可是 乘客落进长间隔车站等车的概率是更大的,所以大于了5分钟,
当然,用发车间隔来比喻也行得通,但以上解释或许更易理解
不理解为什么发车间隔长度服从指数分布 λe-λx ,就是说均匀分布为什么能用泊松过程的结论?
公式方面的是看不太懂,文字部分稍微明白,因为假设发车完全随机,这样就和站的距离和你到站时是否刚好有车离开没有关系,等车的时间就和平均发车时间一样。
前面的推导叫代数,最后一段分析叫数学,大部分评论……嗯……
数学没有学好
感谢楼主开拓思维,个人观点:一般公交车站,如果说是10mins一班,会在始发站进行控制,并对车在始发站的等候时间留有余量,到了10mins才发车。即使在始发站不进行控制,每天到了末班车会清零,第二天重新开始,不会到完全随机的状态。这里运算的条件感觉是一条线不停的开啊开,始发站不去运营的情况,在真实社会中基本不太会达到。。真实的情况平均等候时间应该是比5mins稍微大一点点,等公交这个事情,基本上不是随机的,感觉。。
那么如果发车间隔能够确定在十分钟的话,等车的平均等待时间就变成5分钟了么?
那么在平均发车间隔不变的情况下,发车的随机性会影响等待时间么?- –
同LS,为什么发车的随机性影响等待时间。。。
我用程序模拟了下,发车时间间隔随机的100-200之间,选择发车200趟。平均发车时间为150。
总时间大概为 150*200, 然后选择乘客在random(150*200)间到达车站,无论模拟多少次,等待时间都为70~80之间,也就是150/2。
程序在这里:
http://ideone.com/JiifH
出发时间改为[0, 100]。
average bus time 49.7823
average wait time 32.77054
程序模拟的结果同LS,表示不理解。。
我错了。。
20L的模拟方法有问题。实际上,对于一种确定的发车方式,我们可以计算出平均的等车时间。也就是说,不应当模拟乘客的到达时间,因为平均等车时间可以计算,而应当对发车方式进行随机处理。我对发车20000次,平均间隔100000进行模拟,结果是相当准的。。
回10楼,你会发现你总是那么倒霉落在了发车间隔较长的那段,于是最后你的平均等待时间,较多的包含了长发车间隔的部分而较少包含短发车间隔的那部分,所以导致最后结果大于一半的平均发车间隔。不过看了结论之前,我也没想到竟然两者会相等。
传说中exponential distribution 的lack of memory property~~~
…怎么来的晚了….
也就是函数构型不同,同样的特性参数会差别很多呢……
好久没来了,觉得思维都快僵硬了,不行啊。。。得积极向上了。。。
太强了,至少我等车的时候没寻思这种问题。。
如果发车间隔是指数分布,均值(期望)是10分钟,那么平均等待时间是10分钟。
要是发车时间不随机,就是10分钟一般,这时候均值是10分钟,平均等待时间应该是5分钟;要是发车间隔是均匀分布,比如a-b分钟均匀分布,那么平均等待时间应该是W = 1/2 * E(X^2)/E(X), 可以用公式套出结果。所以实际等待时间是根据发车间隔的分布决定的,不一定是10分钟。
假設不太認同……
我常等車,也很想算一次,只是遲遲沒下手,因爲想著就算算出來,車也不會提前來……
我觉得楼主的分析之所以和直觉不一样是因为楼主是在时间线上平均,而人们的直觉是在次数上平均。如果按次来平均的话,等待时间的均值应该是发车间隔均值的一半。
我有个问题,假如一辆车的发车间隔是固定的,就是10min,那么对于某个车站来讲,它的到站时间间隔会是什么分布?是正态分布吗?
嗯……没有接触过泊松过程的读者,一上来面对那个指数分布肯定会晕……
指数分布具有无记忆性,这个结果并不奇怪。但公交车的间隔时间恐怕一般并非是指数分布。
大赞, 大牛写的就是我的情况, 每天都要等一班间隔10min的车. 所以我也考虑过这个问题, 不过一直懒于坐下来慢慢思考.
去得早不如去得巧哦
每天等公交总感觉时间特别的漫长
恩 说的很不错 这句话很让人明白
太难了,看头晕了。
哪个臭公交车公司
这么差 看我投诉