Simpson多样性指数与市场垄断
相信很多做生物多样性研究的人,对 Simpson 指数(Simpson Index) 都不陌生。和香农指数相比,它的公式看起来更简单,却常常更"接地气"------因为它抓住了一个非常直观的问题:一个群落里,是不是有某个物种"太强势"了?Simpson 指数最常见的表达式是:
其中:
-
:Simpson 指数 -
:物种总数 -
:第 个物种的相对丰度
这个公式看起来平平无奇,但它背后的想法很有意思:如果我们从群落里随机抽取两个个体,这两个个体恰好属于同一个物种的概率有多大?
而这个概率,正好就是 。
也就是说,Simpson 指数本质上是在衡量撞上同一种的概率。 如果这个概率很高,说明群落里往往是少数优势种占了大头,多样性就不高; 如果这个概率很低,说明个体分布更均匀,多样性就更高。所以,和香农指数强调"信息不确定性"不同,Simpson 指数更像是在问: 这个生态系统,是否已经被少数物种"垄断"了?
Simpson 指数的起源
Simpson 指数由英国统计学家 Edward H. Simpson提出。生态学家之所以喜欢这个指标,是因为它既容易计算,又有很强的解释性。
和一些更抽象的多样性度量不同,Simpson指数非常强调优势种的影响。 在一个群落中,假如某个物种数量特别多,那么它的相对丰度 会很大,而平方之后会变得更显著,于是整个指数就会明显上升。这意味着 Simpson 指数对一家独大特别敏感。这也是它在生态学里一个很有价值的地方: 有时候,一个群落表面上看物种数不少,但如果绝大多数个体都属于一两个物种,那么这个群落的真实多样性,其实并没有看上去那么高。
Edward Simpson
Edward Simpson 在统计学中还有另一个更出名的名字:Simpson 悖论(Simpson's paradox)。这个悖论告诉我们,有时候,分组数据里每一组都呈现出一种趋势,但把所有组数据合并之后,趋势却可能反过来。这件事听起来很反直觉,却提醒我们一个很重要的事实:数据的整体结构,往往比表面数字更重要。这和 Simpson 指数的思想其实有某种相通之处。在研究生物多样性时,光看"物种数"还不够,我们还得看这些个体是如何分布的。十个物种平均分配,和十个物种里一个占了90%,显然不是同一种生态状态。
为什么要平方?
Simpson 指数最核心的地方,就是这个平方:
为什么不是 ,也不是别的?
因为平方会让大数更大,小数更小。举个简单的例子。假设一个群落里有四个物种。
群落 A:非常均匀
-
物种1:25% -
物种2:25% -
物种3:25% -
物种4:25%
那么:
群落 B:一个优势种特别明显
-
物种1:70% -
物种2:10% -
物种3:10% -
物种4:10%
那么:
可以看到,虽然两个群落的物种总数都是4,但群落 B 的 Simpson 指数明显更高。这说明:群落 B 中随机抽到两个同种个体的概率更高,也就是说它更容易"撞种",群落被优势种支配得更明显。
Simpson 指数到底是"越大越多样",还是"越小越多样"?
这是很多初学者第一次接触 Simpson 指数时最困惑的地方。因为文献里常见的其实有三种写法:
1)原始 Simpson 指数
这个版本里:
-
越大,表示多样性越低 -
越小,表示多样性越高
因为它代表的是"抽中同一种的概率"。
2)Gini-Simpson 指数
这个版本里:
-
越大,表示多样性越高它表示的是:随机抽取两个个体,它们属于不同物种的概率
这个解释其实非常直观,所以很多生态学研究更喜欢用这个版本。
3)Simpson 倒数指数
这个版本里值越大,表示多样性越高。它有一个很有意思的解释: 如果一个群落中所有物种完全均匀,那么 可以被理解为"有效物种数"。也就是说,它告诉你:这个群落的多样性,相当于多少个丰度相等的物种组成的群落。
市场集中度
如果说香农指数适合拿来类比"信息量",那么 Simpson 指数特别适合类比经济学中的市场集中度。假设一个行业里有很多公司:
-
公司A 占市场 70% -
公司B 占 10% -
公司C 占 10% -
公司D 占 10%。
一个看起来"物种不少"的群落,可能实际上已经被某个优势种主导。 此时,群落的功能稳定性、抗干扰能力,以及对环境变化的响应,都可能和一个真正均匀的高多样性群落不一样。所以 Simpson 指数衡量的是这个系统是不是过于集中。
写论文时一定要说清楚你用的是哪一种
由于 Simpson 指数有多个版本,写作时最怕的一件事就是只写了"Simpson 指数",却没说明具体公式。
-
越大,可能意味着多样性越低 -
越大,则意味着多样性越高 -
越大,也意味着多样性越高
如果不把公式写清楚,读者很容易误解结果方向。所以,比较稳妥的写法通常是:
-
明确给出公式 -
说明使用的是 Simpson's D、Gini-Simpson,还是 reciprocal Simpson -
解释数值增大到底代表什么生态意义


评论