Как высчитывается коэффициент Джинни и что это такое (для чайников)?

410
1
0
14 ноября
20:55
ноябрь
2015

Есть несколько способов вычисления коэффициента Джинни, но самый простой и понятный следующий. Предположим, в стране или где-то есть какое-то количество "домохозяйств", ну или еще каких-то единичных получателей дохода, не суть важно, кого именно мы выберем в качестве единичного получателя, главное, чтобы все они были одного сорта и вместе получали весь рассматриваемый нами доход.

Тогда есть такая штука "доля дохода", то есть отношение получаемого данным единичным получателем дохода ко всему доходу вообще. Это какая-то величина не больше единицы и не меньше нуля, очевидно. Можно посчитать среднее арифметическое долей дохода, то есть просуммировать все доли и поделить их на число "домохозяйств".

Теперь мы сделаем следующее, возьмем одно из этих "домохозяйств" и посчитаем разности его доли с долями каждого из других "домохозяйств", то есть получим n чисел, если у нас n "домохозяйств" (самого с собой мы его тоже сравним и получим, естественно, 0). Потом мы возьмем все эти n чисел, возьмем их модули, чтобы они все стали положительными и просуммируем эти модули. Модули - это для того, чтобы разница долей накапливалась, независимо от того, больше доход нашего выбранного "домохозяйства", чем у того, с которым мы в данный момент сравниваем, или меньше.

Что у нас при этом может получиться? Если доходы распределены абсолютно равномерно (идеальный случай - все "домохозяйства" получают равные доли), то, очевидно, каждая из разностей будет равна нулю и мы получим 0. Если же доходы распределены абсолютно неравномерно (другой идеальный случай - весь доход забрало какое-то одно "домохозяйство"), то возможно два варианта: мы получим либо (n-1), в случае, если мы выбрали то "домохозяйство", которое забрало весь доход, либо 1, если мы выбрали любое другое, бездоходное "домохозяйство". Это получится, поскольку доля одного "домохозяйства" равна 1 ("весь доход поделить на весь доход"), а всех остальных - 0.

Теперь мы проделаем такой же финт со всеми другими домохозяйствами, то есть выберем каждое из них в качестве объекта сравнения и получим n таких вот сумм разностей долей. И просуммируем эти суммы разностей.

Что мы теперь получим? Если доход абсолютно равномерно распределен, то так и останется 0, поскольку все разности между любыми из двух долей доходов будут нулевыми. А если доход абсолютно неравномерен, то мы получим (n-1) - один раз, когда выбрали это счастливое "домохозяйство", и (1) - n-1 раз (во всех остальных случаях). В сумме, как несложно увидеть это будет 2(n-1). Если число домохозяйств n - достаточно велико, то это примерно равно 2n (для меня сюрприз, что это неточная формула, может я где-то напортачил с выводом? Должно-то было бы сразу получиться 2n. Ну, не суть важно для понимания основной идеи).

Все остальные случаи займут какое-то промежуточное место между 0 и 2n.

Дальше мы производим нормировку на 1. Это делается чтобы убрать зависимость итога нашего расчета от n. То есть, чтобы по коэффициенту Джинни на одной шкале можно было сравнивать множества с разным количеством элементов n. Для этого мы разделим полученное значение на 2n^2 (это значит в квадрате) и еще на среднее арифметическое долей дохода одного домохозяйства тоже разделим. Почему на такую величину? Давайте рассмотрим предельные случаи.

Если у нас получилось абсолютное равенство доходов, то тут как ни нормируй, все равно останется 0. А вот если мы возьмем абсолютное неравенство, то будет хитрее. Мы получили в сумме 2n. Если мы делим это на 2n^2, то получаем, очевидно, 1/n. Теперь мы делим это на среднее арифметическое долей дохода, то есть на сумму всех долей деленную на n. А что такое сумма всех долей в случае абсолютного неравенства? Это сумма n-1 нулей и единицы, то есть в сумме мы имеем 1. Если поделить это на число домохозяйств n, то тоже получится 1/n. То есть мы 1/n делим на 1/n. В результате, естественно, получаем 1.

Вот два наших предельных значения коэффициента Джинни, который фактически показывает степень неравномерности доходов единичных получателей дохода: 0 - абсолютное равенство, 1 - абсолютное неравенство. Промежуточные варианты будут лежать между этими значениями при такой нормировке, это можно показать, но это сложнее, я не буду и так уже огромный текст.

11
0
Если вы знаете ответ на этот вопрос и можете аргументированно его обосновать, не стесняйтесь высказаться
Ответить самому
Выбрать эксперта