В связи с событиями в Балтиморе Washington Post сделал график, на котором показана продолжительность жизни в странах мира и в отдельных районах Балтимора. Самый верхний район Балтимора расположился между Японией и Сингапуром и занял бы четвертое есто в мире, а самый последний находится между Мадагаскаром и Йеменом. То есть в пределах одного города продолжительность жизни варьирует почти так же сильно, как и в мире! Я бы, конечно, ожидал большУю разницу, но эти данные просто сенсационны.
Кликабельно.

Кликабельно.

no subject
Date: 2015-04-30 10:40 pm (UTC)http://interfax.com.ua/news/general/263534.html
no subject
Date: 2015-04-30 10:46 pm (UTC)no subject
Date: 2015-04-30 10:48 pm (UTC)Меня бы скорее настораживал не сам разброс, а далеко идущие выводы из этого разброса ("пойти и все починить", ага).
no subject
Date: 2015-04-30 11:25 pm (UTC)В России, кстати, разброс между регионами сопоставим с разбросом по районам Балтимора - по официальным данным от 62 в Тыве до 79 в Ингушетии
no subject
Date: 2015-04-30 11:33 pm (UTC)Но в России между Ингушетией и Тывой и расстояние не 3 мили, а тут это расстояние по фривею можно за 3 минуты покрыть.
no subject
Date: 2015-04-30 11:50 pm (UTC)Люди умирают в разном возрасте. Средняя продолжительность жизни в 80 лет не значит, что все умирают в 80 лет. Шансы умереть постепенно растут с возрастом, но вероятность дожить до данного возраста падает, так что статистика смертей имеет широкий пик. Кроме того, "хвост" в сторону более молодых возрастов, естественно, длиннее, чем в сторону более пожилых. Поэтому редкие смерти в более молодых возрастах влияют на среднее непропорционально сильно.
Если всего в районе умирает 92 человека за год, то сравнительно молодых людей из них - единицы. Их вклад будет колебаться на десятки процентов. Конечно, лучше посидеть с реальными американскими данными и посчитать, но чисто умозрительно мне кажется, что ожидаемое колебание среднего возраста умерших в данном районе вполне может быть больше 10%.
Смотрим на график. Самая большая продолжительность жизни - примерно 83 года, самая маленькая - 63. Районов с высокой продолжительностью жизни - всего 4 из 55, без них разброс был бы гораздо меньше. В какой мере их место объясняется просто случайным отсутствием детских смертей и смертей молодых людей среди десятков умерших в каждом из них? Лучше всего, конечно, было бы построить такие графики за несколько последовательных лет и проследить, не прыгают ли те же районы вверх и вниз то в Японию, то в Йемен.
Если бы я на работе построил похожий график, и не указал бы, каков вклад случайной флуктуации в разброс, а каков - изучаемого эффекта, от меня бы, наверное, камня на камне не оставили. Но это же не работа, а просто газета, в газете можно.
no subject
Date: 2015-04-30 11:52 pm (UTC)no subject
Date: 2015-04-30 11:55 pm (UTC)no subject
Date: 2015-04-30 11:57 pm (UTC)no subject
Date: 2015-05-01 12:07 am (UTC)Но смысл в том, что это именно ожидаемая продолжительность жизни на момент рождения исходя из разных факторов. Может быть кто-нибудь лучше меня объяснит.
no subject
Date: 2015-05-01 12:10 am (UTC)Ведь это ожидамая продолжительнось жизни при рождении, то есть тут явно не в документах родителей дело.
no subject
Date: 2015-05-01 12:10 am (UTC)no subject
Date: 2015-05-01 12:32 am (UTC)Для большой популяции этот показатель (который Вики называет period LEB) имеет смысл. Скажем, у нас есть миллион человек, из которых 10,000 умерло в данном году.
1. Смотрим на распределение умерших по возрастам. Из наличных восьмидесятилетних умерло х%, из двадцатилетних - у%.
2. Предполагаем, что шансы человека умереть в каждом возрасте описываются этим распределением. На самом деле все понимают, что это не так: родившиеся в 1930 году чаще доживали до 80, чем родившиеся в 1900 году, поэтому мы думаем, что шансы родившихся в 2010 выше, чем шансы только что умерших восьмидесятилетних. Но что поделать - мы не можем пока померить, какие это шансы. Вот и берём нынешних восьмидесятилетних за основу.
3. Считаем среднее (сумма долей за каждый возраст, помноженных на возраст, поделённая на сумму долей).
Но для маленькой популяции надо как-то исключать флюктуации. Обычно усредняют за 5 или даже 10 лет, но для ещё меньших популяций и это не помогает.
Предположим, что из 100 восьмидесятилетних умерло 10, а из 200 двадцатилетних - 1. Шанс умереть в 80 лет - 10%, а в 20 - 0.5%. Ожидаемая продолжительность жизни - 77.1. А в другом районе - 10 и 2. Ожидаемая продолжительность жизни - 74.5. Ну прямо как Польша против Суринама.
no subject
Date: 2015-05-01 12:44 am (UTC)no subject
Date: 2015-05-01 12:56 am (UTC)no subject
Date: 2015-05-01 01:11 am (UTC)Я не говорю, конечно, что между районами Балтимора нет никакой разницы и что весь разброс случайный. Часть вклада в то, что мы видим на графике - наверняка из-за реальной и устойчивой разницы между районами. Но пока мы не знаем, какая это часть - половина там, а может 10% - воспринимать этот график всерьёз не получается.
А когда журналист про это не объясняет, зато радостно говорит, сколько именно районов живут меньше, чем северные корейцы, то выводов может быть три. Или он
неграмотныйнедостаточно талантлив, чтобы строить корректные графики. Или он делает это нарочно, понимая, что кажущаяся сенсационность его графика - частично результат его некорректности. Или комбинация того и другого.Посмотрите на ругань там в комментариях. Невозможно поверить, что журналист "не ведает, что творит".
no subject
Date: 2015-05-01 01:29 am (UTC)no subject
Date: 2015-05-01 01:48 am (UTC)no subject
Date: 2015-05-01 01:57 am (UTC)no subject
Date: 2015-05-01 01:58 am (UTC)no subject
Date: 2015-05-01 02:02 am (UTC)no subject
Date: 2015-05-01 02:04 am (UTC)Но результаты по продолжительности жизни просто повторяют социально-экономические характеристики районов. Они-то уже точно известны. То есть реальная разница тут должна быть ответственна за подавляющую часть вариаций, хотя за всю, конечно, она отвечать не может.
no subject
Date: 2015-05-01 02:05 am (UTC)no subject
Date: 2015-05-01 02:36 am (UTC)2.7 млн - это Балтиморская MSA, metropolitan statistical area - гор. Балтимор и пол дюжины соседних графств (включая одноименное Балтиморское). Но и это, очевидно, не оно - иначе у нас тут был бы всякий Аннаполис и проч.
2.2 млн. - это "городское" население этой самой MSA, непосредственно примыкающее к городу - грубо говоря, зона где плотность населения не падает ниже какого-то уровня. Но и там бы были перечислены соседнии городки.
Так что, именно 620 тысяч, население собственно города Балтимора в его административных границах, без графства. Милый квадратик.
no subject
Date: 2015-05-01 02:59 am (UTC)