Астрология попадания. Хоккей с рулеткой.
Часть II
Первую часть читайте по этой ссылке: http://178024_thbj70.radius-host.net/?p=616
3. Работа с базой хоккеистов НХЛ.
В процессе работы над статьей – к нам в руки попала довольно неплохая база хоккеистов, играющих в НХЛ, и мы уже с ней начали работать.
Было бы большим грехом на этом закончить и, в надежде, что какой-нибудь очередной 1001-й горе-исследователь, прочитав этот материал, избежит наступания на грабли, по которым не раз хаживали его предшественники, в том числе и Ваш покорный слуга, — не продемонстрировать некоторые научно обоснованные методы проведения такого рода исследований в астрологии.
Начнем с анализа свойств базы, выложенной на сайте НХЛ.
Всего база содержит 2187 записей с датами рождения между 1970 и 1994 годами.
По годам рождения — записи распределены весьма неравномерно. На первую четверть приходится всего 1.6% записей, а последнюю – больше 50%.
В плане сглаженности,- график распределения далек от идеального, хоть основной тренд виден невооруженным глазом. Впрочем, в мире ничего не бывает идеального.
Основной тренд обусловлен естественной текучкой кадров. Старое поколение игроков постепенно уходит, а на смену к нему приходит новое.
Кроме того, на форму графика, очевидно, влияют такие факторы, как: случайные флуктуации (база не на столько большая), колебания рождаемости в каждой из стран, экономические факторы (в годы кризиса финансирование команд обычно меньше, поэтому новых игроков берут реже, а когда кризис заканчивается – подрастает уже новое поколение, у которого больше шансов пробиться в «большой спорт»), политика руководства команд в данный момент времени (некоторые тренеры могут отдавать предпочтение опытным игрокам, в то время как другие чаще делают ставку на молодое поколение), и множество иных факторов. Все это просто невозможно учесть, но к счастью в соответствии с центральной предельной теоремой – большая часть из них (но далеко не все) просто компенсирует друг друга, сводя «неровности» распределения к минимуму.
Кроме того, — на форму графика могут влиять и астрологические факторы.
Поэтому, дабы случайно не выплеснуть вместе с водой ребеночка (например, эти «неровности» на графике вполне могут коррелировать с распределением какой-нибудь планеты в зодиаке) — в данном случае будет целесообразно аппроксимировать график и дальше работать с аппроксимацией при вычислении теоретических частот.
График распределения выглядит так:
Рис. 4. Распределение базы хоккеистов НХЛ по годам рождения.
Увы, это далеко не все «не идеальности».
Любая планета, кроме, пожалуй, Солнца с Луной, – распределяется в знаках зодиака очень неравномерно даже на больших интервалах времени. Основная причина этому ретроградность, но есть и другие астрономические факторы, которые на это влияют.
Например, вот так распределялась Венера в 1970, 1980, 1990 и в сумме за весь период с 1970 по 1994 годы:
Рис. 5. Особенности распределения Венеры в знаках.
По остальным планетам распределения можно посмотреть в, прилагаемом файле с исходными данными.
К сожалению, — подобные эффекты характерны для всех планет, причем, даже, на интервалах времени в сотни лет. Нам придется все это учитывать, если мы хотим найти астрологические, а не астрономические факторы.
И, наконец, 3 группа факторов, которая заметно влияет на итоговое распределение,- это сезонные колебания рождаемости. Весной и летом рождаемость в северном полушарии выше, чем осенью и зимой. Так что, несмотря на то, что астрономически в течение года Солнце в зодиаке распределяется почти равномерно (с отклонениями в доли процента), — распределение Солнца в картах реальных людей весьма отличается от идеальной модели.
К счастью, эти колебания повторяются из года в год, а к сожалению, — они зависят от широты и климата.
В моем распоряжении есть 2 источника информации о сезонных колебаниях рождаемости, каждый со своими недостатками:
- Данные из АДБ. Достоинство этой базы в том, что в ней представлены люди, родившиеся на разных широтах. А недостаток в том, что — на разных полушариях. А я с трудом представляю себе коренных африканских хоккеистов да еще в НХЛ. Но тем не менее, — даже у африканского царя шансов попасть в АДБ явно меньше, чем у простого провинциального американского бухгалтера-гея. К тому же, — основная часть населения Земли все же живет в северном полушарии. Так что, именно тенденции северного полушария доминируют в АДБ.
- Данные по рождениям, взятые из базы Мишеля Гоклена. Достоинство в том, что в ней представлено только северное полушарие. А недостаток в том, что только Париж и его окрестности.
Рис. 6. Влияне сезонных колебаний рождаемости на распределение Солнца.
Гокленовский вариант ближе всего к истине, потому что абсолютное большинство хоккеистов родились в северном полушарии. Но и вариант АДБ тоже со счетов сбрасывать не стоит, тем более что оба варианта неплохо коррелируют между собой. Поэтому было решено посчитать Солнце дважды с использованием обеих поправок.
Сезонные колебания рождаемости так же сказываются на распределении Меркурия и, в меньшей степени, — Венеры, в виду того, что эти планеты не отходят далеко от Солнца. В значительной степени – они – представляют собой «размазанный» вариант аналогичных поправок для Солнца.
Увы, из-за того, что расстояние между Венерой с Меркурием и Солнцем тоже распределяется неравномерно, расчет этих поправок, если это делать по-хорошему, – подразумевает довольно громоздкие и трудоемкие вычисления. Цель же статьи в том, чтобы познакомить читателей с принципами, а не в проведении исследования со строгим учетом всех нюансов. Поэтому в рамках данного исследования мы их считать не будем.
Вместо этого воспользуемся их аппроксимацией.
Исходя из того факта, что Меркурий не может отдаляться от Солнца больше чем на один знак, — мы можем просто взять поправки на сезонную рождаемость от Солнца и усреднить их, сложив поправки на каждый знак с двумя соседними, и разделив их на 3. А исходя из того факта, что Венера не отдаляется от Солнца больше чем на полтора знака – мы можем еще раз взять поправки от Меркурия, еще раз их усреднить, а потом сложить с ними же.
В результате у нас получатся вот такие распределения:
Рис. 7. Приблизительное влияние сезонных колебаний рождаемости на распределение Меркурия и Венеры в сравнении с Солнцем.
Единственная планета, которая на больших интервалах времени распределяется почти равномерно и не требует поправок –Луна. Но и тут, увы. Годовые циклы Солнца и Луны не синхронизированы между собой, поэтому в течение года Луна в некоторых знаках зодиака бывает чуть чаще, а в некоторых чуть реже, а в виду того, что значительная часть базы (50%) приходится на период с 1989 по 1994 годы – нам придется посчитать и поправки на Луну.
Теперь у нас достаточно данных для того, чтобы приступить к расчету теоретических частот. Получаются они путем перемножения распределений планет за каждый год на относительные частоты за соответствующие года, и последующего суммирования результата по каждому знаку. В общем,- процедура довольно громоздкая, поэтому её подробно расписывать не буду. Кому интересно могут заглянуть в файлы с расчетами, которые я прилагаю к статье.
Надеюсь, что мы правильно посчитали все поправки. Вот такая у нас получилась теоретическая модель того, как должны распределяться планеты в данной базе:
Рис. 8. Теоритические частоты.
А вот так планеты распределились на практике:
Рис. 9. Распределение планет в знаказ в базе хоккеистов Национальной Хоккейной Лиги
Теперь мы вполне можем применить как-нибудь серьёзный статистический тест и посмотреть, нет ли каких значимых отклонений от теоретической модели. Строго говоря, результаты такого теста могут быть доказательством того, что исследуемые данные вписываются или не вписываются в теоретически построенную модель, но никак не являются доказательством того, что какая-то планета астрологически как-то предрасполагает или не предрасполагает к занятию хоккеем.
Воспользуемся Хи-квадрат критерием.
Рис. 10. Хи-квадрат тест и вероятности того, что в базе хоккеистов данные приймут такие значения, как они приняли.
На первый взгляд – Марс, Солнце, Венера и Меркурий, в общем и целом, — не вписываются в теоретически рассчитанную модель на уровне значимости не больше 0.01 (вероятность, что это так > 99.9%).
Марса во Льве явно многовато будет (с вероятностью около 75%), Солнца в Тельце – тоже, если пользоваться поправками из АДБ, но АДБ мы взяли скорей для сравнения. Поправки по базе Гоклена куда валидней будут, а они дают вполне вероятную вероятность.
Тут еще нужно принять к сведению, что, несмотря на то, что мы взяли достаточно строгие критерии, — мы не учли очень многого. Например, мы не знаем какие были колебания рождаемости в каждой из стран, где родились хоккеисты и взять эту информацию нам просто не от куда. Так что остается только надеяться, что эти факторы скомпенсировали друг друга.
А вот с Венерой явно творятся странности. В Скорпионе она оказалась всего 126 раз, вместо 206 теоретически предсказанных. При таком объеме выборки – вероятность этого очень небольшая, всего 0,0018. Возможно, мы учли не все поправки, но я не думаю, что даже после учета их картина заметно изменится.
Продолжение возможно следует…
Виталий Иванченко.
Приложения:
1. Книга в формате MS Excel с расчетами. hokeist.xlsx
2. Книга в формате MS Excel с поправками (30 мб). popravki.xlsx
Ссылки:
1. С. Рыбаков. «Астрология спорта. Хоккей с шайбой».
2. NHL. База хоккеистов.
3. База АДБ.
4. База Мишеля Гоклена.