Астрология попадания.  Хоккей с рулеткой. 

Часть II

Первую  часть читайте  по этой ссылке:  http://178024_thbj70.radius-host.net/?p=616

3. Работа с базой хоккеистов НХЛ.

В процессе работы над статьей – к нам в руки попала довольно неплохая база хоккеистов, играющих в НХЛ, и мы уже с ней начали работать.

Было бы большим грехом на этом закончить и, в надежде, что какой-нибудь очередной 1001-й горе-исследователь,  прочитав этот материал, избежит наступания на грабли, по которым не раз хаживали его предшественники,  в том числе и Ваш покорный слуга,  — не продемонстрировать некоторые  научно обоснованные методы проведения такого рода исследований в астрологии.

Начнем с анализа свойств базы, выложенной на сайте НХЛ.

Всего база содержит 2187 записей с датами рождения между 1970 и 1994 годами.

По годам рождения — записи распределены весьма неравномерно.  На первую четверть приходится всего 1.6% записей, а последнюю – больше 50%.

В плане сглаженности,-  график распределения далек от идеального, хоть  основной тренд виден невооруженным глазом.  Впрочем, в мире ничего не бывает идеального.

Основной тренд обусловлен естественной текучкой кадров. Старое поколение игроков постепенно уходит, а на смену к нему приходит новое.

Кроме того, на форму графика, очевидно,  влияют такие факторы, как: случайные флуктуации (база не на столько большая), колебания рождаемости в каждой из стран,  экономические факторы (в годы кризиса финансирование команд обычно меньше, поэтому новых игроков берут реже, а когда кризис заканчивается – подрастает уже новое поколение, у которого больше шансов пробиться в «большой спорт»), политика руководства команд  в данный момент времени (некоторые тренеры могут отдавать предпочтение опытным игрокам, в то время как другие чаще делают ставку на молодое поколение), и множество иных  факторов. Все это просто невозможно учесть, но к счастью в соответствии с центральной предельной теоремой – большая часть из них (но далеко не все) просто компенсирует друг друга, сводя «неровности» распределения к минимуму.

Кроме того, — на форму графика могут влиять и астрологические факторы.

Поэтому, дабы случайно не выплеснуть вместе с водой ребеночка (например, эти «неровности» на графике вполне могут коррелировать  с  распределением какой-нибудь планеты в зодиаке) — в данном случае будет целесообразно аппроксимировать  график  и дальше работать с аппроксимацией при вычислении теоретических частот.

График распределения выглядит так:

Рис. 4. Распределение базы хоккеистов НХЛ по годам рождения.

Рис. 4. Распределение базы хоккеистов НХЛ по годам рождения.

Увы,  это далеко не все «не идеальности».

Любая планета, кроме, пожалуй, Солнца с Луной, – распределяется в знаках зодиака очень неравномерно даже на больших интервалах времени. Основная причина этому ретроградность, но есть и другие астрономические факторы, которые на это влияют.

Например,  вот так распределялась Венера в 1970, 1980, 1990 и в сумме за весь период с 1970 по 1994 годы:

Рис. 5. Особенности распределения Венеры в знаках.

Рис. 5. Особенности распределения Венеры в знаках.

 

По остальным планетам распределения можно посмотреть в, прилагаемом файле с исходными данными.

К сожалению, — подобные эффекты характерны для всех планет, причем, даже, на интервалах времени в сотни лет. Нам придется все это учитывать, если мы хотим найти астрологические, а не астрономические факторы.

И, наконец, 3 группа факторов, которая заметно влияет на итоговое распределение,-  это сезонные колебания рождаемости.  Весной и летом рождаемость в северном полушарии выше, чем осенью и зимой. Так что, несмотря на то, что астрономически в течение года Солнце в зодиаке распределяется почти равномерно (с отклонениями в доли процента), — распределение Солнца в картах реальных людей весьма отличается от идеальной модели.

К счастью, эти колебания повторяются  из года в год, а  к сожалению, — они зависят от широты и климата.

В моем распоряжении есть 2 источника информации о сезонных колебаниях рождаемости,  каждый со своими недостатками:

  1. Данные из АДБ.  Достоинство этой базы в том, что в ней представлены люди, родившиеся на разных широтах.  А недостаток в том, что — на разных полушариях. А я с трудом представляю себе коренных африканских хоккеистов да еще в НХЛ. Но тем не менее,  —  даже у африканского царя шансов попасть в АДБ явно меньше, чем у простого провинциального американского бухгалтера-гея. К тому же, — основная часть населения Земли все же живет в северном полушарии. Так что, именно тенденции северного полушария доминируют в АДБ.
  2. Данные по рождениям, взятые из базы Мишеля Гоклена. Достоинство в том, что в ней  представлено только северное полушарие. А недостаток в том, что только Париж и его окрестности.

Рис. 6. Влияне сезонных колебаний рождаемости на распределение Солнца.

Рис. 6. Влияне сезонных колебаний рождаемости на распределение Солнца.

 

Гокленовский вариант ближе всего к истине, потому что абсолютное большинство хоккеистов родились в северном полушарии.  Но и вариант АДБ тоже со счетов сбрасывать не стоит, тем более что оба варианта неплохо коррелируют между собой. Поэтому было решено  посчитать Солнце дважды с использованием обеих поправок.

Сезонные колебания рождаемости так же сказываются на распределении Меркурия и, в меньшей степени,  — Венеры, в виду того, что эти планеты не отходят далеко от Солнца.  В значительной степени – они  – представляют собой «размазанный» вариант аналогичных поправок для Солнца.

Увы, из-за того, что расстояние между Венерой с Меркурием и Солнцем тоже распределяется неравномерно, расчет этих поправок, если это делать по-хорошему, – подразумевает довольно громоздкие и трудоемкие вычисления. Цель же статьи  в том, чтобы познакомить читателей с принципами, а не в проведении исследования со строгим учетом всех нюансов.  Поэтому в рамках данного исследования мы их считать не будем.

Вместо этого воспользуемся их аппроксимацией.

Исходя из того факта, что Меркурий не может отдаляться от Солнца больше чем на один знак, — мы можем просто взять поправки на сезонную рождаемость от Солнца и усреднить их, сложив поправки на каждый знак с двумя соседними, и разделив их на 3. А исходя из того факта, что Венера не отдаляется от Солнца больше чем на полтора знака – мы можем еще раз взять поправки от Меркурия, еще раз их усреднить, а потом сложить с ними же.

В результате у нас получатся вот такие распределения:

Рис. 7. Приблизительное влияние сезонных колебаний рождаемости на распределение Меркурия и Венеры в сравнении с Солнцем.

Рис. 7. Приблизительное влияние сезонных колебаний рождаемости на распределение Меркурия и Венеры в сравнении с Солнцем.

 

Единственная планета, которая на больших интервалах времени распределяется почти равномерно и не требует поправок –Луна. Но и тут, увы. Годовые циклы Солнца  и Луны не синхронизированы между собой, поэтому в течение года Луна в некоторых знаках зодиака бывает чуть чаще, а в некоторых чуть реже, а в виду того, что  значительная часть базы (50%) приходится на период с 1989 по 1994 годы – нам придется посчитать и поправки на Луну.

Теперь у нас достаточно данных для того, чтобы приступить к расчету теоретических частот. Получаются они путем перемножения распределений планет за каждый год на относительные частоты за соответствующие года, и последующего суммирования результата по каждому знаку. В общем,- процедура довольно громоздкая, поэтому её подробно расписывать не буду. Кому интересно могут заглянуть в файлы с расчетами, которые я прилагаю к статье.

Надеюсь, что мы правильно посчитали все поправки. Вот такая у нас получилась теоретическая модель того, как должны распределяться планеты в данной базе:

Рис. 8. Теоритические частоты.

Рис. 8. Теоритические частоты.

А вот так планеты распределились на практике:

Рис. 9. Распределение планет в знаказ в базе хоккеистов Национальной Хоккейной Лиги

Рис. 9. Распределение планет в знаказ в базе хоккеистов Национальной Хоккейной Лиги

Теперь мы вполне можем применить как-нибудь серьёзный статистический тест и посмотреть, нет ли каких значимых отклонений от теоретической модели. Строго говоря, результаты такого теста могут быть доказательством того, что исследуемые данные вписываются или не вписываются в теоретически построенную модель, но никак не являются доказательством того, что какая-то планета астрологически как-то предрасполагает или не предрасполагает к занятию хоккеем.

Воспользуемся Хи-квадрат критерием.

Рис. 10. Хи-квадрат тест и вероятности того, что в базе хоккеистов данные приймут такие значения, как они приняли.

Рис. 10. Хи-квадрат тест и вероятности того, что в базе хоккеистов данные приймут такие значения, как они приняли.

 

На первый взгляд – Марс, Солнце, Венера и Меркурий, в общем и целом, — не вписываются в теоретически рассчитанную модель на уровне значимости не больше 0.01 (вероятность, что это так  > 99.9%).

Марса во Льве явно многовато будет (с вероятностью около 75%), Солнца в Тельце – тоже, если пользоваться поправками из АДБ, но АДБ мы взяли скорей для сравнения.  Поправки по базе Гоклена куда валидней будут, а они дают вполне вероятную вероятность.

Тут еще нужно принять к сведению, что, несмотря на то, что мы взяли достаточно строгие критерии, — мы не учли очень многого. Например, мы не знаем какие были колебания рождаемости в каждой из стран, где родились хоккеисты и взять эту информацию нам просто не от куда. Так что остается только надеяться, что эти факторы скомпенсировали друг друга.

А вот с Венерой явно творятся странности. В Скорпионе она оказалась всего 126 раз, вместо 206 теоретически предсказанных. При таком объеме выборки – вероятность этого очень небольшая, всего 0,0018. Возможно, мы учли не все поправки, но я не думаю, что даже после учета их картина заметно изменится.

Продолжение возможно следует…

Виталий Иванченко.


Приложения:
1. Книга в формате MS Excel с расчетами.       hokeist.xlsx
2. Книга в формате MS Excel с поправками  (30 мб).  popravki.xlsx
Ссылки:
1. С. Рыбаков. «Астрология спорта. Хоккей с шайбой». 
2. NHL. База хоккеистов.
3. База АДБ.
4. База Мишеля Гоклена.