10 факторов, влияющих на результат футбольного матча

Сейчас читаю книгу «Сигналы и Шум» господина Нейта Сильвера
Эта книга, как и большинство импортной литературы написана в стиле: одна здравая мысль омывается литрами воды из разных источников. Мне лично заходит довольно не плохо такая манера подачи информации. Читается достаточно легко, ну и основная мысль усваивается.
Книга, как ни странно, посвящена прогнозам, и основная мысль в том, что в мире огромное количество информации, которая максимум, что может дать, – это понятие о самых общих тенденциях процесса. И является, по сути, шумом, засоряющим эфир. А есть информация, которой мало, и именно она является сигналом указывающим на реальную тенденцию, назовем это так. И основной задачей в прогнозировании, опять же, по мнению автора, является верное отделение сигналов от шума.
Есть в книге и множество моментов посвященных ставкам на спорт и спорту. Читаю отрывками, начал с главы 8, поэтому и приведу пример оттуда. Там рассказывается об американском каппере Бобе Вулгаресе, который чудом поднялся на шальной ставке Ва-Банком на Лейкерс с диким перевесом над линией. После этого он стал ставить уже в соотвествии с БРМ и на плаву до сих пор.
Секретом его называется то, что после того как его машинка определяет общую вероятность события на основе основной массы информации, в числе которой и просто шум, и дает ему список событий с минимальным перевесом по её мнению. Далее уже Боб, который очень внимательно следит за НБА, и даже якобы обладает небольшой аналитической службой, шлифует прогноз на события находя перевес над линей с помощью информации-сигнала. Для разных типов ставок, информация может быть разная: от востребованности одним из игроков в хорошем контракте на следующий сезон до записи в инстаграме о вечеренке у одного из игроков. В этой же главе в общих чертах указывается как к этому прикрутить модельку на основе теоремы Байеса.
Так вот, совпали два события
1. Я решил собрать пул информации, на основании которой можно оценивать вероятность исхода в событии;
2. Я начал читать эту книгу.
Эти два события дали мысль попробовать оценить весь пул идей через критерий "шум/сигнал". Особенно это будет интересно в рамках того, что я хотел зафигачить модельку в прямом эфире и её публично потестить.
Мною и коллегой Колпинским определены следующие информационные потоки, на основании которых строится вероятность наступления футбольного события.
1. Последние результаты команд дома/на выезде. Данная информация позволяет определить общие тенденции: общую инфу она даст, перевес – нет. В целом, это шум.
2. Игра против забивных/ незабивных команд, хорошо/плохо обороняющихся. Нуууу такое... По средним значениям однозначно оценивается буками и является шумом, если эту статистику персонифицировать и уточнить, то она может стать сигналом, т.к. попаны так глубоко не роют.
3. Наличие/отсутсвие основных игроков. На мой взгляд эта инфа слабо учтена в ранней линии и является сигналом и уже полностью учтена в поздней линии и является шумом.
4. Отставки тренеров в топовых лигах - однозначно шум, т.к. сразу отражается инфа в линии. В низших лигах может служить и сигналом. 50/50 в целом оцениваю.
5. Влияние календаря. В целом ближе к шуму, т.к. буки так же изначально закладывают это в коэффициент.
6. Погода. Экстремальные отклонения типа температуры -20 градусов или сильный ветер в сторону одних из ворот – однозначно сигнал.
7. Совпадение интересов команд. Вроде, сигнал. Если владеть этой информацией в полной мере, то можно очень неплохо наживать, но добыть информацию в низких лигах по этому вопросу сложно.
Факторы, взятые у коллеги
8. Принципиальность матча – дерби. Считаю, что это сигнал, при разном уровне команд, например, недавняя игра Марсель – ПСЖ. Но – шум, при равном уровне команд, например, Спартак – ЦСКА.
9. Время матча. С этим уже все современные клубы научились бороться, поэтому отнесу к шуму.
10. Судья. При наличии тенденций в манере судейства – однозначно сигнал.
Вроде бы все из того, что было написано, в целом находится на поверхности. Совсем не взяли мы такие факторы, которые определяют уровень и класс игры: количество ТТХ команды, километраж, которые выдают игроки, умение реализовывать стандарты, умение играть против автобусов и прочих тактических упражнений. Всё перечисленное в этом абзаце может дать сигнал и, соответственно, перевес. Но где собирать эту статистку, а собирать её нужно автоматизированно, я не знаю и использовать, наверное, никогда не буду.
Пока, наверное, хватит. Много мыслей появилось в голове. Теперь нужно попробовать все факторы оцифровать, прикрутить к реальным событиям и потестить. Займемся этим в ближайшем будущем.
Понравился пост? Читайте также:
Самый зрелищный футбол – в Голландии, лучший – в Англии. А что с РПЛ?
Стратегия: как заработать на ставке ОЗ
Играешь на статистику? Стратегия: как ставить на количество угловых в матче