Полная версия
Десять уравнений, которые правят миром. И как их можете использовать вы
– Букмекерские компании в Лондоне выросли так быстро и стали такими масштабными, что они вынуждены теперь делать ставки через брокеров. Иначе, если станет широко известно, что они делают определенную ставку на конкретный матч, на этот рынок хлынут все остальные и их преимущество исчезнет.
Несмотря на такие ограничения, деньги по-прежнему текут в букмекерские компании, которыми управляют уравнения. Достаточно посмотреть на стильные интерьеры их офисов в Лондоне, чтобы убедиться в этом. Сотрудники одного из лидеров отрасли, Football Radar, начинают день с бесплатного завтрака, имеют доступ в роскошный спортзал, могут сделать перерыв и поиграть в теннис или PlayStation и располагают всем необходимым компьютерным оборудованием. Специалистам по обработке данных и создателям программного обеспечения предлагают работать в свободное время, а компания утверждает, что гарантирует такую творческую среду, которая обычно ассоциируется с Google или Facebook.
В Лондоне базируются и два основных конкурента Football Radar – Smartodds и Starlizard. Они принадлежат соответственно Мэттью Бенхэму и Тони Блуму, карьера которых началась благодаря умению обращаться с числами. Бенхэм учился в Оксфорде, где начал работать в сфере азартных игр, основываясь на статистике, а Блум обладает опытом профессионального игрока в покер. В 2009 году оба они приобрели футбольные клубы из родных городов: Блум купил «Брайтон энд Хоув Альбион», а Бенхэм – «Брентфорд». Кроме того, второй решил добавить к своим активам и резкую букмекерскую контору Matchbook.
И Бенхэм, и Блум сумели использовать незначительное преимущество и с помощью больших данных получили колоссальные прибыли.
* * *Преимущество, которое я предложил Яну и Мариусу для вероятности победы их фаворита в каком-нибудь матче чемпионата мира, основано на следующем уравнении:
где x – коэффициент букмекера на победу фаворита. Коэффициент здесь понимается в британском формате: если он составляет 3 к 2 или x = 3/2, это означает, что на каждые поставленные 2 фунта в случае победы чистый выигрыш составляет 3 фунта.
Разберемся, о чем на самом деле говорит уравнение 1. Начнем с левой стороны, где я написал: «P{фаворит выигрывает}». Ни одна математическая модель не предсказывает победу или поражение с абсолютной точностью. Они говорят о вероятности того, что выиграет фаворит, и эта вероятность – число от 0 до 100 %. Оно определяет уровень уверенности, который я приписываю результату.
Эта вероятность зависит от того, что написано в правой части уравнения, куда входят три буквы: латинская x и греческие α и β. Одна студентка сказала мне, что математика казалась ей понятной, пока речь шла о латинских иксах и игреках, но стала трудной, когда начались греческие альфы и беты. Для математиков это звучит смешно, потому что x, α и β – только символы, они не делают науку проще или сложнее, так что я думаю, что студентка всего лишь шутила. Но она попала в точку: когда в уравнениях встречаются α и β, математика обычно сложнее.
Так что давайте начнем без них. Уравнение
понять гораздо проще. Если, скажем, коэффициент был 3/2 (2,5 в европейской системе или +150 в американской)[8], вероятность того, что фаворит выиграет, равна
По сути, это уравнение без α и β дает нам оценку букмекера для победы фаворита. Он считает, что шансы фаворита на победу в матче составляют 2/5, или 40 %. В остальных 60 % случаев будет ничья или победит аутсайдер.
Без α и β (точнее, при α = 1 и β = 1) мое уравнение ставок относительно несложно понять. Однако без α и β оно не принесет денег. Почему? Поставим 1 фунт на фаворита. Если коэффициент букмекера верен, два раза из пяти вы выиграете 1,5 фунта, а три из пяти проиграете по 1 фунту. Поэтому в среднем вы выиграете
Иными словами: после нескольких ставок вы почти ничего не выиграете. Нуль. Пшик. На деле всё еще хуже. Для начала я предположил, что коэффициенты букмекеров справедливы[9]. На самом деле нет. Букмекеры всегда подправляют их, чтобы ситуация складывалась в их пользу. И вместо того, чтобы предложить 3/2, заявят, скажем, 7/5. И если вы не знаете, что делаете, букмекеры всегда выиграют, а вы проиграете. При коэффициенте 7/5 вы будете в среднем проигрывать 4 пенса на ставку в 1 фунт[10].
Единственный способ обыграть букмекеров – рассмотреть эти числа, и именно такие данные компьютер Яна собирал после того, как мы посидели в пабе. Он скачал коэффициенты и результаты для всех матчей чемпионатов мира и Европы, включая отборочные игры, начиная с чемпионата мира в Германии в 2006 году. Утром, усевшись в моем офисе в университете, мы начали искать преимущество.
Сначала мы загрузили данные и посмотрели на них в таблице, подобной нижеприведенной.
Из таких прошлых результатов мы можем получить представление о том, насколько точны коэффициенты: для этого надо сравнить два последних столбца вышеприведенной таблицы. Например, в матче между Испанией и Австралией на чемпионате мира 2014 года коэффициенты дают вероятность 73 %, что Испания выиграет, и она действительно победила. Это можно считать «хорошим» прогнозом. А вот Коста-Рика обыграла Италию, хотя коэффициенты давали 63 % на победу итальянцев, – «плохой» прогноз.
Я пишу слова «хороший» и «плохой» в кавычках, поскольку нельзя сказать, хорош или плох прогноз, если нет альтернативы, с которой его можно сравнить. Вот здесь и появляются α и β. Их называют параметрами уравнения 1. Это величины, которые мы можем менять для тонкой настройки нашего уравнения, чтобы сделать его точнее. Мы не можем изменить итоговые коэффициенты для матча Испания – Австралия и определенно неспособны повлиять на результат этого матча сборных; но можем выбрать α и β так, чтобы получить более точный прогноз, чем у букмекеров.
Метод поиска наилучших параметров – логистическая регрессия. Чтобы описать, как она работает, сначала посмотрим, как можно улучшить наш прогноз на матч Испания – Австралия с помощью корректировки числа β. Если я приму β = 1,2 и оставлю α = 1, получу
Поскольку результатом матча была победа Испании, прогноз на победу в 77 % лучше, чем прогноз букмекеров, который давал 73 %.
Но здесь есть проблема. Если я увеличу β, то повышу и прогнозируемую вероятность победы Англии над Уругваем – с 51 до 52 %. Но Англия в том матче 2014 года уругвайцам проиграла. Чтобы справиться с этой проблемой, я могу увеличить другой параметр, назначив α = 1,1 и оставив при этом β = 1,2. Теперь уравнение предсказывает, что Испания обыграет Австралию с вероятностью 75 %, а Англия обыграет Уругвай с вероятностью 49 %. Изменив исходные значения α = 1 и β = 1, мы улучшили прогноз на оба матча.
Я рассмотрел по одному изменению каждого из параметров α и β и сравнил результаты всего по двум матчам. Данные Яна включали 284 матча на всех чемпионатах мира и Европы с 2006 года. Потребовалось бы очень много времени, чтобы вручную менять значения параметров, подставлять их в уравнение и смотреть, улучшают они прогноз или нет. Однако мы можем использовать для вычислений компьютерный алгоритм; именно это и делает логистическая регрессия (см. рис. 1). Она меняет значения α и β так, чтобы дать прогнозы, которые максимально близки к реальным результатам матчей.
Рис. 1. Иллюстрация того, как логистическая регрессия дает оценки α = 1,16 и β = 1,25
Я написал программу на языке Python, которая выполняет все эти вычисления. Запустил ее и смотрел, как она справляется со всеми этими расчетами. Через несколько секунд у меня был результат: наилучшие прогнозы получались при α = 1,16 и β = 1,25.
Эти числа сразу привлекли мое внимание. Сам факт, что оба параметра α = 1,16 и β = 1,25 превосходят 1, показывал сложную связь между коэффициентами и исходами матчей. Проще всего понять эту связь путем добавления к нашей таблице еще одной колонки и сравнения нашей модели логистической регрессии с прогнозами букмекеров.
Здесь мы видим проявление известного опытным игрокам феномена с недооценкой записных фаворитов вроде Испании. Коэффициенты, которые букмекеры устанавливают для таких команд, как правило, занижены, поэтому на них стоит ставить. А более слабые фавориты, вроде Англии в 2014 году, бывают переоценены: их шансы на победу не так высоки, как предполагают коэффициенты. Хотя такие различия между прогнозами и моделью малы, мы с Яном и Мариусом знали, что их достаточно, чтобы получить прибыль.
Мы нашли небольшое преимущество для чемпионата мира. Еще не зная, будет ли это преимущество, замеченное на предыдущих чемпионатах, работать на новом турнире, мы были готовы рискнуть незначительной суммой. Чтобы реализовать систему ставок на основании моего уравнения, хватило времени до обеда. Мы нажали «Запуск» и привели систему в действие. В течение всего чемпионата мира наши ставки размещались автоматически.
После обеда вернулись ко мне домой. Мы с Мариусом уселись смотреть игру Уругвая с Египтом. Ян достал ноутбук и начал скачивать коэффициенты для тенниса.
* * *Уравнение ставок – это не только один чемпионат мира и даже не только зарабатывание денег на букмекерах. Его настоящая сила в том, что оно заставляет нас смотреть в будущее с точки зрения вероятностей и исходов. Использование уравнения ставок означает следующее: надо отказаться от догадок и навсегда забыть идею, что результат футбольного матча, скачек, финансовой инвестиции, собеседования при приеме на работу или даже романтического свидания можно предсказать со стопроцентной уверенностью. Вы не можете знать наверняка, что произойдет.
Большинство из нас смутно осознают, что события в будущем во многом определяются случайностью. Когда прогноз погоды говорит, что завтрашний день будет солнечным с вероятностью 75 %, не следует слишком сильно удивляться, если по дороге на работу вы попадете под ливень. Однако нахождение небольших преимуществ, скрытых в вероятностях, требует более глубокого понимания.
Если для вас важен конкретный результат, то подумайте, с какой вероятностью он реализуется, а с какой нет. Недавно я разговаривал с CEO одного очень успешного стартапа, который вырос за счет четырех этапов многомиллионных долларовых инвестиций и в котором работает сотня сотрудников, и он радостно признавал, что шансы на долговременную прибыль для него самого и его инвесторов по-прежнему всего лишь 1 из 10. Он самоотверженно и долго работал, но сознавал, что все может внезапно развалиться.
При поиске работы мечты или любви всей жизни шансы на успех при каком-нибудь конкретном заявлении на работу или свидании могут быть весьма малы. Меня часто удивляет, что люди, не прошедшие собеседования, ругают себя за то, что поступили неверно, а не учитывают, что, возможно, в этот день кто-то из других четырех кандидатов сделал все верно. Помните, что до появления на собеседовании ваши шансы составляли 20 %. Пока вы не провалите примерно пять собеседований, нет особых причин беспокоиться о каком-то конкретном результате[11].
Вводить числа в романтику труднее, но здесь применимы те же вероятностные принципы. Не ждите, что на вашем первом свидании в Tinder появится принц или принцесса, но если вы сидите в одиночестве после неудачного свидания номер 34, то полезно поразмыслить над своим подходом.
Определив соответствующие вероятности, подумайте, как они соотносятся с размером ваших инвестиций и потенциальных прибылей. Мой совет мыслить вероятностно не попытка призвать к кармическому спокойствию или внимательности. CEO с шансами на успех один из десяти располагал бизнес-идеей, которая потенциально могла дать результат, подобный Uber или Airbnb: создать компанию стоимостью 10 миллиардов долларов. Даже десятая часть от этой суммы – миллиард, и это огромная ожидаемая прибыль.
Вероятностное мышление поможет вам быть реалистом перед лицом шансов, которые часто обращаются против вас. В скачках и футболе наивные игроки нередко переоценивают маловероятные события, но в реальной жизни мы склонны их недооценивать. Мы по природе осторожны и избегаем рисков. Помните, что награда после того, как вы получите действительно желательную работу или любимого человека, будет колоссальной. Это означает, что нужно быть готовым пойти на большой риск ради достижения цели.
* * *Математика требует работы и упорства. Пять минут назад я закончил читать одну из самых примечательных работ в истории прикладной математики – статью, которая буквально стоит миллиард долларов. Я знал, что математика здесь важна, но, добравшись до уравнений, решил, что читать стало гораздо труднее. В первый раз я пропустил их, сказав себе, что вернусь к деталям позже, и перешел к интересным фрагментам.
Речь о статье Уильяма Бентера «Компьютерные системы прогнозирования и размещения ставок на скачках: отчет»[12]. Это своеобразный манифест, декларация о намерениях. И это работа человека, одержимого строгостью и верой в то, что он делает, который документировал свой план, прежде чем взялся его реализовывать, – чтобы показать всему миру, что он побеждает благодаря не удаче, а математической уверенности.
В конце 1980-х Уильям Бентер решил обыграть тотализатор скачек в Гонконге. До того как он начал свой проект, азартная игра с высокими ставками была уделом темных личностей, которые шлялись по ипподромам «Хэппи-Вэлли» и «Сатхинь» и по Гонконгскому жокей-клубу, пытаясь собрать инсайдерскую информацию у владельцев, персонала конюшен и тренеров. Они выясняли, завтракала лошадь или нет и была ли у нее дополнительная тайная тренировка. Они сходились с жокеями и расспрашивали их о стратегии в будущих скачках.
Будучи американцем, Бентер был в этом мире посторонним, однако он нашел другой способ получить инсайдерскую информацию – тот, который жучки упустили, хотя он прятался прямо здесь, в помещениях жокей-клуба. Бентер собрал копии справочников-ежегодников с результатами забегов и нанял двух женщин, чтобы вводить эти данные в компьютер. Затем было то, что журнал Bloomberg Businessweek назвал прорывом. Он взял коэффициенты ставок, также имевшиеся в жокей-клубе, и их оцифровал. Именно они позволили Бентеру применить метод, аналогичный тому, что я показывал Яну и Мариусу: использовать уравнение ставок. Это был ключ к нахождению неточностей в предсказаниях игроков и прогнозистов[13].
Бентер на этом не остановился. В основном уравнении, представленном выше, я ограничился выявлением ошибок в букмекерских коэффициентах для футбола. Теперь, при втором или третьем чтении его статьи, я начал понимать, как Бентер оказывался с прибылью за такой долгий промежуток времени. В своей модели я не рассматривал никаких дополнительных факторов, которые помогали бы мне прогнозировать результат матча. Но Бентер делал все возможное и невозможное. Его быстро разраставшиеся данные включали прошлые выступления, возраст лошади, вклад жокея, стартовый номер, местную погоду и множество других факторов. Каждый из них постепенно вносил свой вклад в уравнение ставок. По мере того как он включал все больше подробностей, точность его логистической регрессии и, соответственно, прогнозов увеличивалась. После пяти человеко-лет ввода данных модель была готова, и Бентер начал играть на скачках на ипподроме «Хэппи-Вэлли» с капиталом, заработанным в казино[14].
За первые два месяца игры Бентер получил 50 % прибыли от инвестиций, но еще через два месяца она исчезла. В течение двух следующих лет прибыли Бентера прыгали вверх и вниз – то взлетая до 100 %, то падая почти до нуля. Примерно через два с половиной года модель действительно начала окупаться[15]. Прибыли поднялись до 200, 300, 400 % и далее росли экспоненциально. Бентер сообщил Bloomberg Businessweek, что в сезоне 1990/91 выиграл 3 миллиона долларов[16]. То же издание оценивало, что за следующие два десятилетия Бентер и его немногочисленные конкуренты, использовавшие те же методы[17], заработали на ипподромах Гонконга свыше миллиарда долларов[18].
Самым примечательным в научной статье Бентера было не содержание, а то, что ее мало кто прочитал. За 25 лет после публикации в других научных журналах на нее сослались всего 92 раза. Для сравнения: когда я 15 лет назад написал статью, как муравьи рода Temnothorax выбирают новое жилье, на нее сослались 351 раз.
Игнорируется не только статья Бентера. Он ссылается на публикацию Рут Болтон и Рэндалла Чепмена 1986 года, называя ее «обязательным чтением» для его собственной работы[19]. Однако прошло почти 35 лет, а эта вдохновенная статья, показывающая, как можно получать деньги на американских ипподромах с помощью уравнения ставок, также цитировалась менее 100 раз.
У Бентера не имелось образования в области высшей математики[20], но он был готов делать то, что требовалось. Его описывали как гения, но я так не считаю. Я знаком со многими нематематиками и негениями, которые настойчиво изучали те же статистические методы, что использовал Бентер. Обычно это не игроки. Это биологи, экономисты и социологи, которые используют статистику для проверки гипотез. Но они нашли время, чтобы понять математику.
Я никогда не улавливаю математические рассуждения при первом чтении. И я видел очень мало профессиональных математиков, которые могли бы прочитать и усвоить уравнения, не возвращаясь потом к ним детально. А именно в деталях и кроются секреты.
* * *Самая большая угроза для любого тайного общества – раскрытие. Современная версия заговора иллюминатов, которая рисует технически подкованных правителей мира, требует, чтобы абсолютно все участники общества молчали о его целях и методах. Если хотя бы один поделится кодом или разгласит планы общества, вся система окажется под угрозой.
Эта опасность раскрытия – главная причина, почему большинство ученых не верят в существование организаций, подобных иллюминатам. Контроль за всей человеческой деятельностью потребует большого общества и масштабной секретности. Риск того, что кто-нибудь расколется и все расскажет, крайне велик.
Однако когда мы погружаемся в уравнение ставок, то видим, что секрет «Десятки» скрыт у всех на виду. Только когда члены общества упорно учатся, он медленно открывается тем, кто его ищет. Этому коду учат во всех школах, а затем в университетах, но мы не понимаем, что мы изучаем. Члены общества лишь смутно осознают, что они участники этого обширного заговора. Они чувствуют, что им нечего раскрывать, нечего признавать и нечего прятать.
Когда молодой перспективный участник «Десятки» читает научную статью Бентера второй и третий раз, он заставляет себя понять ее правильно. Он начинает ощущать связь, простирающуюся на десятилетия и столетия. Бентер, несомненно, чувствовал ее, когда читал работу Рут Болтон и Рэндалла Чепмена. А те до него испытывали то же чувство, когда изучали статью Дэвида Кокса, который предложил в 1958 году логистическую регрессию, ставшую основой их работы. Связь, выкованная математикой, тянется в историческое прошлое, через Мориса Кендалла и Роналда Фишера, работавших между мировыми войнами, и до первых идей о вероятности, высказанных Абрахамом де Муавром и Томасом Байесом в Лондоне XVIII века.
По мере углубления в детали наш юный последователь видит, как перед ним шаг за шагом раскрываются все секреты. Бентер записал истоки своего успеха в коде уравнений. И теперь, спустя 25 лет, можно постепенно разобрать этот успех – один алгебраический символ за другим.
Именно математика, общий интерес к этому уравнению, объединяет нас в пропасти времени и пространства. Как и Бентер до него, наш юный ученый начинает исследовать красоту размещения ставки не с помощью ощущений, а на основании статистической взаимосвязи данных.
* * *Можно объяснить идею, которая стоит за разработанной нами с Яном и Мариусом стратегией ставок, даже без уравнений, одной фразой: мы обнаружили, что коэффициенты открытия для чемпионата мира (те, которые букмекеры предлагают задолго до начала матча) можно использовать для более точного прогнозирования результатов, чем коэффициенты закрытия (те, которые букмекеры предлагают прямо перед матчем).
Это наблюдение противоречит интуиции. Когда букмекеры устанавливают свои коэффициенты, до начала игры может произойти много неопределенных событий. Травма ведущего игрока (это случилось с Мохаммедом Салахом из сборной Египта), плохая форма целой команды (за несколько недель до чемпионата мира Франция сыграла вничью с командой США), смена тренера в последний момент (как произошло со сборной Испании). Теоретически для отражения всех таких событий коэффициенты должны меняться: если Испания внезапно уволит своего тренера, ее шансы на победу над Португалией упадут.
Коэффициенты действительно меняются, но при этом они скорее не отражают новую реальность, а завышаются. По мере приближения матча на рынке появляются игроки-любители, которые пытаются спрогнозировать результаты матчей, и коэффициенты букмекерских компаний меняются, чтобы отразить их ставки. Например, коэффициенты на победу Франции над Перу увеличились с 2/5 до 1/2 до их матча на групповой стадии турнира. Возможно, некоторые игроки полагали, что если Франция не смогла обыграть США в товарищеском матче, то Перу заработает одно очко, а то и три. Другие любители, несомненно, читали в газетах критику в адрес звездного полузащитника Поля Погба и начали сомневаться в его способностях привести сборную своей страны к успеху. Какими бы ни оказались причины, это был именно тот сценарий, который – как установила наша модель – давал удачные ставки на предыдущих чемпионатах мира. Когда коэффициенты на записных фаворитов повышаются, выгодно их поддержать. Наша автоматизированная система обнаружила такое их изменение, активировала функцию ставки и поставила 50 фунтов на Францию. После матча мы получили 75 фунтов. Просто и эффективно.
Важный навык для специалистов по прикладной математике – объяснить логику в основе используемых моделей. Когда мы с Мариусом после запуска модели смотрели футбол, то обсуждали, почему по мере приближения к чемпионату мира коэффициенты становятся менее точными.
– Большинство наших стратегий основано на идее, что к матчу коэффициенты становятся гораздо точнее, – сказал он. – С чемпионатом мира должно быть что-то особенное.
– Большой объем ставок, – предположил я. – По телевизору сплошной футбол, интересно попробовать. Одни ставят деньги на свою страну из национальной гордости, другие – против какой-то страны.
Мариус согласился. Чемпионат мира дал футболу новую аудиторию, она не может устоять перед искушением поставить деньги на своих любимцев. По нашим прикидкам, верные английские фанаты считают, что было бы здорово заработать немного за счет французов. Мы подумали, как аргентинцы и немцы ставили на Швейцарию, игравшую свой первый матч с Бразилией. Когда на аутсайдеров хлынули деньги, букмекеры увеличили коэффициенты для фаворитов, и наша модель, пойдя против толпы, оказалась выгодной. Не каждый матч давал нам выигрыш (бразильцы неожиданно сыграли со швейцарцами вничью), но история показала, что ставка на серьезных фаворитов прямо перед началом игры, вероятнее всего, приносит прибыль.
Пристрастие любителей ставить на маловероятные события было только частью нашей модели. Уравнение давало более тонкие прогнозы: значения α = 1,16 и β = 1,25 говорили, что в случае не совсем явного фаворита нам нужно, наоборот, поддержать аутсайдера – как в 2014 году, когда Англия проиграла Уругваю. Хорошим примером такого прогноза был матч между Колумбией и Японией. За дни перед ним коэффициенты на победу Колумбии выросли с 7/10 до 8/9. Подставив эти числа в наше уравнение, можно прийти к выводу, что стоит поставить на Японию. Не потому, что у нее было больше шансов на победу в матче (фаворитом по-прежнему оставалась Колумбия), просто уравнение говорило, что теперь на Японию, коэффициенты для которой стали 26/5, ставить выгоднее. И мы оказались правы: Колумбия проиграла, а мы заработали 260 фунтов, поставив 50.
* * *Сэру Дэвиду Коксу сейчас 95 лет, и он никогда не прекращал трудиться. За свою 80-летнюю карьеру Кокс написал 317 научных работ, и очень вероятно, что напишет еще. В своем офисе в Наффилд-колледже в Оксфорде он продолжает писать комментарии и обзоры современной статистики, а также вносить новый вклад в эту область.
Я спросил его, каждый ли день он появляется в офисе.