Шрифт:
Интервал:
Закладка:
Но подобные проблемы возникают не только в биологии. Математик Майкл Берри приводит простой пример, иллюстрирующий трудности в симуляции любой физической системы, даже такой, казалось бы, простой, как бильярдная игра. Рассчитать результат удара первого бильярдного шара достаточно просто. Оценить результат второго удара уже сложнее, поскольку нужно точнее определять исходное состояние системы для получения приемлемой аппроксимации траектории шара. А дальше дело обстоит еще хуже. В частности, чтобы с большой точностью описать девятый удар, следует принять во внимание уже силу притяжения стоящих у стола людей. И если вы думаете, что даже это слишком трудно, знайте, что для расчета пятьдесят шестого удара требуется учесть влияние каждой отдельной частицы вселенной.
Другая интересная иллюстрация ограниченности предсказаний поведения сложных систем, особенно биологических, связана с ныне широко используемой технологией «больших данных» (big data). На протяжении нескольких последних лет нам упорно твердят, что при наличии чрезвычайно большого массива данных, содержащих гигантский объем информации о каком-то предмете, с помощью алгоритмов машинного обучения можно с высокой степенью точности предсказать будущее такой же системы. На эту тему написано огромное количество материала, так что здесь у меня просто нет места, чтобы его полностью отразить. Но я все же хочу указать на два очевидно неудачных примера применения этого подхода: предсказания результатов голосования и классификацию бейсбольных команд.
Во время выборов президента США в 2016 году десятки миллионов долларов были затрачены на создание систем обработки больших массивов данных, которые, как предполагалось, позволят назвать победителя еще до проведения голосования, не то что до подсчета голосов. К тому моменту, когда на восточном побережье США миллионы людей уже проголосовали и избирательные участки были закрыты, многие традиционные СМИ, включая New York Times, CNN и три главные американские телевизионные сети, начали раскрывать предсказания своих систем big data, которые практически единогласно прочили убедительную победу кандидату от Демократической партии Хиллари Клинтон. Как всем известно, на этих одних из самых невероятных в истории США президентских выборах победу одержал Дональд Трамп. Юление журналистов и газетных изданий по поводу очевидной победы Трампа было еще позорнее и унизительнее, чем знаменитый заголовок на первой странице Chicago Tribune 3 ноября 1948 года, «Дьюи одержал победу над Трумэном», ошибочно объявлявший о победе Томаса Дьюи над действовавшим президентом Гарри Трумэном, тогда как на деле все было наоборот.
Но почему же предсказания всех этих могучих медийных организаций со всеми инвестированными ими в технологию big data средствами оказались не лучше, если не хуже прогнозов 1948 года? На момент написания этой главы подробности еще неизвестны, но случившееся очень хорошо иллюстрирует ключевую проблему данного подхода: предсказания подобных систем основаны на предположении, что будущее событие воспроизведет статистику предыдущих событий, использованную для построения базы данных, и выведенных на ее основе корреляций. Сделанные такими системами предсказания могут быть точны только в том случае, если будущее событие происходит таким же образом, как предыдущие. Однако в изменчивых сложных динамических системах предсказания big data легко оказываются бессмысленными, если значения соответствующих переменных отличаются от значений в прошлом либо если эти переменные взаимодействуют совершенно иным образом. Как подсказывает опыт, человеческие сообщества полностью соответствуют определению изменчивых сложных систем, так что у нас мало оснований полагать, что следующие выборы пройдут так же, как предыдущие.
В США методология big data стала очень популярной, когда в 2011 году вышел чрезвычайно успешный фильм «Человек, который изменил все» (Moneyball) с Брэдом Питтом в главной роли, основанный на опубликованной в 2003 году книге Майкла Льюиса «MoneyBall. Как математика изменила самую популярную спортивную лигу в мире», повествующей о том, как с помощью нестандартного подхода тренер Билли Бин значительно повысил конкурентоспособность своей малобюджетной бейсбольной команды. Бин понимает, что для того, чтобы вывести Oakland Athletics в одну лигу с такими монстрами, как Yankees, Red Sox или моим фаворитом Phillies, он должен изменить стандартные методы подбора наиболее талантливых игроков, чтобы произвести сильнейший эффект за минимальные деньги. Для этого Билли Бин обращается к саберметрике – напоминающему big data подходу, разработанному статистиком и писателем Джорджем Уильямом Джемсом, много писавшем о бейсболе; метод основан на эмпирическом анализе бейсбольной статистики для выявления лучших игроков и формирования команды-победителя. Действуя вопреки советам опытных экспертов, Бин полагается на главные выводы саберметрики о том, что лучшим основанием для подбора игроков, способных составить хорошую команду, является статистика столкновений.
Вышло так, что под руководством Бина и при помощи его саберметрического подхода Oakland Athletics в последующие годы (2002 и 2003) дошла до серии финальных игр. Вскоре после этого стратегию Бина начали перенимать и другие команды. Можно только вообразить, сколько денег (вероятно, сотни миллионов долларов) было направлено на реализацию этой стратегии с тех пор, как команды высшей лиги США решили, что в XXI веке эта игра будет подчиняться статистике.
Забавно, что в этой истории часто не учитывают тот факт, что в бейсболе, как в любом спорте, важна не только сила защиты. В первую очередь ключевым игроком для победы является питчер[17], и, как упоминалось в статье в Guardian, в 2017 году, в том сезоне в составе Oakland Athletics почти каждый день играли великолепные питчеры. Защита, разумеется, тоже имеет значение, так же как и тактика, сообразительность и взаимопонимание игроков. Более того, кроме игровых качеств есть еще много других человеческих факторов, которые определяют, сможет ли сформированная из талантливых игроков команда стать командой чемпионского уровня. Я упоминаю об этом, поскольку проверке реальной причинной связи между саберметрическими параметрами и выигрышем в лиге чемпионов, являющимся, по моему наивному мнению, заветной целью любой команды (хотя некоторые владельцы команд заботятся только о том, чтобы сделать деньги), было уделено слишком мало внимания.
В конечном итоге команда Oakland Athletics хорошо выступала против мощных соперников, однако ничего не выиграла. Также не выиграли и другие команды, потратившие много денег на переход к этой методологии. Правда, команда New York Mets, руководство которой десятью годами позднее адаптировало подход Бина, все же победила в Мировой серии 2015 года. Однако нет реальных научных доказательств того, что эта или другая Мировая серия была выиграна благодаря саберметрике. Опять-таки кажется, что «неизбежность» скорее возникала как абстракция, как дань моде в умах тех, кто поклоняется методологии big data, нежели как вывод из фактических данных, доказывавших реальное явление.
Если выборы и бейсбол – достаточно сложные процессы для симуляции и предсказаний, еще больше сложностей возникает при анализе динамики мозга с 86 миллиардами нейронов. Очевидно, что при симуляции целого мозга животного, функционирование которого требует тонкого взаимодействия миллиардов нейронов и множество уровней организации, вероятность отклонения симуляции от реальности чрезвычайно велика.
Математический аспект в симуляции активности мозга тоже проблематичен. Первая проблема касается вычислимости. Вычислимость определяет, существует ли способ превратить математическую формулу в эффективный алгоритм, который можно заложить в цифровую машину. Вычислимость связана с возможностью получения буквенно-цифрового конструкта, а не с какими-либо физическими свойствами системы. И здесь мы упираемся в стенку: поскольку большинство математических описаний природных явлений не могут быть сведены к алгоритмам, их считают невычислимыми функциями. В частности, не существует общей процедуры, позволяющей систематически налаживать цифровой компьютер: не существует алгоритмического выражения для функции F, которая могла бы заранее выявить какую-то будущую неполадку, способную помешать работе компьютера. Что бы мы ни делали, машина всегда будет совершать неожиданные ошибки, которые нельзя предсказать при производстве компьютера и разработке программного обеспечения. Поэтому такая функция F классифицируется в качестве невычислимой функции. И в таком качестве она не удовлетворяет тезису Чёрча – Тьюринга, определяющему тип функций, которые можно симулировать на машине Тьюринга.
- 1905-й год - Корнелий Фёдорович Шацилло - История / Прочая научная литература
- На цифровой игле. Влияние гаджетов на наши привычки, мозг, здоровье - Андерс Хансен - Здоровье / Прочая научная литература
- Самурайский дух. 2000 – 2003. Япония. SWA boxing - Сергей Иванович Заяшников - Биографии и Мемуары / Менеджмент и кадры / Прочая научная литература
- Основные труды. Том 2. Идеология последовательного (революционного) гуманизма. Теория общества и хозяйства - Галина Ракитская - Прочая научная литература
- Нарративная экономика. Новая наука о влиянии вирусных историй на экономические события - Роберт Шиллер - Зарубежная образовательная литература / Прочая научная литература / Экономика
- Мышление. Системное исследование - Андрей Курпатов - Прочая научная литература
- Мозг и тело. Как ощущения влияют на наши чувства и эмоции - Сайен Бейлок - Прочая научная литература
- Загадки для знатоков: История открытия и исследования пульсаров. - Павел Амнуэль - Прочая научная литература
- Штурм мозга - Борислав Козловский - Прочая научная литература
- Быть собой: новая теория сознания - Анил Сет - Прочая научная литература / Науки: разное