Денис Демахин (denis_demakhin) wrote,
Денис Демахин
denis_demakhin

Пост "6 трюков статистики, которые покажутся вам волшебством" содержит много ошибок

По сети гуляет вот этот баян, который люди лайкают, репостят, и верят, что всё описанное - правда. Автор мне, к сожалению, не известен. Все эти трюки, похоже, понадерганы из каких-то книжек и экспериментов, но так сильно искажены, что извращают суть.



Вероятность управляет всей нашей жизнью, а мозг не способен сходу ее вычислить.

Это точно. Вот подтверждение: "Думай медленно, решай быстро", Даниэль Канеман

Игорная промышленность отвергает этот факт: скажите кому-то, что есть 1 из 100 000 000 шансов на выигрыш в лотерее, и они скажут — «Похоже, кто-то победит!»

Причем тут игорная "промышленность"? И почему "промышленность"?
Какой факт она отвергает? Тот, что мозг не способен сходу вычислить вероятность? И каким образом отвергает, когда, наоборот, как раз подтверждает?
Или игорная промышленность отвергает то, что вероятность управляет всей жизнью? Тоже не отвергает.


Мы не можем обвинять их — есть много ситуаций, когда вероятность похожа на черную магию. Фактрум подобрал несколько примеров, в которые трудно поверить, но…

1. Перетасовывая колоду карт, вы создаете последовательность, которая никогда ранее не существовала

Это правда, но описано криво.

Условие:

Допустим, вы сдаете карты в игре в покер. При этом уточним: вы — опытный сдающий, а не один из тех людей, которые просто неумело крутят карты в руках как дети.

Речь про исследования Перси Диакониса что-ли? Так бы и сказали, что есть условие, что перетасовать нужно не менее семи раз. А не оценочное суждение "опытный сдающий". Ну, то есть чтобы я не разложил все карты по порядку, а потом сделал одно перетасовывание. Повторил это заново раз 10 и точно получил бы ту же самую расстановку дважды или трижды.

Вы мастерски тасуете карты, перебрасываете их из руки в руку, жонглируете, и т.д., пока, в конечном счете, не приходите к выводу, что карты расположены в абсолютно случайном порядке. Каковы шансы, что конфигурация колоды, которую вы сейчас держите, такая же, как той, которую вы перемешивали в прошлый раз? Один шанс из 1000? Один из 10000? Не забываем, что у нас всего 52 карты.

Решение:

Сейчас вы должны почувствовать себя особенным, потому что почти бесспорно, что конфигурация колоды, которую вы держите в руке, никогда не создавалась ни одним человеком за всю историю человечества на этой Земле, и ни в одной из ее параллельных Вселенных. Вы сейчас держите в руках нечто, что никогда не будет снова создано, отныне и до самого конца времен.



Согласитесь, непохоже, что 52 карты — это много. Но для попытки подсчитать количество возможных комбинаций из этих карт, вам понадобится не один свободный вечер. Общее количество статистических комбинаций колоды из 52-х карт — это то, что известно как «52 факториал», или «52!». Полностью это число выглядит так:

80,658,175,170,943,878,571,660,636,856,403,766,975,289,505,440,883,277,824,000,000,000,000. Представьте, что «если бы у каждой звезды в нашей галактике было триллион планет, а на каждой планете жило бы триллион людей, и у каждого человека был триллион колод карт, и они бы перетасовывали карты 1000 раз в секунду и делали это со времен Большого взрыва, то возможно, только сейчас порядок бы повторился».

Если параллельные вселенные существуют, то их бесконечое количество. А бесконечность явно больше, чем "52 факториал".

Да, 52! = 80658175170943878571660636856403766975289505440883277824000000000000

Это меньше, чем бесконечность.

Если это взрывает вам мозг, подумайте об этом так: есть только 52 карты, но в алфавите почте вдвое меньше букв. А теперь задумайтесь о количестве книг, написанных путем комбинации этих букв. Их невероятно много.

Это совершенно некорректная аналогия. Буквы в книгах повторяются, а карты - нет.

2. Число «пи» можно вычислить, беспорядочно бросив на стол кучу скрепок

Условие:

Давайте сыграем в быструю игру. Все, что нужно, это листок бумаги, карандаш и горсть скрепок (или иглы, гвозди, или что-нибудь подобное).

Нарисуйте на бумаге две параллельные линии, длиной примерно в две скрепки. Теперь бросьте горсть скрепок на пространство между строками.



Неважно, сколько скрепок вы используете, но чем больше, тем лучше, поэтому действуйте смелее.

Возьмите общее количество скрепок, умножьте его на два, затем разделите это число на количество скрепок, которые касаются одной из линий. Таким образом, если бы вы бросили 20 скрепок, и 13 из них касались одной из линий, то вы разделились бы 40 на 13. Число, которое вы получите, будет близко к «Пи». и если вы увеличите количество скрепок, оно будет становиться ближе и ближе.

Я могу раздвинуть линии всё дальше и дальше. А длина у них не меняется.

Решение:

Да, «Пи» — это одна из тех загадочных вещей, которые просто существуют во Вселенной. В данном случае, если предполагается, что даже скрепки были брошены совершенно случайно, все их стороны и положения будут иметь тенденцию к выравниванию.

Это решение? Вот эта фраза - решение? Автор знает значение этого слова?

Почти таким же образом при подбрасывании монета будет иметь тенденцию к равному количеству «орлов и решек», даже при том, что каждый отдельный бросок случаен. И в этом случае, чем дольше вы бросаете монетку, тем более точным становится результат, поскольку постоянство сглаживает статистические отклонения.

Почему получился какой-то бред? Потому что автор сам не понял, о чем речь. Он перепостил статью какого-то не-математика, который неправильно перевел какую-то научно-популярную статью, которую написал полуматематик на основе трудов математиков.

А вот как надо: Иголка, нитка и число пи

3. Вы можете «обмануть» игру «Орел или решка», делая ход вторым

Не игру вы можете обмануть, а своего оппонента.

Эта игра называется "орлянка" или "Пенни"

Условие:

Представим, что кто-то бросает вам вызов в игре «орел-решка». Правила просты — каждый из вас предсказывает последовательность из трех бросков, либо орел, либо решка. Затем вы бросаете монету до тех пор, пока составится одна из ваших последовательностей. Если последовательность вашего соперника появляется первой, вы даете ему 20$. Если же первой складывается ваша комбинация — его двадцатка ваша. Если вы оба играете честно, кажется, что ваши шансы на выигрыш составляют 50 на 50, не так ли?

Тут забыли указать важнейший аспект: бросают не очередями по 3 штуки. А единой длинной очередью до тех пор, пока не выпадет комбинация одного из участников.

Решение:

Даже если у вас нет монет с секретом, зеркал или магнита, и вероятность каждого броска действительно 50 на 50, вы все еще можете манипулировать игрой. У вашего соперника есть 87-процентный шанс обыграть вас, и секрет в том, чтобы сделать свой ход вторым. Допустим, человек, совершивший первый ход, назвал: «орел, орел и решка». Задача второго игрока — запомнить и выполнить два шага:

Ваше первое название должно быть противоположным второму названию соперника. В этом случае — решка.

Ваши второе и третье названия должны совпадать с первыми двумя названиями соперника. В этом случае — орел, орел.

87,5%. И то для разных комбинаций шанс разный. Но он всегда больше 50% при соблюдении правил.

Шанс разный в зависимости от комбинаций потому что в орлянке может выпасть то, что не загадал ни один из участников, и игра продолжается.

Например, так:

Первый загадал: 121
Второй загадал в соответстви с правилами: 112
Пошла игра: 222121
На первых трех бросках никто не выиграл, игра продолжилась, и выиграл первый. Это доказывает, что то, что первый проигрывает во всех случаях, когда сразу же не выпадает его комбинация - неверно. Есть варианты комбинаций для ничьей, после которых игра может выйти на повторный круг, и первый игрок снова будет иметь возможность выиграть.

Поэтому на шанс в зависимости от начальных комбинаций влияет количество возможных комбинаций "ничьей" из которых игрок 1 снова может выиграть.


Если вы будете следовать этим правилам, ваши шансы на выигрыш всегда будут выше, иногда незначительно, а иногда и намного больше, чем у соперника.

Если вы не верите нам, попробуйте сами и убедитесь. Это называется «нетранзитивная игра». То есть, каждый выбор, который вы можете сделать, либо лучше, либо хуже, чем любой другой возможный вариант.

Тут не дается объяснения. Тут дается два правила и предложение поверить (или проверить). Не объясняется, почему это должно работать. А вот почему должно:

Для любой комбинации исходов существует комбинация исходов, которая при непрерывном подбрасывании монеты выпадет раньше.
Мы вводим условие, при котором вначале ловим партнера на том, что его комбинация сбивается (на втором броске у него выпадет не то, что он загадал), а потом - на том, что начинает складываеться его комбинация. При этом его комбинация только начинает складываться, тогда как наша уже сложилась.

Это практически то же самое, что и игра «Камень, ножницы, бумага», только в этом случае, делая первый ход, вы говорите своему противнику, выбираете вы камень, бумагу или ножницы, прежде чем он сделает свой выбор. Поэтому не ходите первым. Следуя вышеупомянутым правилам, вы почти всегда сможете повернуть все в свою пользу.



4. Вероятность того, что родственник мужчины также мужчина — один к трем (не 50 на 50)

Совершенно ошибочно.

Условие:

Вы встречаете парня по имени, допустим, Чад. Чад говорит вам, что у него есть родственник (брат или сестра), но он больше ничего о нем вам не скажет. Какова вероятность того, что родственник Чада — брат? Должно быть 50 на 50, верно? Тот факт, что Чад мужчина, не может иметь никакого влияния на пол его родственника.

Решение:

Если Чад мужчина, то шансы на то, что у него есть брат, опускаются до одного к трем. Добро пожаловать в безумный мир математической вероятности.

Как много пафосных фраз. Но безумный тут не мир математической вероятности, а автор этой заметки, а также те, кто ее у себя размещает.
Автор напоминает кухарку ученого, живущего в башне из слоновой кости. Кухарка мила, грудаста и болтлива, ужасно гордится своим хозяином, но она ничего не может рассказать о сути экспериментов своим знакомым, потому что боится заходить в комнату ученого. Хотя видела огонь и дым. А из того, что ученый ей сам радостно рассказывает когда опыт удался, не понимает ни слова.


Мы знаем то, что Чад мужчина, но не то, старше он или младше своего родственника. Вы также знаете, что существует четыре возможных гендерных комбинацих для двух детей, в зависимости от порядка, в котором они рождаются:

мальчик / мальчик,
мальчик / девочка,
девочка / мальчик,
девочка / девочка.

Каждая комбинация имеет ровно 1 шанс из 4.

Но подождите! Вы также знаете, что Чад мужчина, поэтому исключаем комбинацию девочка/девочка. Таким образом, у нас остаются мальчик/девочка, девочка/мальчик или мальчик/мальчик.

В самом начале задачи у нас спрашивают: Какова вероятность того, что родственник Чада — брат?
Тогда гендерные комбинации становятся такими:

Чад / мальчик
мальчик / Чад
Чад / девочка
девочка / Чад
девочка / девочка (которую мы вычеркиваем)

Итого получается, что в 50% случаев у Чада есть брат, и в других 50% - сестра.

В решении два варианта, где Чад является либо старшим, либо младшим (мальчик / Чад, Чад / мальчик) объединили в один (мальчик / мальчик), отсюда и неверная вероятность.


У меня уже есть опыт в ведении дискуссий на подобные темы: Вероятность выпадения монеты противоположной стороной, когда предыдущий бросок уже сделан

И в двух из трех случаев у него есть сестра, оставляя только 1 из 3 шансов на то, у него есть брат.

Вообще-то в заголовке пункта и в подчеркнутой части говорится "один к трем", а теперь уже "один из трех".
"Один к трем" - это соотношение "Совпадение : Несовпадение", т.е. 1:3, то есть 1 совпадение из 4 попыток, вероятность 25%.
"Один из трех" это соотношение "Совпадение : Попытка", т.е. вероятность 33%.

Существует похожий парадокс, под названием «Парадокс Монти Холла». Перед вами три двери — за одной из них новый автомобиль, а за двумя другими — козы. Вы выбираете одну из дверей, но вместо того, чтобы показать ваш приз, ведущий говорит вам, что за какой-то из двух оставшихся дверей есть коза и предлагает изменить решение. Даже при том, что у вас теперь есть две двери для выбора и, казалось бы, шанс 50–50, ваш шанс на то, что вы выбрали правильную дверь, по-прежнему остается 1 к 3.

Аналогия с Монти Холлом вообще неправильная. В ней ведущий знает, за какой дверью нет автомобиля, и открывает ее. Вероятность меняется. В задаче с Чадом вероятность не меняется.

То же самое и с сестрой Чада — даже при том, что, казалось бы, у него могли быть или брат или сестра, на самом деле у него могли быть брат, сестра или сестра.

Нет! У него могли бы быть старший брат или младший брат. Старшая сестра или младшая сестра.


Почему эта заметка так популярна? Потому что она скорее удивляет, чем образовывает. Кто-то из читателей узнал что-то новое? Кто-то достал калькулятор и посчитал что-то? Кто-то что-то запомнил? Иллюзия самообразования.
Попытка сделать "популярно-доступные" формулировки привели к искажению информации.

5. В небольшой группе людей вероятность того, что у двоих из них день рождения приходится на один и тот же день, составляет почти 100%

Условие:

Допустим, друг зазвал вас на вечеринку с кучей незнакомых вам людей. И пока вы с чувством огромного дискомфорта стоите в ожидании землетрясения или чего-то ещё, что дало бы веский повод уйти, к вам подходит один из участников праздника и невзначай упоминает, что сегодня у него день рождения.

«Не может быть! — говорите вы, — У меня тоже сегодня день рождения! Неужели это возможно

Решение:

При условии, что никто из вас не врет, шансы невероятно высоки. Вероятность того, что в группе всего из 23-х человек у двоих совпадут дни рождения, равна примерно 50%.

Минуточку! Абзацем выше же ясно написано, что на вечеринку пришли именно вы, и там вы встретили человека с такой же датой рождения, что и у ВАС. А сейчас пишут совсем другое - что там вы встретите двух людей, у которых совпадет день рождения. Это два совершенно разных по вероятности события.

Тут легко запутаться: так как в году может быть не более 366 дней (с учетом високосного года), а в группе всего 23 человека, кажется, что вероятность подобного совпадения равна 1 к 15.

Это вероятность того, что вы хотите найти там человека, у которого д.р. в тот де день, что и у вас. 366 / 23 = 15,9%

Это верно, если вы говорите о шансах кого-либо одного разделить свой день рождения с другим человеком. Но мы говорим о двух людях.

Каких двух людях?

Итак, когда вы встречаетесь с кем-то впервые, шанс, что ваши дни рождения совпадут, равен одному из 366. Но и у другого есть такой же шанс! Теперь мы должны перемножить вероятности, что в результате даст один шанс из 122.

Как вы получили это число? Что на что перемножили чтобы его получить? Вы просто поделили 366 на 3. Зачем?

С увеличением количества людей вероятность того, что дата рождения каждого уникальна, уменьшается намного быстрее, чем вы могли бы предположить — у 10 человек есть 10-процентный шанс совпадения дней рождения, в то время как у 20 человек этот шанс равен уже 40%.

Это верно. Хотя, в заголовке обещали почти 100%..

Посчитать это действительно сложно. Недостаточно просто разделить 1 на 366, а потом умножить на количество людей. Тогда получится высчитать только вероятность того, что лично только у вас совпадет д.р. с кем-нибудь из них. Но это не учитывает того, что у каждого из них может совпасть д.р. с кем-то еще кроме вас.


Если хотите вывихнуть себе ум, то вот вам: Парадокс дней рождения

Если вам это все еще кажется колдовством, вы можете взять в Интернете список из 20 случайных людей — например, список игроков спортивной команды. В списке из 25 игроков найдется две пары, празднующих день рождения в один день.

6. Вероятность подсказывает, что «чудеса» — это обычное дело

Условие:

Мы написали кучу статей об удивительных совпадениях — событиях, которые действительно произошли, несмотря на невероятно низкий шанс. Возьмем один из наших любимых примеров — в 1974 году на Бермудских островах 17-летний подросток ехал на мопеде и был сбит такси. Ровно через год его брат погиб управляя тем же самым мопедом, на той же улице, тем же самым такси, которое везло того же пассажира. Отличный сюжет для «Секретных материалов».

Такие совпадения возможны по той причине, что событий вообще в мире неисчеслимое множество. Поэтому иногда они совпадают.

Решение:

В этой ситуации невозможно рассчитать вероятность, как мы делали выше,

- Математик, каких поискать. (с) Тони Старк, Война бесконечности

потому что вы не можете количественно оценить каждую переменную (т.е. как часто этот пассажир ловил такси на этой улице, как часто братья ездили по той же улице, сколько других транспортных средств сталкивались с ними, и т.д.).

Но мы можем попробовать рассчитать шансы на выигрыш в лотерее.

Итак, каковы шансы дважды сорвать джек-пот в лотерее? Уберите свой блокнот, я просто скажу вам — примерно один из нескольких триллионов. Но поищите в Google людей, которые сделали это, и вы получите десятки результатов. Здесь действует тот же принцип, что и в примере с днем рождения выше. Хотя шансы, что это произойдет с каким-либо одним конкретным человеком, ничтожно малы, вероятность того, что это произойдет с кем-то, равна почти 100%.

Потому что попыток очень много. Потому что игроков в мире очень много, и они снова и снова делают попытки.

Трудность в понимании вероятности таких вещей заключается в том, что мы считаем себя центром Вселенной. Когда мы задаем вопрос: «каковы шансы?» мы на самом деле имеем в виду: «каковы шансы, что это произойдет со мной?»

Несколько статистиков провели эксперимент, в котором попросили людей рассказать о случившихся с ними невозможных совпадениях, и вычислили, насколько вероятными они были на самом деле. Результат? Чудеса оказались даже еще более приземленными, чем они ожидали.

Когда одна женщина сообщила, что два раза за четыре месяца выиграла в лотерею, они подсчитали, что вероятность этого случая с этой конкретной женщиной была 1 из 17 трлн. Она счастливейшая женщина на планете. Тем не менее, возможность любого человека выиграть в лотерею дважды за четыре месяца близка к 1 из 30. В принципе, это серьезная гарантия того, что кто-то станет невероятно богатым два раза до конца этого года.

И как это доказывает, что чудеса - это обычное дело? То, что невероятные совпадения довольно часто случаются с какими-то случайными людьми в мире, не делает эти события обычными. Если бы это было обычным делом, то такие события случались бы со всеми людьми. А не с одним человеком в мире раз в четыре месяца.



И не очень-то факты!

Если вас действительно интересует статистика, то вот вам:

"Думай медленно, решай быстро", Даниэль Канеман

"Фрикономика. Мнение экономиста-диссидента о неожиданных связях между событиями и явлениями"

"Достаточно ли вы умны, чтобы работать в Google?", Уильям Паундстоун





Subscribe

Recent Posts from This Journal

Buy for 20 tokens
Buy promo for minimal price.
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 0 comments