главная новое лучшее написать
4

Все, кто занимается анализом данных, статистикой, машинным обучением или похожими дисциплинами, слышали поговорку "correlation doesn't imply causation" ("наличие корреляции не означает наличия причинно-следственной связи"). Сама по себе эта поговорка абсолютно верна, но её легко понять слишком расширительно и сильно навредить тем самым самому себе. А именно, можно решить, что данные в принципе не могут быть основой ни для каких суждений о причинно-следственных связях, и что любой вывод, сделанный на основе той или иной статистики, сам по себе не может быть поводом для каких-либо действий, за исключением "посмотреть сюда внимательнее".

Это, конечно, не так. Если завоняло серой, это не значит, что рядом бродит чёрт, но если завоняло серой, рядом бродит чёрт, а ваш собеседник продолжает отрицать причинно-следственную связь, то, скорее всего, у него просто KPI привязан к тому, чтобы связи не было.

В дискуссии упоминание "correlation doesn't imply causation", соответственно, часто означает "мне не нравятся ваши выводы, поэтому я хочу вас заткнуть". Поинтересуйтесь у такого оппонента, что он думает про двойное слепое рандомизированное тестирование лекарств, обычно восторг от этой практики как-то необъяснимо уживается в одной голове с этой поговоркой.

in#math

2 eso 28-12-2023

А что тут можно трактовать расширительно? Кажется, эта фраза говорит ровно то что говорит - наличие корреляции не равно прямой причинно-следственной связи.
PS. классный логин!

ответить
2 smart-life 29-12-2023

Каких-нибудь бы примеров. А то непонятно, с чем ты борешься. Я не так часто слышал, чтобы её употребляли, но скорее всегда по делу.

ответить
2 anonymous 29-12-2023

Если завоняло серой, это не значит, что рядом бродит чёрт, но если завоняло серой, рядом бродит чёрт, а ваш собеседник продолжает отрицать причинно-следственную связь, то, скорее всего, у него просто KPI привязан к тому, чтобы связи не было.

А какой тут causation? Это черт воняет серой? Это горящая сера привлекла черта? Горящая сера означает что мы в аду, а черти для ада это норма? Я не вижу решительных аргументов ни за один из трех вариантов

ответить
1 anonymous 29-12-2023

Неправда же.

Когда валидно сказать про correlation и causation: пусть употребление алкоголя в возрасте 16 лет коррелирует с употреблением травы в 21 год. Нельзя тут обвинить алкоголь - мб просто у неблагополучных подростков оба эти явления встречаются чаще.

Или например "пьющие вот эти витамики люди здоровее"(возможно люди следящие за здоровьем склонны иметь лучшее здоровье И покупать витаминки)

Если посмотреть на сетап АБ - там рандомно отбираются участники А и Б. Как раз чтобы не было эффекта "обратной зависимости" как в примере выше. В случае с АБ нет возможности того что Следящие за здоровьем сколнны принимать витамики - мы сам раздали витаминки рандомным людям и плацебо другим рандомным людям, то есть изолировали все левые факторы. Без изоляции левых факторов - causation'а и правда нет.

ответить
1 anonymous 29-12-2023

AB-test не единственный осмысленный способ, иногда он просто неприменим, приходится Propensity Score Matching применять

Про алкоголь и траву очень хороший пример. AB-test устроить невозможно. Алкоголь с ходу обвинить нельзя. Но выдвинуть несколько гипотез и продолжить копать вполне можно. Иначе вырабатывать полиси типа "со скольки лет можно продавать алкоголь" в data-driven стиле просто невозможно.

ответить