Все, кто занимается анализом данных, статистикой, машинным обучением или похожими дисциплинами, слышали поговорку "correlation doesn't imply causation" ("наличие корреляции не означает наличия причинно-следственной связи"). Сама по себе эта поговорка абсолютно верна, но её легко понять слишком расширительно и сильно навредить тем самым самому себе. А именно, можно решить, что данные в принципе не могут быть основой ни для каких суждений о причинно-следственных связях, и что любой вывод, сделанный на основе той или иной статистики, сам по себе не может быть поводом для каких-либо действий, за исключением "посмотреть сюда внимательнее".
Это, конечно, не так. Если завоняло серой, это не значит, что рядом бродит чёрт, но если завоняло серой, рядом бродит чёрт, а ваш собеседник продолжает отрицать причинно-следственную связь, то, скорее всего, у него просто KPI привязан к тому, чтобы связи не было.
В дискуссии упоминание "correlation doesn't imply causation", соответственно, часто означает "мне не нравятся ваши выводы, поэтому я хочу вас заткнуть". Поинтересуйтесь у такого оппонента, что он думает про двойное слепое рандомизированное тестирование лекарств, обычно восторг от этой практики как-то необъяснимо уживается в одной голове с этой поговоркой.
in#math
Неправда же.
Когда валидно сказать про correlation и causation: пусть употребление алкоголя в возрасте 16 лет коррелирует с употреблением травы в 21 год. Нельзя тут обвинить алкоголь - мб просто у неблагополучных подростков оба эти явления встречаются чаще.
Или например "пьющие вот эти витамики люди здоровее"(возможно люди следящие за здоровьем склонны иметь лучшее здоровье И покупать витаминки)
Если посмотреть на сетап АБ - там рандомно отбираются участники А и Б. Как раз чтобы не было эффекта "обратной зависимости" как в примере выше. В случае с АБ нет возможности того что Следящие за здоровьем сколнны принимать витамики - мы сам раздали витаминки рандомным людям и плацебо другим рандомным людям, то есть изолировали все левые факторы. Без изоляции левых факторов - causation'а и правда нет.
ответить