Статья 3. Щекотка скользкой рыбы причинно-следственной связи: расчет и устранение путаницы.

Набор инструментов причинного вывода включает в себя do-оператор и три правила для манипулирования do-оператором, называемые do-исчислением. Оператор do позволяет нам провести различие между пассивным наблюдением корреляции между компонентами в системе и последствиями физического действия чего-либо с системой. Пассивное наблюдение может дать условные вероятности, но не является надежным средством предсказания воздействия вмешательства на систему. Оператор do приводит к математическому определению смешивания и вместе с причинно-следственной диаграммой обеспечивает лучшее понимание того, как устранить смешивание, как обсуждалось в предыдущей статье. Вооружившись предварительным исчислением, мы можем извлечь причинно-следственную информацию из данных наблюдений, что и является темой этой статьи. Коррекция бэкдора обеспечивает наиболее распространенную поправку на смешение и основу для правила 2 до-исчисления. Читайте дальше, если вы хотите узнать больше о трех правилах исчисления.

Устранение путаницы с помощью исправления бэкдора.

Вмешивающиеся эффекты часто можно устранить с помощью коррекции черного хода. В качестве примера рассмотрим ответвление X ← B → Y. Ранее мы обсуждали, как зависимость X и Y от B приводит к их корреляции друг с другом, следовательно, P(Y=y|X=x) не равно P(Y=y). То есть, знание значения X дает нам некоторую информацию об Y, изменяя нашу оценку его вероятности. Хотя между Y и X нет причинно-следственной связи, информация о состоянии X говорит нам о состоянии Y, опосредованном черным ходом, B. Однако для этой разветвленной архитектуры, если мы выберем наблюдения, где B, например, , только одно значение, B = b, то значения Y и X будут каждое по одному значению (без учета шума), так как B вызывает значения в Y и X. Вероятность того, что Y = y не зависит от значения X для подмножество данных, где B = b и, таким образом, устраняется смешанный эффект; следующий абзац должен прояснить это.

Если теперь мы снова усложним систему, добавив причинно-следственную связь (то есть стрелку) от X к Y, рис. 2, то контроль B не удалит всю корреляцию между Y и X. Дополнительная причинно-следственная связь между X и Y позволяет изменениям в A изменить значение Y через цепочку стрелок от A до X до Y. . Это происходит независимо от значения B. Эта остаточная корреляция между Y и X после учета B является причинным эффектом.

Таким образом, мы видим, что контроль черного хода непричинных путей между двумя переменными позволяет рассчитать причинный эффект между двумя факторами в системе путем удаления мешающего фактора (факторов). Однако мы можем заблокировать обходные пути только в том случае, если знаем, где они находятся, что требует нашей причинно-следственной диаграммы для их правильного определения. Если мы контролируем переменную, которая является коллайдером, а не бэкдором, мы можем на самом деле вызвать корреляцию там, где ее нет, например, когда мы контролируем продажи солнцезащитных шляп и находим корреляцию между богатством и солнечным светом, обсуждаемую в статьях 1 и 2. этой серии.

Я буду работать с примером набора данных и анализа, который должен прояснить ситуацию, но это будет в следующей статье этой серии. Если вы знакомы с условными и маргинальными вероятностями, предыдущий абзац требует лишь небольшого размышления, чтобы понять его смысл. Если вы не знакомы с размышлениями об условных и предельных вероятностях, в Интернете есть много статей, которые могут помочь вам лучше понять этот аспект, хотя простого размышления о причинно-следственных связях может быть достаточно. Короче говоря, для разветвленной архитектуры X ← B → Y, если B имеет фиксированное значение, то X и Y имеют фиксированные значения, и, следовательно, между X и Y не может быть корреляции; путаница устранена.

Выполнить расчет

Do-исчисление может преобразовать выражение с do-оператором в выражение без do-оператора. Это позволяет иногда использовать данные наблюдений для вывода о причинно-следственной связи при условии правильности причинно-следственной диаграммы.

Исправление бэкдора дает нам пример исчисления; на самом деле это основа правила 2. Если мы рассмотрим каузальную сеть X→A ← B → C (рис. 3), блокирование черного пути от A к C дает несмешанное P(C| А). Это причинное влияние А на С, которое по определению есть Р(С|делать(А)). Это может сбить с толку, так как мы сказали, что do(A) удаляет все стрелки, ведущие в A, но для исправления бэкдора мы удаляем только бэкдор-стрелки. Однако, сравнивая причинно-следственные диаграммы с коррекцией бэкдора (т. е. здесь с учетом B) и do (A) на рис. 3и 4 видно, что они каузально эквивалентны. Если вы действительно углубитесь в эту тему, вы обнаружите, что вам даже не нужно удалять все стрелки бэкдора, ведущие к интересующей вас переменной (например, A в нашем обсуждении здесь), вам просто нужно контролировать переменную где-то вдоль задний ход. При некотором размышлении становится очевидным, что они не противоречат друг другу.

Давайте более формально сформулируем исправление бэкдора как правило 2 исчисления, а затем мы рассмотрим правила 1 и 3. В самом общем виде, если Z представляет все переменные, необходимые для блокировки всех бэкдоров между Y и X, тогда правило 2:

P(Y|do(X), Z) = P(Y| X, Z)

То есть, после выбора одного значения для каждой переменной, представленной Z, чтобы заблокировать лазейки, выполнение X просто устанавливает X=x для каждого интересующего x. Выбирая данные, которые удовлетворяют этим условиям для Z и X, мы затем вычисляем вероятность Y. Таким образом, это дает нам эффект do(X) без необходимости проведения интервенционного эксперимента, но только в том случае, если мы правильно определили, какие пути нужно блокировать. Это правило используется для того, чтобы превратить действие в видение или видение в действие, т. е. обусловливание делания (X) становится обусловливанием X или наоборот.

Поскольку do(X) убирает стрелки с причинно-следственной диаграммы, действие может также действовать как коррекция типа бэкдора, т. е. блокировать бэкдор-взаимодействия, которые можно использовать для манипулирования do-исчислением. Перл использует блокировку бэкдора с помощью do-оператора для получения поправки к парадной двери, которая обсуждается в «Книге почему», но здесь мы не будем вдаваться в подробности.

Правило 1:

P(Y|do(X), Z, W) = P(Y|do(X), Z)

Где W — одна или несколько переменных, не имеющих корреляции с Y, при условиях do(X) и фиксированном/обусловленном Z, и, таким образом, значения W не влияют на P(Y), распределение вероятностей Y. Например, если у нас есть цепочка W→Z→Y ← X, то фиксирование значения Z, например. путем кондиционирования/стратификации или выполнения Z делает значение W неактуальным. Во время манипуляций с do-calculus это правило используется для вставки/удаления наблюдений.

Поначалу правило 3 кажется слишком тривиальным, чтобы его формулировать: если Z не имеет прямой или опосредованной причинно-следственной связи с Y, то выполнение Z не должно влиять на вероятность Y:

P(Y| do(Z) = P(Y)

именно так это правило резюмируется в «Книге почему». Однако исходное определение правила, данное Перлом, охватывает ситуацию с обусловливанием нескольких переменных:

P(Y| do(Z), do(X), W) = P(Y| do(X), W).

Это не требует прямой или опосредованной причинно-следственной связи между Z и Y, и, если Z является предком W, не существует открытого лазейки от Z к Y. Обоснование правило таково: 1. do(Z) удаляет все стрелки, входящие в Z, так что не может быть корреляции бэкдора; 2. если из Z не выходит стрелка, которая ведет прямо или в конце концов к Y, то она не может иметь никакого влияния на Y. Уточнение о том, что Z не является предком W, объяснить сложнее и требует отдельного поста , но объясняется в приложении к статье Перла 1995 года по исчислению, указанному в разделе «Дополнительное обучение». Правило 3 используется для вставки/удаления do-оператора в выражение.

Если мы знаем причинно-следственную диаграмму для системы, то можем упростить выражение вида P(Y|do(X)) до P(Y) или P(Y|do(X), Z) = P(Y| X, Z), что затем позволяет нам рассчитать эффект вмешательства do(X) на основе простого наблюдательного исследования. То есть нам не нужно на самом деле проводить эксперимент do(X). Мне кажется возможным, что могут быть значения х, которые невозможно наблюдать после того, как лазейка была обусловлена, и что для нелинейных отношений это может означать, что определенные действия (Х=х) могут быть недостижимы без вмешательства. эксперимент. Я не изучал литературу, чтобы узнать, обсуждалось ли это где-то еще.

Чтобы проиллюстрировать ситуацию, когда избегание интервенционного эксперимента может быть особенно важно, Джудея Перл приводит следующий пример в «Книге почему»: как мы определяем влияние артериального давления на смертность? Мы не можем напрямую изменить кровяное давление людей. Было бы слишком технически сложно пытаться манипулировать им, а преднамеренное его повышение было бы, возможно, аморальным, поскольку мы ожидаем, что это будет вредно для здоровья. Однако do-calculus может позволить нам оценить эффект вмешательства без фактического проведения эксперимента. Все это зависит от соответствующей причинно-следственной диаграммы и надежных данных наблюдений, но с ними мы могли бы оценить эффекты гипотетического вмешательства, просто собирая наблюдения без вмешательства.

Выводы

Причинно-следственные диаграммы позволяют обобщить наше понимание причинно-следственных связей внутри системы. Коррекцию бэкдора можно использовать для проверки согласованности причинно-следственной диаграммы с данными — приводит ли блокировка всех предполагаемых бэкдоров между X и Y к ожидаемой корреляции или к отсутствию корреляции между ними?

do-оператор обеспечивает формальную нотацию для указания разницы между простой статистической корреляцией и причинно-следственной связью и, следовательно, с помощью do-исчисления позволяет вычислять результаты интервенционных исследований на основе данных пассивных наблюдений. Последнее потенциально довольно опасно, поскольку для правильного применения до-исчисления требуется правильная причинно-следственная диаграмма, которую трудно проверить без соответствующего интервенционного эксперимента (экспериментов). Таким образом, в то время как эти методы могут быстро идентифицировать ключевые взаимосвязи в изучаемой системе, искушение поднять данные наблюдений до статуса интервенционных данных может привести к неверным медицинским и общественным решениям. В конечном счете, смысл установления причинно-следственной связи заключается во вмешательстве в систему, а это означает, что предполагаемые причинно-следственные связи должны быть проверены интервенционными экспериментами, особенно до развертывания решения проблемы.

Дальнейшее обучение

Книга «Почему: Новая наука о причине и следствии»; Джуда Перл, Дана Маккензи; Пингвин Великобритания, 15 мая 2018 г.

Биометрика (1995), 82,4, стр. 669–710 Причинно-следственные диаграммы для эмпирических исследований; Иудейская жемчужина.

Sociedad de Estad´ıstica e Investigacion Operativa Test (2003) Vol. 12, №2, с. 281–345 Статистика и причинно-следственные связи: обзор; Иудейская жемчужина; R282-TEST.pdf (ucla.edu)

Онлайн-курс лекций Брэди Нила:

Коррекция бэкдора: 1.5 — Causation in Observational Studies — YouTube

Бэкдор и каузальные миры: 4 — Каузальные модели — YouTube

https://youtu.be/AuZu0L0PEgk

Введение в причинно-следственные связи (bradyneal.com)

Рандомизированные контрольные испытания, корректировка черного хода, корректировка парадного входа и исчисление: 5 — Рандомизированные эксперименты и идентификация https://youtu.be/9X4pR4jvKmM