상세 컨텐츠

본문 제목

Mendelian Randomization 1

Omics

by zinomi 2024. 3. 12. 14:46

본문

Mendelian Randomization (MR)은 유전학적 변이를 도구변수로 사용하여 노출(위험 요소)과 결과 사이의 인과 관계를 추론하는 연구 방법론이다. 특정 유전 변이가 특정 위험 요소에만 영향을 미치고, 그 위험 요소가 특정 결과에 영향을 미친다는 가정 하에 인과 관계를 추론한다. 이 방법은 유전학에서 Mendel의 법칙을 기반으로 하며, 무작위 대조시험(Randomized Controlled Trials, RCT)에서의 무작위 배정 원리를 유전학적 맥락에서 적용한 것이라고 볼 수 있다.

무작위 대조시험

 

RCT의 랜덤 배정과 MR의 유사성

RCT에서는 참가자를 무작위로 두 그룹(치료 그룹과 대조 그룹)으로 배정하여 치료의 효과를 평가한다. 이러한 무작위 배정은 치료와 대조 그룹 간의 기존의 차이를 최소화하여 치료 효과에 대한 정확한 추론을 가능하게 한다. 결과적으로는 분석 결과 어떤 차이가 관찰된다면 그 차이는 치료의 직접적인(인과적인) 결과로 간주되는 것이다.

랜덤

핵심적으로, MR에서는 개인의 유전적 변이가 "무작위로 배정된 도구 변수"의 역할을 한다. 사람이 태어날 때 부모로부터 무작위로 유전자를 받는 과정은 자연스러운 랜덤 과정이다. 다시 말해, 이러한 유전적 변이는 개인의 생활 습관이나 사회경제적 지위와 독립적이다. 따라서, 특정 유전적 변이가 어떤 건강 결과에 대해 갖는 영향을 확인해볼 때, 그 유전적 변이는 특정 노출(예를 들어, 콜레스테롤 수치)에만 영향을 미치고, 그 노출이 결과(예를 들어, 심혈관 질환)에 영향을 미친다면, 우리는 유전적 변이를 활용해서 노출과 결과 사이의 인과 관계를 추론할 수 있다.

 

MR의 원리/기반

MR의 핵심은 유전적 변이를 도구 변수로 사용한다는 것인데, 이 과정에서 다음의 세 가지 중요한 가정이 필수적으로 충족되어야 한다.

  1. 관련성(Relevance): 선택된 유전적 변이는 노출(위험 요소)와 강력한 연관성을 가지고 있어야 한다.
  2. 독립성(Independence): 유전적 변이는 노출을 통해서만 결과에 영향을 미치며, 결과에 대한 어떠한 혼동 변수(Confounders 또는 Confounding variables)와도 독립적이어야 한다.
  3. 배제 제한 조건(Exclusion Restriction): 유전적 변이가 결과에 직접적으로 영향을 미치지 않고, 오직 노출을 통해서만 결과에 영향을 미쳐야 한다.

 

방법론 종류

MR 연구에는 다양한 방법론이 사용될 수 있다. 가장 크게는 One-Sample MR과 Two-Sample MR로 구분을 할 수 있다. 이 두가지 방식은 사용하는 데이터의 출처와 구조에 따라 다르다.

One-sample MR

One-sample MR에서는 노출(위험 요소)과 결과 변수가 모두 같은 샘플로부터 측정이 된다. 다시 말해, 이 방식은 모든 관련 데이터가 하나의 코호트나 하나의 데이터셋에서 수집되었을 때 사용된다. 이 방식의 장점은 노출과 결과 데이터가 동일한 개인으로부터 얻어지기 때문에, 개인별 데이터의 일관성이 보장된다는 점이다. 그러나 충분히 크고 대표적인 샘플을 확보하기 어려울 수 있다. 이에 대한 주요 이유로는 특정 노출과 결과에 대한 데이터가 모두 있는 샘플의 수가 제한될 수 있기 때문이라는 점이 있다.

Two-sample MR

반면 Two-sample MR에서는 노출과 결과 변수가 서로 다른 두 개의 데이터셋에서 수집된다. 구체적으로, 한 샘플에서는 유전적 변이와 노출 간의 연관성을 분석하고, 또 다른 샘플에서는 유전적 변이와 결과의 관계를 분석한 경우이다. 이 방식은 서로 다른 연구나 코호트에서 수집된 데이터를 활용할 수 있기 때문에 특정 조건에 대한 데이터가 제한적인 경우에 매우 유용하다. 이 방식의 장점은 One-sample MR에서보다 더 크고, 더 다양한 데이터셋을 활용할 수 있다는 점이다. 서로 다른 데이터셋을 분석에 활용할 때 주의할 점은, 두 샘플 간의 잠재적인 차이(예를 들어, ancestry 차이, 측정 방법의 차이 등)를 고려하여 분석 결과를 해석해야 한다는 점이다.

Univariable MR (UVMR)

가장 기본적으로는 단일 노출(위험 요소)와 결과 사이의 인과 관계를 평가하는 방법인 Univariable MR 형태로 Mendelian randomization 분석을 수행한다. Univariable MR은 한 번에 하나의 노출 변수만을 고려하며, 해당 노출이 결과에 미치는 직접적인 인과 효과를 추정하기 위해 유전적 변이(도구 변수)를 사용한다. 이 접근법은 가장 기본적이며, 분석이 상대적으로 단순하고, 해석이 간단하며, 더 복잡한 MR 방법론을 사용하기 전에 많은 경우에서 초기 단계의 분석으로 활용된다.

Multivariable MR (MVMR)

Multivariable MR은 두 개 이상의 노출(위험 요소)를 동시에 고려하여, 각 노출이 결과에 미치는 인과 효과를 평가한다. 이 방법은 여러 노출 변수가 서로 상호작용하거나, 특정 노출의 효과를 다른 변수의 영향으로부터 분리하여(또는 다른 변수의 영향을 고려하여) 평가하고자 할 때 유용하다. 예를 들어, 식이와 운동량이 동시에 건강 결과에 미치는 영향을 평가하고자 할 때 Multivariable MR을 사용할 수 있다. 이 접근법은 더 복잡한 통계 모델을 필요로 한다.

 

Sensitivity Analysis 방법론

랜덤

MR 분석에서는 견고함(Robustness)을 평가하기 위하여 Sensitivity analysis를 수행한다. 대표적인 방법들로는 다음과 같은 것들이 있다.

MR-Egger

도구 변수의 유효성 가정에 대한 민감성을 검토할 때 사용한다.

Leave-one-out analysis

각 도구 변수를 하나씩 제외하고 분석을 반복하는 방식이며, 특정 도구 변수가 결과에 미치는 영향을 평가한다.

Radial MR

분석에 사용되는 다양한 도구변수들 중 Outlier를 탐지하고, 이를 제거한 후 결과의 견고함을 평가하는 방법이다.

 

 

이렇듯 MR은 RCT의 유전학적 대응물로서 관찰 연구에서의 Confounders의 영향을 줄이고 노출과 결과 간의 인과 관계를 밝힐 수 있는 강력한 도구이다. 다른 포스팅에서 Sensitivity analysis에 대한 더욱 심화된 내용과 기본 Two-sample MR에서부터 Sensitivity analysis, MVMR에 이르는 코드를 간략히 정리해보도록 하겠다.

'Omics' 카테고리의 다른 글

Mendelian Randomization 3  (0) 2024.03.22
Mendelian Randomization 2  (0) 2024.03.17
Clustering analysis와 Factor analysis  (0) 2024.03.11
리포프로틴(Lipoprotein)이란?  (0) 2024.03.06

관련글 더보기