본문 바로가기
GENETICS

Mendelian Randomization - Essential for study design

by 단풍국그린피는30달러 2024. 9. 20.
반응형

내가 보려고 정리한 글.

 

연구를 시작하며 Outline을 짤 때, 방법을 이해하고 한계, 주의해야할 점을 알아야 적절한 dataset과 분석 방법을 결정할 수 있다. 막연하게 내가 생각한 주제는 migraine과 stroke간의 causal relationship에 대한 것이었는데, 이를 구체화하는 과정에 mendelian randomization에 대한 이해가 필수적이라는 것을 깨닫게 되었다. 이에 여러 논문들을 읽으며 중요하다고 느낀 것들을 정리하고자 한다.

 

MR, Mendelian randomization은 genetic variation 즉 instrumental variable(IV)를 인과관계를 규명하고자 natural experiment로 쓰는 방법이다. Observational study의 가장 큰 문제점 중 하나는 risk factor와 outcome에 모두 영향을 줄 수 있는 confounder를 찾아내고 제한하는 것이 쉽지 않다는 것이다. 그래서 RCT가 그만큼 Valuable 한 것이기도 하고..  그런데 MR의 경우에는 unmeasered confounding에 관한 문제를 극복할 수 있다. 

 

Jager KJ et al. Confounding: what it is and how to deal with it. Kidney Int. 2008

 

이는 MR에서 사용하는 genetic variants가 conception, 즉 착상 때부터 결정되어 있기 때문에 가능한 것이다. 

흔한 예시로 alcohol과 BP 사이 관계를 알고 싶을 때, ALDH2 gene의 minor allele A를 가지고 있으면 

acetaldehyde의 대사를 느리게 해 알코올 섭취시 부작용들을 일으킨다. 이를 가지고 있는 사람과 그렇지 않은 사람의 혈압을 비교했을 때 A allele을 하나 이상 가지고 있는 사람들의 혈압이 낮다면, lower alcohol consuption이 BP를 낮춘다는 결론까지 도출해낼 수 있다. 

 

뭔가 좀 너무 쉬운 것 같다. 따라서 항상 전제조건이 붙는다. 

주요 세가지 전제조건은 어떤 리뷰 논문에서나 제시를 한다. 

 

1. Relevance assumption : genetic variant는 항상 risk factor of interest와 상관이 있어야 한다.

 

 

2. Independence assumption : genetic variant는 outcome과의 관계에서는 unmeasured confounder가 있으면 안된다.  

independence assumption examples.

 

3. Exclusion restriction : genetic variant는 outcome을 오직 risk factor of interest를 통해서만 영향을 끼칠 수 있다. (horizontal pleiotropy가 그렇지 않은 경우이며, ALDH2 variants가 smoking에도 영향을 주고 그게 BP에도 영향을 끼치는 경우를 말한다)

 

 


 

보통 MR에 필요한 genetic variant, risk factor, outcome data를 하나의 sample에서 모으는데, (= single sample MR) 이게 여의치 않은 대부분의 연구에서는 두 개의 separate study population을 사용하는 two sample MR을 차용한다. (앞선 예시로 들면 ALDH2 variant - alcohol consumption을 한 sample에서, ALDH2 variant - BP를 나머지 sample에서) 한 study population에서 구하기 힘든 이유도 있지만, 이렇게 하면 study size를 늘리는 데 큰 도움이 되어 정확도를 높일 수 있다. 

 

차례대로, genetic variant를 구하는 과정부터 살펴보면, single or multiple을 쓸 수 있는데 multiple genetic variants를 많은 연구에서 사용하고 있고, snp, 즉 single nucleotide polymorphism을 statistical regression model에서의 individual instrumental variable로 활용하는 것이다. 이 외에도 allele score를 이용하기도 한다.

 

 

 

 

이어서는 Genetic pleiotropy에 대한 글을 써 보겠다.

 

 

Reference.

Davies NM, Holmes MV, Davey Smith G. Reading Mendelian randomisation studies: a guide, glossary, and checklist for clinicians. BMJ. 2018 Jul 12;362:k601. doi: 10.1136/bmj.k601. PMID: 30002074; PMCID: PMC6041728.

반응형

댓글