1. 왜 R² 값을 기준으로 SNP들을 묶는가?
R² 값은 두 SNP가 얼마나 상관되어 있는지를 나타내는 대표적인 지표로, LD 구조를 시각화할 때 중요한 역할을 합니다. 보통 연구자들이 R² 값이 높은 SNP들을 기준으로 묶는 이유는, 같은 유전적 블록 내에서 연관된 변이들이 함께 유전될 가능성이 높기 때문입니다. 이를 통해 변이들이 어떻게 상속되는지, 그리고 특정 질병에 어떻게 기여할 수 있는지를 추론할 수 있습니다.
LD 구조를 분석할 때 R² 값을 사용하는 이유는:
유전적 연관성: R² 값이 높은 SNP들끼리는 대체로 서로 같은 유전적 정보를 가지고 있을 가능성이 큽니다. 따라서, 어떤 변이를 분석하든 비슷한 결과를 낼 수 있다는 가정을 세울 수 있습니다.
효율성: 유전적으로 밀접하게 연관된 SNP들끼리 묶으면 하나의 대표 SNP만으로도 그 블록의 나머지 변이들을 설명할 수 있게 됩니다. 이것이 연구자들이 유전적 변이를 분석할 때 R² 값을 기준으로 대표적인 SNP를 선택하는 이유입니다.
2. 왜 R² 값이 높은데도 같은 블록에 속하지 않는가?
예로 든 Figure 에서, 3번째 SNP와 4번째 SNP는 R² 값이 94임에도 불구하고 다른 블록에 속하는 이유는 다음과 같습니다:
LD 블록의 정의는 물리적 거리와 재조합률을 기반으로 설정됩니다. LD 블록은 재조합이 적게 일어나는 구역으로 정의되며, 이 구역 안에서는 유전적 변이들이 거의 항상 함께 유전됩니다. 따라서, R² 값이 높아도 물리적 위치나 재조합 경계에 따라 다른 블록에 속할 수 있습니다.
LD 블록의 경계는 재조합 hotspot을 기준으로 설정됩니다. 재조합이 빈번하게 일어나는 구간을 중심으로 블록이 나뉘기 때문에, 변이들이 물리적으로 가까워도 재조합 hotspot을 경계로 다른 블록에 속할 수 있습니다.
Haploview와 같은 도구로 LD 블록을 정의할 때, **Gabriel et al. (2002)**에서 제안된 방식이 자주 사용됩니다. 이 방식에서는 두 SNP 간의 R² 값뿐만 아니라 D' 값, 물리적 거리, 그리고 재조합율을 고려하여 블록을 정의합니다. 따라서 R² 값이 높은 두 SNP라 해도 재조합 hotspot이 그 사이에 있다면 다른 블록으로 나뉠 수 있습니다.
3. LD 블록은 이미 정의되어 있는 것인가?
LD 블록은 고정된 구조가 아닙니다. 연구자들이 데이터를 분석할 때, SNP 간의 상관관계를 보고 LD 블록을 정의합니다. 재조합 빈도와 유전적 거리를 기준으로 LD 블록이 설정되며, 이는 연구자들이 사용한 데이터와 분석 방법에 따라 달라질 수 있습니다.
재조합 hotspot이 존재하는 위치를 기반으로, 블록이 정의되며, 이는 고정적인 것이 아니라 연구자가 사용하는 데이터나 분석 방법에 따라 다를 수 있습니다.
따라서, 같은 SNP들이라도 다른 집단에서 분석하면 다른 LD 블록 구조가 나올 수 있습니다. 예를 들어, 유럽인과 아시아인 집단에서 같은 SNP를 분석하더라도, 재조합 패턴이 다르기 때문에 LD 블록이 다르게 나올 수 있습니다.
요약:
R² 값은 두 SNP 간의 유전적 연관성을 나타내는 중요한 지표로, LD 블록을 설정하거나 SNP 선택 시 주로 사용됩니다.
그러나 LD 블록의 경계는 R² 값만으로 정해지지 않으며, 재조합률이나 물리적 거리와 같은 다른 요소들이 함께 고려됩니다.
LD 블록은 미리 정의된 것이 아니라, 데이터 분석 과정에서 연구자가 사용한 집단 및 분석 방법에 따라 다르게 설정됩니다.
'GENETICS' 카테고리의 다른 글
Mendelian Randomization (2) - How to solve genetic pleiotropy? (0) | 2024.09.20 |
---|---|
Mendelian Randomization - Essential for study design (1) | 2024.09.20 |
PRS calculation (2024 GENESIS-K 유전체 강의 정리) (3) | 2024.08.26 |
GWAS의 Application (3) (0) | 2024.08.24 |
GWAS 의 전반적 과정 (2) (0) | 2024.08.22 |
댓글