본문 바로가기
ped file .ped 파일의 기본 구조.ped 파일은 다음과 같은 6개의 고정된 필드와, 그 뒤에 오는 각 변이에 대한 유전형 데이터로 이루어져 있습니다. 모든 변이에 대해 두 개의 대립유전자가 기록됩니다.Family ID (FID): 가계 ID를 나타냅니다.Individual ID (IID): 개체 ID입니다.Paternal ID (PID): 아버지의 ID (없을 경우 0).Maternal ID (MID): 어머니의 ID (없을 경우 0).Sex (Sex): 성별을 나타냅니다 (1 = 남성, 2 = 여성, 0 = 정보 없음).Phenotype (Phenotype): 표현형 정보 (1 = 통제, 2 = 사례, -9 또는 0 = 정보 없음).Genotype Data: 이후에는 모든 변이에 대한 유전형 데이터가 대립유전.. 2024. 9. 30.
SNP와 인델의 차이 유전 변이에 대해 이야기할 때 SNP와 인델(InDel)이라는 용어를 자주 듣게 되는데, 이 두 가지는 각기 다른 변이 유형을 나타내며, 분석 방법도 조금 다릅니다. 1. SNP (Single Nucleotide Polymorphism) - 단일 염기 변이SNP란 말 그대로 단일 염기 다형성을 의미합니다. 쉽게 말하면 DNA 서열에서 단 하나의 염기(A, T, G, C)가 다른 염기로 바뀐 변이를 말하죠. 예를 들어, 정상적인 서열이 AAGCCTA라고 할 때, 누군가는 이 서열의 두 번째 A가 G로 바뀌어 AGGCCTA가 되는 변이를 가질 수 있어요. 이런 변화가 바로 SNP입니다.SNP는 가장 흔한 유전적 변이 형태로, 한 염기가 바뀌면서 질병의 위험이나 특정 유전적 특성에 영향을 미칠 수 있습니다. .. 2024. 9. 30.
LD Block 에 대해 1. 왜 R² 값을 기준으로 SNP들을 묶는가?R² 값은 두 SNP가 얼마나 상관되어 있는지를 나타내는 대표적인 지표로, LD 구조를 시각화할 때 중요한 역할을 합니다. 보통 연구자들이 R² 값이 높은 SNP들을 기준으로 묶는 이유는, 같은 유전적 블록 내에서 연관된 변이들이 함께 유전될 가능성이 높기 때문입니다. 이를 통해 변이들이 어떻게 상속되는지, 그리고 특정 질병에 어떻게 기여할 수 있는지를 추론할 수 있습니다.LD 구조를 분석할 때 R² 값을 사용하는 이유는:유전적 연관성: R² 값이 높은 SNP들끼리는 대체로 서로 같은 유전적 정보를 가지고 있을 가능성이 큽니다. 따라서, 어떤 변이를 분석하든 비슷한 결과를 낼 수 있다는 가정을 세울 수 있습니다.효율성: 유전적으로 밀접하게 연관된 SNP들끼리.. 2024. 9. 12.
GWAS - 전장 유전체 분석 Introduction (1) GWAS, 즉 Genome-wide association studies는 전장 유전체 분석이라는 분야이다. 최근 GWAS와 연계한 Stroke 연구주제를 시작할 기회가 있어 이제야 듣게 되었는데...나 또한 굉장히 생소한 개념이라 이에 대해 조금씩 주워들으니 정말 기초부터ㅠ 다시 짚어야되는 부분이 상당히 많았다. Concept 자체는 모든 유전체 위치에 대해, 내가 연구하고자 하는 형질 및 질병과 연관성을 연구하는 것인데 아직까진 감이 잘 안 온다. 이에 대해 두마디 정밀 의료라는 블로그에서 정말 자세히 설명을 많이 해주셨는데, GWAS는 일반적으로 Case (관심 형질을 가진 집단; 환자군) 와 Control (형질을 갖지 않는 집단; 정상군)의 두 집단의 유전 정보를 얻은 후에 서로 비교하여, cas.. 2024. 8. 18.