좋은 기회로 Bioinformatics를 공부하는데
임상의사들이 이해하는 유전체학의 깊이가 정말 얕음을 느꼈습니다.
직접 분석을 돌리진 않더라도, 그분들이 쓰는 언어와 그 맥락을 조금이라도 이해해야 향후에도 막힘이 없이 더 큰 문제를 해결할 힘을 가지게 될 것입니다.
코드랑은 별개로 이게 pragmatic하게 어떻게 쓰이고, 어떤 의미를 가지는 과정인지를 이해하는데 도움을 주기 위해 이 글을 작성합니다.
우선 일반적으로 많이 듣는 용어들의 개념을 정리해보겠습니다.
유전체 연구를 처음 시작하면서 누구나 한번쯤 헷갈리는 개념들이 있습니다. 바로 PCR, qPCR, Sanger sequencing, NGS, SBS, WGS 같은 용어들이죠.
이 기술들은 서로 연관되어 있지만 ‘기술 자체’인지 ‘목적인지’, 또는 ‘시퀀싱인지 아닌지’ 구분이 안 돼 처음 공부할 때 많이 혼란스럽습니다.
오늘은 이 모든 개념을 실제 생활 비유를 사용해 직관적으로 이해할 수 있게 풀어보았습니다.
DNA 증폭 기술 | PCR | DNA 복사 | ❌ | 복사기 |
qPCR | DNA 복사 + 실시간 정량 | ❌ | 카운터 달린 복사기 | |
시퀀싱 기술 | Sanger sequencing | DNA 염기서열 읽기 | ✅ | 문장을 한 글자씩 색으로 읽기 |
NGS | 대규모 DNA 병렬 시퀀싱 | ✅ | 책을 찢어 여러 사람이 동시에 읽기 | |
NGS의 방식 | SBS (Illumina) | 형광 염기로 DNA를 읽는 방식 | ✅ | 색깔 펜으로 글자 하나씩 쓰며 읽기 |
응용 목표 | WGS | 유전체 전체를 읽는 작업 | ✅ (NGS 사용) | 책 전체를 처음부터 끝까지 정독하기 |
🧪 PCR & qPCR: DNA 복사기와 그 진화형
PCR은 특정 DNA 구간만 수십억 번 복사하는 기술입니다.
📚 DNA가 책이라면 PCR은 특정 페이지를 복사기 돌려 무한 복사하는 것과 같습니다.
- PCR: 단순히 복사만 함
- qPCR: 복사하면서 몇 장 복사됐는지 실시간 측정 가능 → COVID 검사, 바이러스 정량 등에 필수
❗중요: 이들은 ‘시퀀싱’이 아니라 증폭(복제) 기술입니다.
📖 Sanger Sequencing: 한 줄 한 줄 읽는 방식
생어 시퀀싱은 DNA를 한 염기씩 천천히 읽어가는 1세대 시퀀싱 기술입니다.
- 매 복사 시도에서 무작위로 멈추도록 하고
- 끝나는 염기를 색으로 표시해
- 길이 순서대로 정렬하여 DNA 염기서열(A, T, C, G)을 알아냅니다.
📌 비유: 문장을 복사하다가 랜덤하게 끝나는 여러 버전을 만들고, 끝 글자의 색깔을 읽어 문장을 해독하는 것.
장점: 정확도 높음 (99.99%)
단점: 느리고 비쌈 → 소규모 검사용
🧬 NGS: 대규모로 DNA 읽기
NGS(Next Generation Sequencing)는 수백만 개의 DNA 조각을 동시에 읽는 기술입니다.
➡️ 생어 방식은 한 줄씩 읽지만, NGS는 책을 조각내서 여러 명이 각자 읽고, 다시 조립하는 식입니다.
- 읽는 속도, 처리량, 비용 면에서 혁신을 가져왔습니다.
- 대부분의 유전체 분석, RNA-seq, 질병 유전자 탐색 등은 NGS 기반으로 수행됩니다.
✍️ SBS: NGS의 대표적 방식 (Illumina)
SBS(Sequencing by Synthesis)는 Illumina에서 사용하는 NGS 방식입니다. 개인적으로 저렇게 PCR extension 하는 부분이 너무 신기하고 흥미로웠습니다ㅎㅎㅎ
- DNA를 복사하면서 형광으로 색을 표시된 염기 하나씩 추가
- 카메라가 각 주기의 색깔을 찍어 염기 하나씩 확인
- 모든 클러스터(점)에서 동시에 일어남 → 병렬성 뛰어남
📌 비유: 수많은 작가가 동시에 글을 쓰고, 각 글자의 색을 통해 내용을 읽는 것
📘 WGS: 책 전체를 정독하는 것
WGS(Whole Genome Sequencing)는 기술이 아니라 분석 목적입니다.
즉, “무엇을 하느냐”에 해당합니다.
- 유전체 전체(약 30억 개 염기)를 한 번에 읽는 분석
- 보통 NGS 기술로 수행
- 과거엔 생어 시퀀싱으로 수행했지만, 매우 오래 걸림
- 현재는 NGS 덕분에 며칠 만에 WGS 가능
📌 비유: 책 전체를 페이지 하나 빠짐없이 처음부터 끝까지 읽는 것
✅ 정리 요약
- PCR, qPCR은 DNA를 읽지 않고 복사/측정하는 기술 → 시퀀싱 X
- Sanger와 NGS는 DNA 염기서열을 읽는 시퀀싱 기술
- NGS는 대규모 병렬 시퀀싱 기술이고, SBS는 그 방식 중 하나
- WGS는 기술이 아니라 ‘전체 유전체를 읽는 분석 목표’
다음 글에서는 아래 글 등을 참고해서 NGS라는 Sequencing의 큰 흐름과 이전 Sanger sequencing과 대비해서 어떤 점이 가장 획기적인 지, reference gemone들은 어떤 것들을 쓰는지에 대해 다뤄보도록 하겠습니다.
https://learn.gencore.bio.nyu.edu/ngs-file-formats/
NGS Sequencing Technology and File Formats – NGS Analysis
There are a variety different sequencing technologies as well as file formats used in sequence analysis. Below we describe how next-generation sequencing works as well as file formats that are most commonly encountered, including those generated by the seq
learn.gencore.bio.nyu.edu
'GENETICS' 카테고리의 다른 글
Missing heritability (0) | 2025.05.14 |
---|---|
유전학에서 Additive Feature와 Dominance Feature 이해하기 (0) | 2025.02.28 |
헷갈리는 유전체 숫자? 한 번에 정리해 드립니다! (0) | 2025.02.24 |
ACMG 가이드라인이란? (0) | 2025.02.24 |
Exon to Genome (2) (0) | 2024.11.06 |
댓글