GENETICS

헷갈리는 유전체 숫자? 한 번에 정리해 드립니다!

단풍국그린피는30달러 2025. 2. 24. 18:08
반응형

https://old-ib.bioninja.com.au/standard-level/topic-3-genetics/31-genes/gene-comparisons.html

 

🔹 1. 인간 유전체 (Human Genome) 기본 숫자

염기쌍 수 (Base pairs, bp) ~30억 bp (3 × 10⁹ bp) 인간 1세포의 DNA 총 길이
염색체 개수 (Chromosomes) 46개 (23쌍) 23쌍(부모로부터 1쌍씩), 22쌍 상염색체 + 1쌍 성염색체 (XX/XY)
유전자 수 (Protein-coding genes) 25,000개 단백질을 코딩하는 유전자 수
전체 유전체 중 단백질을 코딩하는 부분 1~2% 대부분은 비코딩(non-coding) DNA
미토콘드리아 DNA (mtDNA) 길이 16,569 bp 세포 소기관인 미토콘드리아에 있는 작은 원형 DNA

🔹 2. 유전체 변이 관련 숫자

사람 간 DNA 서열 차이 0.1% (~300만 bp 차이) 개인 간 유전체 차이 (SNP 등 포함)
SNP (단일 염기 다형성) 수 ~1억 개 인간 유전체 내 존재하는 전체 SNP 개수
개인이 보유한 SNP 개수 ~300만 개 개인이 보유한 SNP 수 (인간 간 차이 발생 원인)
인델 (Indel) 변이 비율 전체 변이의 10% 삽입/결실(indel)은 변이의 약 10% 차지
구조적 변이 (SV) 크기 50bp 이상 SV는 50bp 이상의 큰 변이 (결실, 중복, 역위 등 포함)

🔹 3. 유전체 분석 관련 숫자

개념숫자설명

Short-read 시퀀싱 길이 (Illumina) 150~300bp Illumina short-read length
Long-read 시퀀싱 길이 (ONT, PacBio) 수 kb ~ 100kb+ 긴 리드(long read)는 구조 변이 탐지에 유리
WGS (전장유전체시퀀싱) 평균 커버리지 30× 인간 유전체 WGS에서 평균 30배 이상 커버리지 사용
Exome sequencing (엑솜 시퀀싱) 커버리지 100× 이상 엑솜(코딩 영역)만 분석할 때 높은 커버리지 필요
1명의 WGS 데이터 용량 200GB 30× WGS 데이터를 저장하는데 필요한 용량

 

WGS 30x는 base pair가 30번 이상 읽혔다는 뜻이다.


🔹 4. 유전자 발현 & 단백질 관련 숫자

mRNA 반감기 ~10시간 (평균) 유전자마다 다르지만, 평균적으로 mRNA는 몇 시간 지속됨
리보솜이 번역하는 속도 ~10-20 아미노산/초 단백질 합성 속도
코돈 개수 (Codons) 64개 (4³ = 64) 3개의 염기로 이루어진 코돈 조합 수
아미노산 개수 20개 생물에서 사용되는 아미노산 개수
단백질 길이 (평균) 400개 아미노산 인간 단백질의 평균 길이
tRNA 종류 ~45개 인간 세포 내 존재하는 tRNA 종류

🔹 5. 세포 & 복제 관련 숫자

인간 세포 개수 ~37조 개 (~3.7 × 10¹³) 성인의 평균 세포 개수
세포 핵 속 DNA 길이 ~2m (1개 세포 기준) 1개의 세포 핵 속에 존재하는 DNA를 펼치면 약 2m
DNA 복제 속도 ~50 bp/초 (진핵생물) 세포가 DNA를 복제하는 속도
세포 주기(G1-S-G2-M) 길이 ~24시간 (평균) 정상적인 세포 분열 주기 시간
DNA 돌연변이율 ~10⁻⁸ ~ 10⁻⁹ / bp / 세대 세대당 염기쌍별 돌연변이 발생 확률

🔹 6. 질병 & 유전 정보 관련 숫자

단일 유전자 질환 수 ~7,000개 이상 단일 유전자 돌연변이로 발생하는 질환 개수
암 발생 확률 (평균) 약 38~40% 평생 동안 암에 걸릴 확률
희귀질환 발생 확률 7% (전체 인구 중) 희귀 유전 질환이 있는 사람 비율
알츠하이머 관련 유전자 (APOE4) 위험 증가 3~12배 APOE4 유전자형이 있는 경우 알츠하이머 위험 증가
다운증후군 (Trisomy 21) 발생 확률 ~1/700 출생아 염색체 이상으로 발생하는 질환 중 가장 흔함

🔹 7. 실험 기법 관련 숫자

PCR 증폭 사이클 수 35 cycles PCR에서 DNA 증폭할 때 보통 사용
CRISPR-Cas9 절단 정확도 5bp Cas9이 자르는 위치의 정확도
단일 세포 RNA-seq 검출 가능한 유전자 수 ~10,000개 이상 Single-cell RNA sequencing으로 검출 가능

🔹 8. 기타 재미있는 숫자

사람 유전체를 1초에 1bp씩 읽는다면? 약 95년 걸림 인간 유전체 30억 bp를 하나씩 읽으면
DNA를 실처럼 잇는다면? 지구에서 태양까지 600번 왕복 가능 (~178억 km) 인간 몸속 모든 DNA를 펼치면
DNA는 얼마나 작은가? 직경 2nm (2 × 10⁻⁹ m) DNA 이중 나선의 굵기

정리

  • 유전체 크기: 인간 30억 bp, 단백질 코딩 영역 1~2%
  • 유전자 개수: 20,000~25,000개
  • 변이(SNP, indel, SV): 개인 간 SNP 차이 약 300만 개
  • 세포 내 DNA: 한 세포에 2m 길이의 DNA 포함
  • 시퀀싱: Short-read(150~300bp), Long-read(수 kb 이상)
  • 유전 질환: 단일 유전자 질환 7,000개 이상

 

References.

  1. Kim et al. (2016)
    Kim, S., Kim, S., & Kim, H. (2016). An International Patent Study on Human Genome Research (I): Gene Fragments, Genetic Diagnosis, and Somatic Gene Therapy. Korean Journal of Medicine and Law, 24(2), 141-173.
    DOI: 10.17215/kaml.2016.12.24.2.141
  2. Cho (2018)
    Cho, H. (2018). Study on Pathogenic Genetic Variations of the Parkin Gene in Parkinson's Disease. Master’s thesis, Seoul National University.
    URL: http://www.riss.kr/link?id=T14818103&outLink=K
  3. Kim et al. (2018)
    Kim, M., Kim, S., & Kim, J. (2018). A Knowledge-Based System Supporting Visual Analysis of Disease-Gene-Variant Relationships. Journal of Information Science, 45(1), 1-12.
    DOI: 10.5626/JOK.2018.45.1.1
  4. Kim et al. (2016)
    Kim, S., Kim, S., & Kim, H. (2016). An International Patent Study on Human Genome Research (II): Gene Editing. Korean Journal of Medicine and Law, 24(2), 175-204.
    DOI: 10.17215/kaml.2016.12.24.2.175
  5. Lee et al. (2018)
    Lee, J., Kim, S., & Kim, J. (2018). Pathogenicity Prediction of Single Nucleotide Variants Related to Hereditary Cancer Using Deep Neural Networks and Random Forest. Journal of Information Science, 45(2), 65-75.
    DOI: 10.5626/JOK.2018.45.2.65
  6. Kim et al. (2017)
    Kim, S., Kim, S., & Kim, H. (2017). International Regulations on Human Embryo Gene Editing and Future Tasks of Korean Bioethics Law. Korean Journal of Medicine and Law, 25(1), 1-30.
    DOI: 10.17215/kaml.2017.06.25.1.1
  7. Kim et al. (2017)
    Kim, H., Kim, S., & Kim, J. (2017). Study on the Rare Disease Medical Support System: Interpretation of Genetic Testing Results and Genetic Counseling Support. Journal of Medical Research, 17(2), 351-370.
    DOI: 10.12793/jmh.2017.17.2.351
반응형