본문 바로가기
PLTR https://finance.yahoo.com/news/palantir-wins-100-million-us-193407838.html?guccounter=1&guce_referrer=aHR0cHM6Ly93d3cuZ29vZ2xlLmNvbS8&guce_referrer_sig=AQAAAAk4lTMPpb7agH1KUXnrCzQxH4lSsoij2dUvlSycaQJJwW0jeSMHVhuR35mur0O_tl58cA6WwOGLsJQB3RrJT112pYHYfpIs4v8avxha7PwYPaojzlJcGk1uyYTxZNtbwfa172xuar22AEE3ksPXWs0yuesPhESRw-QbX4qF4Bkj Palantir Wins $100 Million US Contract for AI Targeting Tech(Bloomber.. 2024. 9. 21.
Mendelian Randomization (2) - How to solve genetic pleiotropy? MR의 전제조건에서 다뤘듯이, Genetic variant는 risk factor를 경유하지 않고 outcome에 영향을 주지 않아야 한다. (aka. exclusion restriction)  하지만 실상 이런 경우를 strict하게 지키기는 쉽지 않기 때문에, 다양한 추정 방법들이 존재하게 되는데, median estimator와 MR Egger regression이 그것이다. 전자는 적어도 절반은 pleiotropic effect가 없다 가정한다. Egger regression은 본래 meta-analysis에서 small study bias (작은 연구일수록 더 dramatic한 결과를 싣기 쉬워 bias가 생기기 쉽다)를 detect하기 위한 tool이었다. Egger regression에서의 .. 2024. 9. 20.
Mendelian Randomization - Essential for study design 내가 보려고 정리한 글. 연구를 시작하며 Outline을 짤 때, 방법을 이해하고 한계, 주의해야할 점을 알아야 적절한 dataset과 분석 방법을 결정할 수 있다. 막연하게 내가 생각한 주제는 migraine과 stroke간의 causal relationship에 대한 것이었는데, 이를 구체화하는 과정에 mendelian randomization에 대한 이해가 필수적이라는 것을 깨닫게 되었다. 이에 여러 논문들을 읽으며 중요하다고 느낀 것들을 정리하고자 한다. MR, Mendelian randomization은 genetic variation 즉 instrumental variable(IV)를 인과관계를 규명하고자 natural experiment로 쓰는 방법이다. Observational study의.. 2024. 9. 20.
LD Block 에 대해 1. 왜 R² 값을 기준으로 SNP들을 묶는가?R² 값은 두 SNP가 얼마나 상관되어 있는지를 나타내는 대표적인 지표로, LD 구조를 시각화할 때 중요한 역할을 합니다. 보통 연구자들이 R² 값이 높은 SNP들을 기준으로 묶는 이유는, 같은 유전적 블록 내에서 연관된 변이들이 함께 유전될 가능성이 높기 때문입니다. 이를 통해 변이들이 어떻게 상속되는지, 그리고 특정 질병에 어떻게 기여할 수 있는지를 추론할 수 있습니다.LD 구조를 분석할 때 R² 값을 사용하는 이유는:유전적 연관성: R² 값이 높은 SNP들끼리는 대체로 서로 같은 유전적 정보를 가지고 있을 가능성이 큽니다. 따라서, 어떤 변이를 분석하든 비슷한 결과를 낼 수 있다는 가정을 세울 수 있습니다.효율성: 유전적으로 밀접하게 연관된 SNP들끼리.. 2024. 9. 12.
PRS calculation (2024 GENESIS-K 유전체 강의 정리) PRS 계산의 Concept은 아래와 같다.  PRS는 Risk allele들의 합산 score로 계산되는데, 해당 SNP의 Weight인 effect size가 가장 중요하다. 이 Beta distribution을 어떻게 추정하는지가 오늘의 주제다.미리 결론부터 말하자면 PGS Catalogue에 등재된 PGS 있다면 그대로 사용하는 것을 권한다. 이러한 방법으로는 크게 C-T (Clumping + Thresholding), Shrinkage, Bayesian approach로 나누어진다.  1. C-T : PRSice2 C-T든 P-T(Pruning)는 모두 LD relationship을 고려해서 가장 관계된 SNP만을 선택하는 과정이다.Threshold의 경우 best-fit PRS를 제공하기 위해.. 2024. 8. 26.
GWAS의 Application (3) GWAS의 결과들은 질병 위험도를 예측하거나 특정 형질의 genetic architecture를 이해하는데 쓰일 수 있다. 각각 알아보자. 1. Risk predictionPRS(Polygenic risk score)은 independent한 discovery cohort의 GWAS summary statistics를 사용해 target cohort에서의 risk of disease를 예측하는 방법이다. Risk allele들의 합산 score로 계산된다. PRS를 계산하는 데는 많은 방법들이 있지만 가장 Practical 한 method는 Pruning and thresholding이며 이외에도 여러 방법이 있다. 최대 예측 정확도는 질병의 SNP 기반 유전력 — 모든 SNP에 의해 설명되는 표현형 분.. 2024. 8. 24.