기금넷 공식사이트 - 헤지 펀드 - YiGene|전유전체 DNA 메틸화 시퀀싱 분석 전 과정
YiGene|전유전체 DNA 메틸화 시퀀싱 분석 전 과정
전체 게놈 DNA 메틸화 실험은 어떻게 진행하나요? 기술 원리, 라이브러리 구축 및 시퀀싱 프로세스, 정보 분석 프로세스 및 연구 루틴의 네 가지 측면에서 자세히 소개됩니다.
후생적 변형은 DNA 서열을 변경하지 않고도 특성을 변경할 수 있습니다. 후성적 변형의 변화는 유전자 기능은 물론 세포 상태, 발달, 노화, 질병 등에 대해서도 중요합니다. 많은 후생유전학적 변형 중에서 가장 중요하고 널리 연구된 변형 중 하나는 DNA 메틸화이며, WGBS-seq(whole-genome methylation sequencing)은 의심할 여지 없이 가장 효과적인 연구 방법입니다.
전체 게놈 메틸화 시퀀싱은 바이설파이트의 특성을 활용하여 메틸화되지 않은 시토신(C)을 티민(T)으로 변환합니다. C로 변환되지 않고 T로 변환되지 않은 읽기 수와 단일 C 사이트에서 적용되는 모든 읽기 수의 비율입니다. 이 기술은 배아 발달, 노화 메커니즘, 질병 발생 및 발달의 후성유전적 메커니즘에 대한 포괄적인 연구와 질병 관련 후성유전적 표지 부위를 스크리닝하는 데 중요한 응용 가치를 가지고 있습니다.
전체 게놈 메틸화 시퀀싱 원리의 모식도는 다음과 같습니다.
샘플 검출 - 샘플 중단 - 라이브러리 구축 - BS 처리 - 라이브러리 품질 검사
(1) 샘플 검출
DNA 샘플의 검출에는 크게 두 가지 방법이 있습니다.
(1) 아가로스겔 전기영동을 통해 DNA 분해 정도와 오염 여부를 분석하고 이를 검출합니다. 뚜렷한 메인 밴드가 있고 밴드가 선명합니다.
Qubit 2.0은 DNA 농도를 정확하게 정량화하며 검출된 DNA의 총량은 1ug 이상입니다.
(2) 라이브러리 구축
샘플이 테스트를 통과한 후 Bioruptor 시스템을 사용하여 1.g 샘플 게놈 DNA와 메틸화되지 않은 람다 DNA를 혼합한 후 단편화합니다. 크기는 약 250bp입니다. 단편화 후 정제된 무작위로 단편화된 DNA는 T4 DNA 중합효소, Klenow 단편 및 T4 폴리뉴클레오티드 키나제의 혼합물을 사용하여 말단에서 복구되고 둔화되고 인산화됩니다. 무딘 DNA 단편은 이어서 Klenow 단편(3'-5'exo-)을 사용하여 3'아데닐화되고 T4 DNA 리가아제 연결을 사용하여 시토신 대신 5'-메틸시토신을 결찰하는 어댑터로 결찰됩니다. 각 단계를 완료한 후 마그네틱 비드를 사용하여 DNA를 정제합니다. 그런 다음 지침에 따라 ZYMO EZ DNA Methylation Gold Kit를 사용하여 메틸화되지 않은 시토신을 우라실로 변환합니다. 마지막으로 JumpStart Taq DNA 중합효소를 사용하여 PCR 증폭을 수행하고, 자기 비드를 사용하여 PCR 산물을 정제하여 최종 라이브러리를 얻었습니다.
(3) 라이브러리 품질 검사
라이브러리 구축이 완료된 후 Qubit2.0을 사용하여 예비 정량화하고 라이브러리를 1ng/ul로 희석한 후 Agilent 2100을 사용하여 삽입합니다. 라이브러리 크기 테스트 후 삽입 크기가 기대치를 충족한 후 qPCR 방법을 사용하여 라이브러리의 유효 농도(라이브러리의 유효 농도 > 2nM)를 정확하게 정량화하여 라이브러리의 품질을 보장합니다.
(4) 기계 내 시퀀싱
라이브러리를 테스트하고 검증한 후 유효 농도 및 대상 외부 데이터 볼륨 요구 사항에 따라 다양한 라이브러리를 풀링한 다음 시퀀싱합니다. Illumina Nova 플랫폼은 PE150입니다.
(1) 원본 오프라인 데이터의 품질 관리
원본 오프라인 데이터는 처리량이 많은 시퀀싱의 표준 형식인 FASTQ 형식입니다. FASTQ 파일의 모든 4줄은 하나의 단위이며 시퀀싱 시퀀스(읽기)에 대한 정보를 포함합니다. 단위의 첫 번째 줄은 일반적으로 @ 기호로 시작하는 읽기 ID입니다. 두 번째 줄은 읽기 순서인 시퀀싱 시퀀스입니다. 첫 번째 줄은 기본 품질 값으로 시퀀스의 두 번째 줄에 있는 기본 품질 값에 해당하므로 이 줄과 두 번째 줄의 길이는 동일합니다. 다음은 읽기 정보의 예입니다.
원본 오프라인 데이터에는 라이브러리 구성 중에 도입된 어댑터 시퀀스와 낮은 품질의 베이스가 포함되어 있으므로 이후에 게놈에 매핑되는 읽기 수가 줄어듭니다. 결과적으로 정보가 적어지므로 필터링이 필요합니다. Trim_galore 소프트웨어를 사용하여 원시 데이터에서 어댑터 시퀀스 및 낮은 품질 기반을 제거하는 등의 품질 관리 단계를 수행합니다.
(2) 서열 정렬
품질 관리 리드는 참조 게놈과의 서열 유사성을 기반으로 참조 게놈에 정렬되어야 합니다. 기존 게놈 및 전사체 서열 분석과 비교하여 WGBS 서열 분석 방법으로 생성된 데이터의 특성은 비교에 세 가지 주요 어려움이 있음을 결정합니다.
(1) DNA 단편의 양성 가닥과 음성 가닥이 염 변환 후에는 더 이상 역상보성이 발생하지 않습니다. PCR 후에는 4개의 서로 다른 서열이 생성되므로 정렬 중 계산량이 크게 늘어납니다.
(2) bisulfite 전환 후 DNA 서열의 C 염기 대부분이 T 염기로 전환되므로 PCR 후 서열에 T가 많이 포함되고 C가 부족하여 생성되는 상보 가닥은 다음과 같습니다. A가 많이 포함되어 있고 G가 부족합니다. 이는 서열의 복잡성을 감소시켜(즉, 서열의 구성이 더 단순해짐), 정렬의 어려움을 증가시킨다.
(3) C와 T의 비교는 비대칭이다. bisulfite 변환 후, 서열의 메틸화되지 않은 C 염기(대부분)가 T로 변환되며, 이로 인해 서열 분석 서열이 참조 게놈과 일치하지 않게 될 수 있습니다. T는 아마도 T에 정렬되어야 합니다. 아마도 이를 비교해야 할 것입니다. C와 C는 C와만 비교할 수 있습니다. 이는 또한 비교의 어려움을 증가시킵니다.
비교를 위해 BSMAP 소프트웨어를 사용하세요. BSMAP가 정렬을 수행할 때 먼저 참조 게놈의 C 염기 위치를 가이드로 사용하고 참조 게놈의 C 염기 위치에 해당하는 리드의 T를 C로 표시하고 다른 T는 변경되지 않도록 합니다. 읽기는 참조 게놈에 직접 정렬될 수 있습니다.
(3) 메틸화 수준 계산
메틸화 수준은 T로 변환되지 않은 C와 T로 변환된 C의 리드 비율을 기준으로 계산할 수 있습니다.
베타값 = C-reads / (C-reads + T-reads) * 100%
그 중 베타값은 시토신의 메틸화 수준, C-reads는 이 사이트를 덮는 메틸화를 지원하는 읽기 수(이 사이트에서 C로 측정되는 읽기)이고, T-reads는 이 사이트를 덮는 메틸화를 지원하지 않는 읽기(C로 측정되는 읽기)의 수입니다. 이 사이트에서) T)를 읽으세요. 계산 원리의 개략도는 다음과 같습니다.
BSMAP을 사용하여 메틸화 수준을 계산합니다.
(4) 차등 메틸화 영역(DMR) 식별 및 통계
DMR 탐지는 권위 있는 저널에 발표된 메틸렌 소프트웨어를 사용합니다. 소프트웨어는 먼저 게놈을 사전 분할하여 더 긴 시퀀스에서 CG 사이트를 포함하지 않는 단편을 제외합니다. 이어서, 이진 분리 알고리즘을 사용하여 검출 범위를 반복적으로 좁혀 가능한 DMR로서 그룹 간 누적 평균 메틸화 차이가 가장 큰 영역을 검색했으며, 마지막으로 이중 통계 테스트(MWU-테스트 및 2D KS-테스트)를 결합했습니다. , 정확한 DMR을 받으세요. 검출 원리는 아래 그림과 같습니다.
본 분석에서 DMR을 검출하는 기준은 다음과 같습니다.
(1) 지역 평균 메틸화 차이가 0.1 이상입니다.
( 2) CpG 사이트 수는 5개 이상입니다.
(3) 영역 길이는 50bp 이상입니다. (4) 메틸화 수준의 차이에 대한 통계 테스트의 보정된 P 값은 0.05 미만입니다.
(5) 2D KS 테스트의 P 값은 0.05 미만입니다.
(5) 정보 분석 과정의 모식도
DNA 메틸로믹스 연구의 핵심 내용은 DNA 메틸화 데이터 마이닝에 있습니다. DNA 메틸화는 일반적으로 데이터 마이닝을 위해 세 단계를 따릅니다.
먼저, 평균 메틸화 수준 변화, 메틸화 수준 분포 변화, 차원 축소 분석, 군집 분석, 상관 분석 등을 포함한 전반적인 게놈 차원의 메틸화 변화를 분석합니다.
둘째, DMC/DMR/DMG 식별, 게놈 요소에 대한 DMC/DMR 분포, DMC/DMR의 TF 결합 분석 및 시계열을 포함하여 특정 차등 유전자를 스크리닝하기 위해 메틸화 차이 수준 분석을 수행합니다. A 기본 데이터 분석 전략, DMG 기능 분석 등
마지막으로 전체 Meta 유전자 상관관계, DMG-DEG 대응 상관관계, 네트워크 상관관계 등을 포함한 methylome & Transcriptomics 상관 분석을 수행했습니다.
마우스 배아 줄기 세포의 두 가지 서로 다른 상호 전환 가능한 DNA 메틸롬의 전체 게놈 Bisulfite 서열 분석. 마우스 배아 줄기 세포의 두 가지 상태에 대한 메틸로믹 연구
1. 배경
마우스 배아 줄기 세포는 일반적으로 혈청이 포함된 매트릭스에서 성장하며 혈청 줄기 세포(혈청 ESC)라고 합니다. 두 개의 키나제 억제제를 첨가하면 배아 줄기 세포가 혈청이 없는 상태에서도 다능성을 유지할 수 있습니다. 2i 줄기세포(2i ESC)라고 하며, 이 두 상태의 배아줄기세포는 서로 변환될 수 있습니다. 이 분야의 이전 메틸화 연구는 대부분 질량 분석법을 기반으로 했으며, 적용 범위와 연구 결과가 제한되어 있었습니다. 2i 배아 줄기 세포에 대한 메틸화 연구는 아직 부족합니다.
2. 방법
WGBS(Whole-genome bisulfite methylation sequencing)를 사용하여 이 두 가지 유형의 상호 전환 가능한 마우스 배아 줄기 세포에 대한 메틸로믹스를 수행했습니다.
3. 결론
두 가지 유형의 마우스 배아줄기세포의 DNA 메틸화 변형이 종합적이고 정확하게 검출되었으며, 남성 2iESC와 비교하여 체계적으로 비교되었습니다. 혈청 내 전반적인 저메틸화, 여성 ESC는 유사합니다. 남성 2i ESC 및 2i ESC 상태에서는 메틸화 수준이 더욱 감소합니다.
위는 전체 게놈 메틸화 시퀀싱의 실험 과정과 분석 아이디어에 대한 소개입니다.
참고 자료:
[1] Ashburner, M. 및 C. A. Ball, et al. 유전자 온톨로지: 생물학 통합을 위한 도구, Nat Genet, 2000. 25 (1): 25-9.
[2] Dirk Schübeler. DNA 메틸화의 기능 및 정보 내용. Nature, 2015, 517: 321–326.
[3 ] Frank Jühling et al. metilene: bisulfite 염기서열 분석 데이터에서 차별적으로 메틸화된 영역에 대한 빠르고 민감한 호출. Genome Research, 2016, 26: 256-262.
[4] Kanehisa M, Goto S. KEGG: kyoto 유전자 및 게놈 백과사전. 핵산 연구, 2000,28(1): 27-30.
[5] 인간 두뇌의 포괄적인 DNA 메틸화 및 하이드록시메틸화 분석 및 그 의미 정신 장애. Neuropharmacology, 2014, 80: 133-139.
[6] Xiaojing Yang et al. Gene Body Methylation Can Alter Gene Expression and Is a Therapeutic Target in Cancer 26, 577–590. .
[7] Yuanxin Xi 외 BSMAP: 전체 게놈 bisulfite 서열 MAPping 프로그램, BMC Bioinformatics, 2009, 10:232.
[8] Gao F, 외. 원숭이 착상 전 배아 발생 중 새로운 DNA 메틸화. Cell Res. 2017 Apr;27(4):526-539.