기금넷 공식사이트 - 펀드 투자 - 전사체 데이터의 PCA 플롯 플롯 및 생물학적 복제 관련 문제
전사체 데이터의 PCA 플롯 플롯 및 생물학적 복제 관련 문제
오랜만에 소식을 전합니다~~펀드 때문에 바빠요. . 축적. . 아니면 자금, 그리고 기사. . 기사. . 아직 기사입니다.
드디어 지난 일들을 정리하는 시간을 갖게 되었습니다.
그리기 방법에 대해 이야기하기 전에 먼저 전사체의 PCA 플롯의 의미를 이해해야 합니까?
샘플 간의 분산 정도, 즉 반복 간의 차이가 큰지 여부를 감지하기 위해.
1. 그리기 전에 샘플 중복 문제를 해결하세요.
전사체 서열 분석에는 일반적으로 3번의 반복이 필요합니다. 그러나 염기서열분석에 노출된 적이 없는 사람들은 혼란스러워합니다. 왜 전사체 염기서열분석이 생물학적으로 반복되어야 할까요? 내가 그것을 원하지 않을 수 있는가? 대부분의 경우 왜 3번의 반복이 필요한가요? 4, 5 또는 666회 반복이 가능합니까? 반복으로 어떻게 계산되나요? 3마리의 마우스 테스트가 각각 3번의 반복으로 계산됩니까, 아니면 1개의 마우스 테스트가 3번의 반복으로 계산됩니까? 질문이 너무 많아서 정말 헷갈리고, 너무 벅차요~~~
첫 번째 질문: 생물학을 반복해야 하나요?
답변: 최선입니다.
어떤 상황에서 생물학적 복제가 불가능합니까?
1) 과학 연구 자금이 너무 적고 염기서열 분석에 필요한 자금이 없습니다. (이 경우 아예 테스트하지 마세요. 테스트 하나만 측정하는 것은 소용이 없습니다.)
2) 실험적 증거는 절대적으로 충분하며, 그 다음에는 파사드를 장식하고 더 화려하게 보이고 싶습니다. . (그럼 실험이 너무 잘 됐고, 몇 번 더 테스트해 보세요~ 아니면 아예 테스트를 안 하셔도 됩니다. 그렇지 않으면 자연을 보낼 수도 있었지만 결국 플로손만 보낼 수 있게 되었는데, 이는 매우 불필요한 일입니다. )
두 번째 질문: 3번 반복해야 하나요? 2~4개를 테스트할 수 있나요?
답변: 반복 횟수는 3회 이상이어야 합니다.
1) 첫 번째 답변 반복을 설정하는 목적은 무엇입니까? 목적은 다음과 같습니다. 그룹 내 오류를 제거하고 결과의 신뢰성을 높이고 이상치 샘플을 감지합니다.
1.1) 생쥐에게 약을 먹이면 생쥐마다 약에 다르게 반응하므로 여러 샘플을 사용하여 생쥐 간의 차이를 없앨 수 있습니다.
1.2) 쥐 3마리에게 약을 줬는데 그 중 한 마리는 자연 면역력이 매우 강하고 약이 미치는 영향은 미미하다고 가정해 보겠습니다. 나머지 두 개는 상대적으로 유사하므로 나중에 분석할 때 면역력이 강한 쪽을 삭제해야 한다. 해당 데이터가 분석 결과에 큰 편차를 가져올 수 있기 때문이다.
1.3) 하지만 쥐가 2마리밖에 없다면 그 중 한 마리는 자연적으로 면역이 되어 약물의 효과가 미미할 것입니다. 시퀀싱 데이터를 얻어 분석한 결과 둘이 매우 다르다는 사실을 발견했습니다. 그렇다면 어떤 것을 선택해야 할까요? 어떤 사람들은 그러면 면역력이 정상적인 것을 선택해야 한다고 말합니다. 아 이거 정말 질문이네요. . . 면역력이 강한지 아닌지는 시퀀싱을 해봐야 알 수 있다. 쥐에게 약을 주기 전에는 건강한지 아닌지 알 수 없다. 이것이 2를 선택해서는 안되는 이유입니다.
2) 이론적으로는 반복 횟수가 많을수록 좋지만 실제 상황을 고려하면 3회 반복 설정이 보다 보편적인 방법입니다.
구체적인 이유는 다음 문헌을 참조하십시오. RNA-seq 차등 발현 연구: 더 많은 서열 또는 더 많은 복제?
3) 동물 또는 식물 샘플 간의 차이는 여전히 상대적으로 크므로 더 많은 테스트를 할 수 있습니다. 예를 들어 5~10회 반복 등을 수행할 수 있습니다. 당신이 부자라면 66, 88, 996, 심지어 2333 등 길조라고 생각하는 숫자를 측정할 수 있습니다. (농담입니다)
세 번째 질문: 3마리의 마우스를 별도로 시퀀싱하는 경우 중복으로 계산됩니까, 아니면 1개의 마우스 테스트를 3회 중복으로 계산합니까?
답변: 세 마리의 쥐를 각각 한 번씩 테스트했습니다.
생물학적 복제와 기술적 복제를 이해합니다. (바이두에서 검색)
2. PCA 그래프 그리기
그리기 패키지 로드
실행 경로를 설정하고 이전에 계산한 FPKM 데이터를 가져옵니다.
각 PCA의 다양한 지수를 계산합니다.
ggscatter를 사용하여 PC에서 그림을 그립니다.
또는 산점도의 3D 그리기를 시도해 볼 수도 있습니다.
3D 그리기의 단점은 산점도3d에 매개변수가 없다는 것입니다. 각 지점의 이름을 표시하면 매우 우울합니다.
그것을 달성하고 싶다면 다음 방법을 시도해 보세요.