Tiếp nối bài viết trước, chúng ta sẽ đi sâu hơn vào phân tích tin sinh học do Novogene cung cấp trong phần này.
3. Phân tích tin sinh học của gói tiêu chuẩn
3.1. Căn chỉnh với bộ gen tham chiếu hay “mapping”: bước này cũng cung cấp số liệu thống kê về độ sâu và độ phủ của quá trình giải trình tự.

- Phân bố độ sâu giải trình tự của tất cả các base trong mỗi mẫu (hình 7a): cho thấy phạm vi bao phủ tối đa có thể đạt được ở độ sâu giải trình tự khoảng 25x – 30x
- Phân bố độ sâu trình tự tích lũy của tất cả các base trong mỗi mẫu (hình 7b): 80% base có độ sâu ít nhất là 25x-30x, cho thấy đây là độ sâu đủ để phát hiện biến thể.
- Thống kê về độ phủ, độ sâu và chất lượng căn chỉnh (mapping) dữ liệu trong từng mẫu:
- Mapped Reads: Tỉ lệ phần trăm đoạn đọc được căn chỉnh thành công với bộ gen tham chiếu. Theo Novogene, giá trị này thông thường đạt > 98%, cho thấy chất lượng giải trình tự và bước căn chỉnh hiệu quả.
- Properly Mapped Reads: Tỉ lệ phần trăm các đoạn đọc paired-end được căn chỉnh đúng chiều, trên cùng nhiễm sắc thể và phù hợp với kích thước chèn (insert size) như thiết kế thư viện ban đầu. Giá trị này thường > 95%, phản ánh chất lượng căn chỉnh đáng tin cậy.
- Coverage at least 10× (Độ phủ tối thiểu 10 lần): Biểu thị tỷ lệ phần trăm bộ gen được bao phủ bởi ít nhất 10 lần đọc. Giá trị này thường nên lớn hơn 98%.
3.2. Phát hiện đột biến di truyền (germline mutation) và đột biến soma (somatic mutation)

- Phát hiện đột biến di truyền: Phương pháp này thường được sử dụng để kiểm tra khuynh hướng di truyền ở một số loại ung thư nhất định hoặc để tìm nguyên nhân gây bệnh ở bệnh nhân mắc chứng rối loạn di truyền, như SNV (Single Nucleotide Variant- Biến thể đơn nucleotide) /SNP (Single Nucleotide Polymorphism – Đa hình đơn nucleotide) và InDel (Insertion/Deletion – Biến thể thêm/mất).

- Kết quả phát hiện SNP/Indel (hình 9):
- Biểu đồ tròn:
- Missense SNPs (biến thể SNPs gây thay đổi amino acid) và synonymous SNPs (biến thể SNPs không làm thay đổi amino acid) là 2 loại phổ biến nhất trong mẫu “cancer 2”.
- Hầu hết các SNPs chủ yếu nằm trong vùng ncRNA và intron. Mặc dù các vùng này không trực tiếp ảnh hưởng đến biểu hiện gen nhưng chúng có thể tương tác với các yếu tố điều hòa, cho thấy SNPs trong các vùng này có khả năng điều hòa hoạt động gen.
- Bảng tóm tắt:
- Bảng tóm tắt cung cấp thông tin chi tiết về sự phân bố của SNPs trên toàn bộ các vùng gen. Dữ liệu giải trình tự toàn bộ hệ gen (WGS) tiết lộ khoảng 4 tỷ SNPs cho mỗi mẫu với vị trí gen chính xác, cho phép phân tích biến thể toàn diện. Khoảng 120.000 SNPs mới đã được xác định, bổ sung thêm các biến thể di truyền mới vào cơ sở dữ liệu hiện tại.
- Những SNPs mới này có thể đóng vai trò quan trọng trong việc khám phá các đặc điểm và cơ chế di truyền mới trong bệnh ung thư mà dữ liệu tham chiếu hiện tại chưa phản ánh đầy đủ.

- Kết quả phát hiện SV/CNV (hình 10):
- Biểu đồ (a): Số lượng các loại SV khác nhau trong mỗi mẫu
- Số SV cao trên các mẫu: Tất cả các mẫu (ung thư và đối chứng khỏe mạnh) đều cho thấy tổng số SV tương tự nhau, mỗi mẫu khoảng 3000, không có sự khác biệt quá lớn giữa các mẫu.Phân bố loại SV: Các đột biến mất đoạn (Deletion – DEL) chiếm tỉ lệ cao nhất trong tất cả các mẫu, là loại SV phổ biến nhất. Tiếp theo là các đột biến chuyển đoạn (BND – translocations) và đột biến lặp đoạn (DUP – duplications).
- Các loại đột biến đảo đoạn (INV) và chèn đoạn (INS) xuất hiện với tần suất thấp: INV và INS đều có tỷ lệ nhỏ hơn đáng kể so với các loại SV khác.
- Bảng (b): Kết quả phát hiện SV
- Không có sự khác biệt lớn về loại SV giữa các mẫu với mỗi mẫu có số lượng SV tương đối đồng đều. Tuy nhiên, các mẫu ung thư vú (cancer1, cancer2, cancer3) có xu hướng nhiều SV hơn một chút so với các mẫu khỏe mạnh (H1, H2, H3).
- Các mẫu ung thư có tần suất xuất hiện BND (chuyển đoạn) và DUP (lặp đoạn) cao hơn đáng kể so với các mẫu khỏe mạnh, cho thấy khả năng có sự tái sắp xếp cấu trúc trong các mẫu này.
- Biểu đồ (c): Kích thước vùng gen bị ảnh hưởng bởi số lượng bản sao (Copy Number Variation) trong mỗi mẫu
- Biến thể mẫu ung thư: Mẫu cancer2 có kích thước vùng gen bị ảnh hưởng lớn hơn đáng kể, cả về mặt tăng số lượng bản sao (gain_size) và giảm số lượng bản sao (loss_size) của CNV so với các mẫu khác. Điều này cho thấy cancer2 có mức độ bất ổn hệ gen cao hơn hoặc các vùng bị ảnh hưởng bởi CNV rộng hơn.
- Mẫu khỏe mạnh: H1, H2, H3 có vùng bị ảnh hưởng ít đáng kể hơn, gợi ý CNV xảy ra ít hơn và hệ gen ổn định hơn.
- Bảng (d): Kết quả phát hiện CNV
- Các mẫu ung thư (cancer1, cancer2, cancer3) có số lượng và kích thước CNV cao hơn đáng kể so với mẫu khỏe mạnh.
- Cancer3 có tổng CNV cao nhất (đặc biệt gain_size gần 46MB), cho thấy sự bất ổn di truyền lớn.
- Cancer2 nổi bật với gain_size lên đến 105,7 MB, gợi ý có nhiều sự kiện khuếch đại hệ gen diện rộng.
- Nhóm khỏe mạnh (H1, H2, H3) có hoạt động CNV thấp hơn, đặc biệt loss_size rất nhỏ, cho thấy hồ sơ hệ gen ổn định.
- Phát hiện đột biến soma: Novogene cung cấp thêm phân tích miễn phí để phát hiện biến thể soma khi cung cấp cặp mẫu khối u – mô khỏe mạnh (tumor – normal paired samples). Việc so sánh mẫu khối u với mẫu khỏe mạnh tương ứng giúp loại bỏ các biến thể chung, từ đó xác định chính xác các SNV hoặc InDel đặc hiệu khối u, đồng thời phát hiện các biến thể số lượng bản sao (CNV).
Các bảng số liệu và biểu đồ phân tích đột biến soma được Novogene cung cấp khá tương tự trong phần đột biến di truyền.
Novogene cung cấp dịch vụ giải trình tự toàn bộ hệ gen (WGS) toàn diện với chất lượng cao, chi phí hợp lý và giải pháp tiện lợi, kèm theo quy trình phân tích dữ liệu đã được tối ưu hóa, đáp ứng các nhu cầu nghiên cứu khác nhau. Là nhà phân phối chính thức tại Việt Nam, GeneSmart tự hào mang đến sự hỗ trợ toàn diện cho các dịch vụ uy tín từ Novogene.
Đọc thêm về các dịch vụ giải trình tự của Novogene do GeneSmart cung cấp tại đây .
Tham khảo Unveiling the Human Genome using cutting-edge Sequencing techniques: WGS & WES để bắt đầu hành trình WGS và WES của bạn.
Hãy theo dõi blog tiếp theo của chúng tôi, nơi chúng tôi giới thiệu cho bạn một số bài báo áp dụng WGS trong nghiên cứu của họ.
------------
GENESMART CO., LTD | Phân phối ủy quyền 10X Genomics, Altona, Biosigma, Hamilton, IT-IS (Novacyt), Norgen Biotek, Rainin tại Việt Nam.











