1. Giới thiệu
Giải trình tự toàn bộ exome nhắm vào các vùng mã hóa protein của khoảng 20.000 gen, đặc biệt có lợi cho phân tích di truyền thông lượng cao của các nhóm đột biến lớn và cho phép đạt được những hiểu biết sâu hơn về giải trình tự với dữ liệu hiệu quả hơn và ít hơn. Với dịch vụ giải trình tự của Novogene được cung cấp bởi GeneSmart, khách hàng có thể yên tâm về chất lượng dữ liệu được phân tích bằng pipeline đã được tối ưu hóa, đảm bảo cho nhiều mục đích nghiên cứu khác nhau.
2. Quy trình làm việc
Quy trình làm việc chuẩn bao gồm các bước sau: chuẩn bị mẫu và kiểm soát chất lượng (QC), xây dựng thư viện và QC, giải trình tự, QC dữ liệu và phân tích tin sinh học, tạo điều kiện cho việc phân tích sâu các biến thể di truyền và làm sáng tỏ bức tranh sinh học phức tạp của bộ gen người. Ngoài dịch vụ WES tập trung vào nghiên cứu, Novogene còn đạt chứng chỉ CLIA/CAP/ISO17025, đảm bảo chẩn đoán lâm sàng với độ chính xác và độ tin cậy cao.

Hình 1: Quy trình giải trình tự toàn bộ exome
- Chuẩn bị mẫu: Giải pháp giải trình tự toàn bộ Exome phù hợp cho cả mẫu người lẫn chuột. Dưới đây là yêu cầu chất lượng cho mẫu đầu vào

Hình 2: Tiêu chuẩn mẫu đầu vào cho WES
- Chuẩn bị thư viện: DNA bộ gen được phân mảnh ngẫu nhiên thành các đoạn ngắn có kích thước 180-280 bp. Đối với việc bắt giữ vùng exome, Novogene cung cấp nhiều kit thương mại bao gồm IDT, Agilent.
- Giải trình tự: Sau khi định lượng, các thư viện được chuẩn hóa nồng độ, pool lại trước khi giải trình tự trên nền tảng Illumina với lựa chọn PE150.
3. Phân tích tin sinh học
Trước khi bắt đầu phân tích tin sinh học, các tệp đầu ra BCL và FASTQ sẽ được kiểm tra chất lượng để đảm bảo dữ liệu sạch và đáng tin cậy (xem hình 3).

Hình 3: Quy trình phân tích dữ liệu tin sinh học tiêu chuẩn trong WES
Dưới đây là các bước phân tích tiếp theo:
- Căn chỉnh với hệ gen tham chiếu: Đây còn gọi là bước “mapping” – một công đoạn quan trọng giúp so khớp dữ liệu giải trình tự với hệ gen chuẩn. Bước này còn cung cấp các thống kê về độ sâu (depth) và mức độ bao phủ (coverage) của dữ liệu. Với các bệnh Mendel di truyền hoặc bệnh hiếm, mức độ bao phủ khuyến nghị là trên 50×. Trong khi đó, với mẫu khối u, độ bao phủ hiệu quả nên đạt trên 100× để đảm bảo độ chính xác khi phân tích.
- Phát hiện đột biến di truyền (germline mutation): Bước này thường được sử dụng để kiểm tra nguy cơ di truyền trong một số loại ung thư hoặc xác định nguyên nhân gây bệnh ở bệnh nhân mắc rối loạn di truyền. Các dạng biến thể được phát hiện có thể bao gồm đột biến đơn nhân nucleotide (Single Nucleotide Variant – SNV/ Single Nucleotide Polymorphism – SNP) và đột biến thêm/mất nucleotide (Insertion and Deletion – InDel).
- Phát hiện đột biến soma (somatic mutation): Với các mẫu sinh thiết khối u kèm theo mẫu mô đối chứng (tumor-normal paired samples), Novogene cung cấp dịch vụ bổ sung để phân tích đột biến soma. Việc so sánh hai mẫu giúp loại bỏ các biến thể chung giữa khối u và mô lành, từ đó dễ dàng phát hiện các SNV, InDel đặc hiệu cho khối u. Ngoài ra, quy trình này cũng hỗ trợ phát hiện các biến thể số lượng bản sao (Copy Number Variant – CNV), là những đoạn DNA bị nhân lên hoặc mất đi trong hệ gen của tế bào ung thư.
4. Phân tích nâng cao cho các nghiên cứu cụ thể
4.1. Trong nghiên cứu ung thư
- Tiến triển khối u: Phân tích WES có thể giúp phát hiện các dòng tế bào con (subclones) trong khối u, qua đó ước tính tỉ lệ tế bào khối u (purity) và số lượng bản sao tuyệt đối của bộ gen khối u (ploidy). Ngoài ra, có thể phân tích thêm về mối quan hệ tiến hóa giữa các mẫu khối u.
- Lập hồ sơ đột biến: Đây là một kỹ thuật tiêu chuẩn để phân loại khối u, có thể cung cấp thông tin chẩn đoán và tiên lượng có giá trị lâm sàng. Phân tích WES nâng cao có thể cung cấp thông tin về các gen và con đường sinh học quan trọng trong khởi phát và tiến triển khối u, đồng thời có thể tìm ra mối liên hệ giữa các gen đột biến.
- Phát hiện gen thúc đẩy khối u (driver genes): Các tế bào khối u thường mang nhiều biến thể soma nhưng chỉ một phần nhỏ trong số đó thực sự góp phần vào sự tiến triển khối u. WES có thể được sử dụng để xác định các gen thúc đẩy khối u dựa trên sự tập trung bất thường của các đột biến (mutation clustering bias).
- Phân tích mô hình khối u ghép xenograft: Các mô hình khối u ghép từ người sang chuột thường được sử dụng trong nghiên cứu để phát triển thuốc và y học chính xác. Bằng cách so khớp dữ liệu giải trình tự với bộ gen tham chiếu kết hợp giữa chuột và người, sau đó chỉ lọc các đoạn đọc phù hợp với bộ gen người, có thể thu được đầy đủ thông tin về khối u, chẳng hạn như SNV, InDels và nhiều đặc điểm khác.

Hình 4: Phân tích dữ liệu chuyên sâu cho nghiên cứu về ung thư. Ảnh chụp màn hình từ webinar “Unveiling the Human Genome using cutting-edge Sequencing techniques: WGS & WES” từ Novogene
4.2. Trong nghiên cứu bệnh di truyền
- Phân tích chuyên sâu các bệnh di truyền có thể bao gồm xác định các biến thể và các gen có khả năng liên quan đến bệnh hoặc phân tích đột biến de novo thông qua giải trình tự mô hình gia đình ba người (Trio sequencing bao gồm con và bố mẹ) hoặc mô hình bốn người (Quartet sequencing bao gồm 2 đứa con và bố mẹ), trong đó exome của bệnh nhân được so sánh với exome của cha mẹ ruột hoặc những người thân cận về mặt di truyền.

Hình 5: Phân tích dữ liệu chuyên sâu cho nghiên cứu về các bệnh di truyền. Ảnh chụp màn hình từ webinar “Unveiling the Human Genome using cutting-edge Sequencing techniques: WGS & WES” từ Novogene
Tóm lại, nhờ tính hiệu quả về chi phí, giải trình tự toàn bộ exome (WES) thường được ưu tiên lựa chọn trong việc phát hiện các biến thể gen liên quan đến bệnh lý, đặc biệt trong xét nghiệm trước sinh, sàng lọc trẻ sơ sinh, cũng như trong chẩn đoán các bệnh hiếm gặp.
Bên cạnh đó, nhờ khả năng tập trung vào các vùng gen mã hóa, WES còn là giải pháp hữu ích trong đánh giá nguy cơ ung thư di truyền và xác định hồ sơ đột biến trong các khối u.
Ngoài ra, WES cũng được ứng dụng trong các nghiên cứu quy mô quần thể để khám phá sự phân bố và biến đổi của các đặc điểm di truyền, từ đó giúp hiểu rõ hơn vai trò của di truyền trong các tính trạng phức tạp, chẳng hạn như nguy cơ mắc một số bệnh lý nguy hiểm nhất định.
5. Dịch vụ Novogene
Novogene cung cấp giải pháp giải trình tự toàn diện từ đầu đến cuối, được thiết kế phù hợp với yêu cầu cụ thể của từng nghiên cứu. Dịch vụ bao gồm từ khâu chuẩn bị mẫu, thực hiện giải trình tự, phân tích tin sinh học cho đến bước giải thích kết quả cho nhiều giải pháp giải trình tự khác nhau, bao gồm giải trình tự toàn bộ hệ Exome (Whole Exome Sequencing– WES)
Với vai trò là nhà phân phối chính thức của Novogene tại Việt Nam, GeneSmart cam kết mang đến các dịch vụ giải trình tự bộ gen tiên tiến cùng sự hỗ trợ chuyên nghiệp.
Trong các bài blog tiếp theo, chúng tôi sẽ đi sâu vào quy trình phân tích tin sinh học và khám phá các ứng dụng thực tiễn của WES.
Tham khảo dịch vụ giải trình tự toàn bộ hệ Exome (Whole Exome Sequencing – WES) cung cấp bởi GeneSmart tại đây.
Tham khảo webinar “Unveiling the Human Genome using cutting-edge Sequencing techniques: WGS & WES” nếu bạn mới bắt đầu.
6. Tài liệu tham khảo
Kickstart Your Whole Exome Sequencing Project with Novogene.” Novogene, https://www.novogene.com/amea-en/resources/blog/kickstart-your-whole-exome-sequencing-project-with-novogene/
Pollard KS, Hubisz MJ, Rosenbloom KR, Siepel A. Detection of nonneutral substitution rates on mammalian phylogenies. Genome Res. 2010;20(1):110-121. doi:10.1101/gr.097857.109 (phyloP)
Rentzsch P, Witten D, Cooper GM, Shendure J, Kircher M. CADD: predicting the deleteriousness of variants throughout the human genome. Nucleic Acids Res. 2019;47(D1):D886-D894. doi:10.1093/nar/gky1016 (CADD)
Reva B, Antipin Y, Sander C. Predicting the functional impact of protein mutations: application to cancer genomics. Nucleic Acids Res. 2011;39(17):e118. doi:10.1093/nar/gkr407 (MutationAssessor)
------------
GENESMART CO., LTD | Phân phối ủy quyền 10X Genomics, Altona, Biosigma, Hamilton, IT-IS (Novacyt), Norgen Biotek, Rainin tại Việt Nam.











