1. Giới thiệu
1.1. Giải trình tự toàn bộ hệ gen (Whole Genome Sequencing – WGS)
Whole Genome Sequencing – WGS là phương pháp giải trình tự toàn bộ hệ gen, bao gồm cả vùng mã hóa (exon) và vùng không mã hóa. Phương pháp tiếp cận này cung cấp cái nhìn sâu sắc về thông tin di truyền của một cá nhân, xác định tất cả các loại biến thể di truyền như đa hình nucleotide đơn (SNP), đột biến điểm thêm và bớt (indel), biến thể cấu trúc và biến thể số lượng bản sao (CNV). WGS được sử dụng trong nhiều lĩnh vực nghiên cứu, từ y học cá nhân hóa đến hiểu biết về cơ sở di truyền của các bệnh phức tạp.
- Ứng dụng phổ biến của WGS:
- Y học cá thể hóa: WGS cho phép xác định các yếu tố di truyền gây ra bệnh, từ đó đưa ra các chiến lược điều trị cá nhân hóa hơn.
- Di truyền quần thể: WGS được sử dụng để khám phá sự đa dạng di truyền và quá trình tiến hóa giữa các quần thể khác nhau.
- Chẩn đoán bệnh hiếm: WGS rất cần thiết để chẩn đoán các rối loạn di truyền hiếm gặp bằng cách phát hiện các biến thể không tìm thấy bằng các phương pháp truyền thống.
1.2. Giải trình tự toàn bộ exome (Whole Exome Sequencing – WES)
Giải trình tự toàn bộ exome (WES) chỉ tập trung vào exome, là phần mã hóa protein của bộ gen. Mặc dù exome chiếm chưa đến 2% toàn bộ bộ gen, nhưng nó chứa khoảng 85% các biến thể có ý nghĩa trong lâm sàng. WES là phương pháp tiếp cận có mục tiêu hơn WGS, giúp tiết kiệm chi phí cho các nghiên cứu quy mô lớn và các ứng dụng lâm sàng.
- Ứng dụng phổ biến của WES:
- Chẩn đoán lâm sàng: WES được sử dụng rộng rãi trong chẩn đoán lâm sàng để xác định nguyên nhân di truyền gây bệnh ở bệnh nhân.
- Nghiên cứu về ung thư: WES đóng vai trò quan trọng trong việc xác định các đột biến trong vùng mã hóa của bộ gen có liên quan đến sự phát triển của ung thư.
- Rối loạn di truyền: WES có hiệu quả cao trong chẩn đoán các bệnh di truyền, đặc biệt là những bệnh do đột biến ở vùng exon.
2. Ưu điểm và hạn chế của giải trình tự toàn bộ hệ gen (WGS)
- Ưu điểm của WGS:
- Thông tin di truyền toàn diện: WGS cung cấp phân tích di truyền hoàn chỉnh, bao gồm cả vùng mã hóa và không mã hóa, giúp phát hiện các loại biến thể di truyền rộng hơn.
- Ứng dụng rộng rãi: WGS rất quan trọng để hiểu các bệnh phức tạp liên quan đến cả vùng mã hóa và không mã hóa, bao gồm các rối loạn thần kinh và ung thư.
- Xác định các biến thể hiếm: WGS có thể phát hiện ra các biến thể di truyền hiếm và mới mà các phương pháp nhắm mục tiêu hơn như WES có thể không phát hiện được.

Hình 1. Thông số kĩ thuật giải trình tự và phân tích dữ liệu WGS
- Hạn chế của WGS:
- Chi phí: WGS thường đi kèm với chi phí lớn hơn so với WES do yêu cầu giải trình tự lượng dữ liệu giải trình tự phức tạp hơn.
- Độ phức tạp trong phân tích dữ liệu: Lượng dữ liệu khổng lồ tạo ra từ WGS đòi hỏi các công cụ tin sinh học phức tạp, có thể tạo ra thách thức đáng kể trong giai đoạn phân tích và diễn giải kết quả.
Khả năng phát hiện biến thể hiếm: Mặc dù WGS cung cấp độ phủ đồng đều trên toàn bộ hệ gen, nhưng độ sâu giải trình tự tại các vùng quan trọng như gen liên quan đến bệnh lý có thể không đủ cao để phát hiện chính xác các biến thể hiếm. Để tăng độ nhạy, có thể cần nâng độ sâu toàn bộ hệ gen – điều này làm tăng đáng kể chi phí do phải giải trình tự thêm toàn bộ hệ gen, không chỉ vùng quan tâm. Điều này đòi hỏi cần tăng độ sâu (tốn thêm chi phí giải trình tự thêm cho toàn bộ hệ gen) hoặc sử dụng thêm các phương pháp bổ sung để đảm bảo độ nhạy trong việc phát hiện các biến thể có tần suất thấp. Ngoài ra, có thể cân nhắc kết hợp với các phương pháp bổ sung như targeted sequencing để giải quyết hạn chế này.
3. Ưu điểm và hạn chế của giải trình tự toàn bộ exome (WES)

Hình 2. Thông số kĩ thuật giải trình tự và phân tích dữ liệu WES
- Ưu điểm WES:
- Tiết kiệm chi phí: WES có chi phí hợp lý hơn so với WGS vì nó chỉ giải trình tự exome, tạo ra ít dữ liệu hơn. Điều này khiến WES trở thành lựa chọn phù hợp cho các nghiên cứu với quy mô lớn.
- Tập trung vào các biến thể gây bệnh: Exome chứa hầu hết các đột biến liên quan đến bệnh đã biết khiến WES trở nên lý tưởng cho chẩn đoán lâm sàng.
- Phân tích dữ liệu đơn giản hơn: WES tạo ra các tập dữ liệu nhỏ hơn, dễ phân tích hơn và ít tốn tài nguyên hơn.
- Hạn chế WES:
- Thông tin giới hạn ở vùng mã hóa coding region: WES bỏ qua các biến thể bên ngoài exome, bao gồm các biến thể ở vùng điều hòa hoặc không mã hóa, có thể đóng vai trò quan trọng trong một số bệnh.
- Thông tin giới hạn: WES đôi khi gặp khó khăn trong việc nắm bắt tất cả các vùng exon do các yếu tố như hiệu suất lai đầu dò, có khả năng để lại khoảng trống trong dữ liệu.
- Không bao gồm các biến thể cấu trúc: WES không hiệu quả trong việc phát hiện các biến thể cấu trúc lớn hơn, chẳng hạn như CNV.

Hình 3. Sơ đồ minh họa mức độ bỏ sót các biến thể nucleotide đơn (SNV) khi sử dụng WES.
(A) Các exon được WES bao phủ hoàn toàn được thể hiện bằng ô màu đỏ; các exon chỉ được bao phủ một phần được thể hiện bằng ô có sọc đỏ; còn các exon không được bao phủ được biểu thị bằng màu trắng. Các exon này thuộc gen mã hóa protein và có thể chứa vùng mã hóa, vùng UTR, hoặc cả hai.
(B) Số lượng SNV mã hóa được phát hiện bởi cả WES và WGS (ô màu trắng), chỉ được phát hiện bởi WES (đỏ), hoặc chỉ bởi WGS (xanh lam). Các nhãn “TRUE” hoặc “FALSE” thể hiện kết quả xác nhận lại bằng phương pháp giải trình tự Sanger. Hình được trích từ: Belkadi A, et al. (11).
4. Phương pháp nào phù hợp với nghiên cứu của bạn?
Việc lựa chọn giữa WGS và WES chủ yếu phụ thuộc vào mục tiêu nghiên cứu và ngân sách đầu tư. Thông tin so sánh dưới đây sẽ giúp làm rõ ưu tiên sử dụng của từng phương pháp:
- WES (Whole Exome Sequencing) phù hợp khi bạn:
- Tập trung vào các vùng mã hóa protein và các đột biến gây bệnh đã biết.
- Cần một phương pháp tiết kiệm chi phí để giải trình tự số lượng mẫu lớn.
- Đang nghiên cứu các rối loạn di truyền có nguyên nhân đã được xác định nằm trong exome.
- WGS (Whole Genome Sequencing) là lựa chọn tối ưu khi bạn:
- Cần phân tích toàn diện hệ gen, bao gồm cả các vùng không mã hóa và biến thể cấu trúc.
- Đang khám phá những biến thể di truyền hiếm hoặc mới mà WES có thể bỏ sót, đặc biệt là ở những bệnh phức tạp hoặc hiếm gặp.
- Muốn thu được thông tin di truyền đầy đủ, bao gồm cả các biến thể di truyền phổ biến và hiếm gặp trên toàn bộ hệ gen.
Retter et al. (2016) đã chứng minh rằng WES có thể có hiệu quả cao trong chẩn đoán lâm sàng với tỷ lệ chẩn đoán là 28,8% trên 3040 ca lâm sàng. Điều quan trọng là tỷ lệ này tăng lên khi nhiều thành viên trong gia đình tham gia vào quá trình phân tích, làm nổi bật tiềm năng của WES trong việc thúc đẩy quá trình ra quyết định lâm sàng.
5. Bảng tóm tắt
| Yếu tố | Giải trình tự toàn bộ bộ gen (WGS) | Giải trình tự toàn bộ Exome (WES) |
| Độ phủ thông tin | Bao phủ toàn bộ hệ gen, bao gồm cả vùng mã hóa và không mã hóa | Chỉ bao phủ vùng exon – các đoạn mã hóa protein |
| Chi phí | Cao hơn do cần giải trình tự lượng dữ liệu lớn hơn | Chi phí thấp hơn, phù hợp với nghiên cứu có ngân sách hạn chế |
| Độ phức tạp của dữ liệu | Phức tạp hơn, yêu cầu công cụ tin sinh học cao cấp để phân tích | Đơn giản hơn, dễ phân tích hơn do lượng dữ liệu |
| Các biến thể được phát hiện | Tất cả các biến thể di truyền (SNP, CNV, biến thể cấu trúc) | Chủ yếu là các biến thể exon (SNP, indel nhỏ) |
| Khối lượng dữ liệu | Lớn, đòi hỏi nhiều dung lượng lưu trữ và tài nguyên để phân tích | Kích thước dữ liệu nhỏ hơn, dễ quản lý và phân tích hơn |
6. Các nghiên cứu gần đây
- Ứng dụng lâm sàng của WES: Một trong những lợi thế nổi bật của giải trình tự toàn bộ vùng exon (WES) là hiệu quả chẩn đoán cao. Theo nghiên cứu quy mô lớn của Retter và cộng sự (2016) trên 3.040 ca lâm sàng, WES đạt tỷ lệ chẩn đoán dương tính là 28,8%. Đặc biệt, trong các trường hợp có nhiều thành viên trong gia đình được đưa vào phân tích, tỷ lệ này tăng lên 31%. Điều này cho thấy tiềm năng của WES trong việc xác định nguyên nhân di truyền của các bệnh lý, đặc biệt là đối với những tình trạng có biểu hiện phức tạp hoặc chưa rõ nguyên nhân.
- Chẩn đoán rối loạn chuyển hóa di truyền: WES cũng cho thấy hiệu quả cao trong chẩn đoán các rối loạn chuyển hóa di truyền (IMD). Nghiên cứu của Delanne và cộng sự (2021) thực hiện trên 547 bệnh nhân mắc các rối loạn phát triển không xác định đã ghi nhận tỷ lệ chẩn đoán dương tính là 32%, trong đó 12% bệnh nhân được xác định mắc 15 rối loạn chuyển hóa di truyền riêng. Đáng chú ý, WES còn có khả năng chẩn đoán hiệu quả các trường hợp IMD ở thai nhi với các dấu hiệu lâm sàng không điển hình. Điều này cho thấy vai trò quan trọng của kỹ thuật này trong chẩn đoán trước sinh và y học chính xác.
- WGS trong di truyền học quần thể: WGS đã cách mạng hóa nghiên cứu về di truyền học quần thể. Tính đến năm 2015, hơn 2504 bộ gen từ 26 quần thể khác nhau đã được giải trình tự, cung cấp cơ sở dữ liệu toàn diện để nghiên cứu sự đa dạng di truyền của con người. Những dữ liệu này không chỉ đóng vai trò quan trọng trong việc nghiên cứu tiến hóa mà còn giúp xác định các yếu tố nguy cơ di truyền liên quan đến cả bệnh phổ biến lẫn bệnh hiếm.
7. Kết luận
Giải trình tự toàn bộ hệ gen (WGS) và giải trình tự toàn bộ exome (WES) đều là những kĩ thuật với ưu điểm và hạn chế riêng biệt. WGS cung cấp góc nhìn rộng hơn, toàn diện hơn về hệ gen, lý tưởng cho nghiên cứu di truyền phức tạp và y học cá nhân hóa. Tuy nhiên, chi phí và tính phức tạp của dữ liệu khiến WES trở thành lựa chọn thiết thực hơn cho các nghiên cứu tập trung vào vùng exon hoặc khi làm việc với quy mô mẫu lớn. Những tiến bộ trong công nghệ giải trình tự tiếp tục giúp cả hai phương pháp dễ tiếp cận hơn và có tác động hơn trong việc thúc đẩy sự hiểu biết của chúng ta về di truyền học, bệnh tật và liệu pháp của con người.
GeneSmart cam kết mang đến cho khách hàng giải pháp hiệu quả cùng dịch vụ giải trình tự đánh tin cậy từ Novogene.
Tìm hiểu thêm về dịch vụ giải trình tự được cung cấp tại GeneSmart ở đây.
Tham khảo webinar “Unveiling the Human Genome using cutting-edge Sequencing techniques: WGS & WES” nếu bạn mới bắt đầu.
Nguồn tham khảo:
- Novogene. WGS vs. WES: Which genetic sequencing method is right for you? [Blog post]. Retrieved from https://www.novogene.com/amea-en/resources/blog/wgs-vs-wes-which-genetic-sequencing-method-is-right-for-you/
- Resta, C. D., Galbiati, S., Carrera, P., & Ferrari, M. (2018). Next-generation sequencing approach for the diagnosis of human diseases: Open challenges and new opportunities. EJIFCC, 29(1), 4-14.
- Retterer, K., Juusola, J., Cho, M.T., Vitazka, P., Millan, F., Gibellini, F., Vertino-Bell, A., Smaoui, N., Neidich, J., Monaghan, K.G. and McKnight, D., 2016. Clinical application of whole-exome sequencing across clinical indications. Genetics in Medicine, 18(7), pp.696-704.
- Delanne, J., Bruel, A.L., Huet, F., Moutton, S., Nambot, S., Grisval, M., Houcinat, N., Kuentz, P., Sorlin, A., Callier, P. and Jean-Marcais, N., 2021. The diagnostic rate of inherited metabolic disorders by exome sequencing in a cohort of 547 individuals with developmental disorders. Molecular Genetics and Metabolism Reports, 29, p.100812.
- 1000 Genomes Project Consortium, 2015. A global reference for human genetic variation. Nature, 526(7571), p.68.
- Walter, K., Min, J.L., Huang, J., Crooks, L., Memari, Y., McCarthy, S., Perry, J.R.B., Xu, C., Futema, M., Lawson, D. and Iotchkova, V., 2015. Management committee (2015). the uk10k project identifies rare variants in health and disease. Nature, 526(7571), pp.82-90.
- 1000 Genomes Project Consortium, 2010. A map of human genome variation from population scale sequencing. Nature, 467(7319), p.1061.
- Estivill, X. and Armengol, L., 2007. Copy number variants and common disorders: filling the gaps and exploring complexity in genome-wide association studies. PLoS genetics, 3(10), p.e190.
- Redon, R., Ishikawa, S., Fitch, K.R., Feuk, L., Perry, G.H., Andrews, T.D., Fiegler, H., Shapero, M.H., Carson, A.R., Chen, W. and Cho, E.K., 2006. Global variation in copy number in the human genome. nature, 444(7118), pp.444-454.
- Chaisson, M., Wilson, R. & Eichler, E. Genetic variation and the de novo assembly of human genomes. Nat Rev Genet 16, 627–640 (2015).https://doi.org/10.1038/nrg3933
- Belkadi, Aziz et al. “Whole-genome sequencing is more powerful than whole-exome sequencing for detecting exome variants.” Proceedings of the National Academy of Sciences of the United States of America vol. 112,17 (2015): 5473-8. doi:10.1073/pnas.1418631112
------------
GENESMART CO., LTD | Phân phối ủy quyền 10X Genomics, Altona, Biosigma, Hamilton, IT-IS (Novacyt), Norgen Biotek, Rainin tại Việt Nam.











