Vì sao công nghệ Visium lại được quan tâm?
Khi nhìn vào mẫu mô, trong đầu chúng ta thường xuất hiện những câu hỏi: Cấu trúc mô ảnh hưởng đến chức năng và kiểu hình của tế bào như thế nào? Các loại tế bào khác nhau, ở các trạng thái biểu hiện khác nhau ở trọng mô đã tương tác với nhau như thế nào, liệu rằng vị trí của các tế bào có góp phần vào các tương tác này hay không? Đó là một trong số ít những câu hỏi mà “phân tích hệ phiên mã theo cấu trúc không gian” (spatially resolved transcriptomics) có thể giúp chúng ta trả lời. Được chọn làm “Giải pháp của năm 2020” trên Nature Method (Hình 1), “phân tích hệ phiên mã theo cấu trúc không gian” đã trở thành cột mốc xa nhất mà các nghiên cứu tiên tiến hàng đầu hiện nay có thể thực hiện được, cho phép các nhà khoa học có thể vừa đo mức độ hoạt động của gene vừa lập bản đồ vị trí mà các gene đó hoạt động trên lát cắt mô.
Là một đơn vị tiên phong trong lĩnh vực sinh học phân tử, 10X Genomics đã hoàn thiện công nghệ “phân tích hệ phiên mã theo cấu trúc không gian” và lấy tên là Visium Spatial Gene Expression (công nghệ Visium). Đây là một công nghệ cho phép các nhà khoa học phân tích biểu hiện gene lên đến xấp xỉ 5,000 vị trí khác nhau trên lát cắt mô đông lạnh (fresh frozen) và trên lát cắt mô đúc trong paraffin (FFPE).
Nguyên lý hoạt động của công nghệ Visium
Công nghệ giải trình tự gene thế hệ mới (công nghệ NGS) có đóng góp to lớn trong phân tích biểu hiện gene nhờ khả năng giải trình tự của tất cả mRNA trong mẫu, tuy nhiên công nghệ NGS lại không thể giúp chúng ta biết được các trình tự đó đến từ cụ thể tế bào nào hoặc đến từ vị trí nào trong mẫu. Để giải quyết những khó khăn đó, 10X Genomics đã đưa ra 2 giải pháp là công nghệ Chromium giúp phân tích biểu hiện gene trên tế bào đơn (xem thêm về công nghệ Chromium TẠI ĐÂY) và công nghệ Visium giúp phân tích biểu hiện gene theo cấu trúc không gian. Bài viết này sẽ chỉ tập trung về công nghệ Visium cho lát cắt mô đông lạnh (fresh frozen), còn về công nghệ Visium cho lát cắt mô đúc trong paraffin (FFPE) có thể xem thêm TẠI ĐÂY.
Công nghệ Visium dựa trên việc gắn thẻ (Spatial Barcode) lên các mRNA của lát cắt mô trước khi tiến hành tạo thư viện và giải trình tự, nhờ vào trình tự Spatial Barcode chúng ta có thể biết được mRNA đó đến từ đến từ vị trí nào trên lát cắt mô đang phân tích. Bên cạnh đó, công nghệ Visium còn sử dụng một loại thẻ thứ 2 gọi là UMI để đánh dấu lên từng bản sao phiên mã (transcript) và nhờ vậy có thể định lượng mức độ biểu hiện của từng loại mRNA thông qua việc đếm số UMI. Bản đồ biểu hiện gene sẽ được xây dựng dựa trên việc lồng ghép hình ảnh chụp lát cắt mô với bộ phiên mã của từng vị trí trên mô. Một quy trình Visium có thể tóm tắt thông qua 4 bước: chuẩn bị mẫu, nhuộm và chụp hình mẫu, gắn thẻ và tạo thư viện, giải trình tự và phân tích dữ liệu (Hình 2).
Công nghệ Visium gắn thẻ lên các mRNA của lát cắt mô đông lạnh (fresh frozen) bằng cách nào?
Bí mật của công nghệ nằm ở tấm lam kính Visium (Visium slide) được thiết kế đặc biệt. Lam kính Visium chứa 2 hoặc 4 vị trí đặt mẫu gọi là Capture Area, mỗi một Capture Area gồm ~5,000 điểm (spot) có đường kính 55μm và tâm của 2 spot cách nhau 100μm. Mỗi spot được gắn rất nhiều các primer, mỗi primer đều chứa 4 vùng trình tự (Hình 3):
1) TruSeq Read 1: Trình tự dài 22 nucleotide, là một phần của trình tự TrueSeq Read 1 của Illumina, đóng vai trò là vị trí mồi PCR thứ 1 bám vào (1st PCR handle) trong bước khuếch đại cDNA sau khi gắn spatial barcode và bước gắn index trong quá trình chuẩn bị thư viện spatial 3′ gene expression.
2) Spatial Barcode: Trình tự dài 16 nucleotide, mỗi spot mang 1 trình tự Spatial Barcode riêng và tất cả primer trong spot sẽ có Spatial Barcode giống nhau.
3) UMI: Trình tự dài 12 nucleotide, là trình tự độc nhất được dùng để “nhớ mặt đặt tên” từng phân tử (Unique Molecular Identifier). Mỗi primer trong spot sẽ có UMI riêng, vì vậy trong trường hợp gene phiên mã được nhiều bản sao thì mỗi bản sao sẽ mang trình tự UMI không giống nhau. Nhờ có UMI mà các bước PCR khuếch đại phía sau sẽ không ảnh hưởng việc định lượng số transcript vì PCR không làm thay đổi trình tự của UMI.
4) Poly(dT)VN: Trình tự poly(dT) dài 30 nucleotide giúp bắt giữ đuôi poly(A) của mRNA.
Sau khi nhuộm H&E; hoặc nhuộm miễn dịch huỳnh quang, mRNA sẽ được thẩm thấu (permeabilization) ra khỏi lát cắt mô và bắt cặp với các primer trên spot. Một phản ứng RT sẽ diễn ra ngay trên lam kính Visium sử dụng mồi là primer trên spot vì vậy cDNA được tạo ra sẽ mang 4 vùng trình tự có trên primer gồm TrueSeq Read 1, Spatial Barcode, UMI và Poly(dT)VN. Enzyme RT được sử dụng trong công nghệ của 10X Genomics có đặc điểm tự động gắn thêm một số nucleotide C vào đầu 3′ của cDNA sau khi đã đi hết chiều dài của đoạn mRNA. Đuôi poly C của cDNA sẽ tiếp tục bắt cặp với 3 nucleotide rG trên đầu 3′ của 1 trình tự gọi là TSO (Template Switch Oligo), enzyme RT sẽ sử dụng TSO làm khuôn mới và tiếp tục tổng hợp kéo dài cDNA. Vì primer đã bị gắn cố định trên spot, một phản ứng tổng hợp mạch bổ sung sẽ được thực hiện để thu nhận các cDNA đã gắn spatial barcode (Hình 4). Vùng trình được tổng hợp sử dụng khuôn TSO đóng vai trò là vị trí mồi PCR thứ 2 bám vào (2nd PCR handle) trong bước khuếch đại cDNA sau khi gắn spatial barcode.
Các cDNA mang spatial barcode sẽ được thu hồi và trộn chung vào cùng 1 ống nghiệm, việc này không làm ảnh hưởng các bước phân tích phía sau vì đã có spatial barcode để nhận diện. Toàn bộ cDNA thu hồi sẽ được khuếch đại bằng PCR để đảm bảo đủ lượng cDNA cần cho giải trình tự và phân tích dữ liệu.
Chuẩn bị thư viện spatial 3′ gene expression từ cDNA mang spatial barcode
Vì thư viện spatial 3′ gene expression bản chất là 1 thư viện giải trình tự nên kích thước của thư viện cũng bị giới hạn nằm trong khoảng 300 ~ 600 bp. Đồng thời, việc giữ phía mang spatial barcode của cDNA là bắt buộc trong phân tích biểu hiện gene theo cấu trúc không gian. Do đó, thư viện spatial 3′ gene expression chỉ giữ lại đoạn cDNA mang thông tin (insert sequence) dài khoảng 100 ~ 400 bp, tương ứng với 100 ~ 400 nucleotide ở đầu 3′ của mRNA (Hình 5).
So với “phía mang barcode” của cDNA, thư viện spatial 3′ gene expression được gắn thêm các trình tự:
1) P5 và P7: Trình tự adapter để tạo các cụm DNA (cluster) trong công nghệ giải trình tự NGS
2) Read 1 và Read 2: Trình tự TrueSeq Read 1 và TrueSeq Read 2 hoàn chỉnh để mồi giải trình tự bám vào
3) Index: Trình tự để phân biệt giữa mẫu này với mẫu khác.
Phân tích dữ liệu giải trình tự Spatial 3′ Gene Expression
Với cấu trúc thư viện spatial 3′ gene expression (Hình 5), mỗi một đoạn trình tự giải được sẽ gồm 4 thông tin quan trọng:
1) Index: Trình tự đại diện cho mẫu, các trình tự có index giống nhau thì có nguồn gốc từ cùng 1 mẫu.
2) Spatial Barcode: Trình tự đại diện cho vị trí (spot), các trình tự có Spatial Barcode giống nhau thì có cùng nguồn gốc từ cùng 1 spot.
3) Insert sequence (hay transcript): Trình tự mang thông tin đầu 3′ của mRNA, đây là vùng trình tự giúp xác định mRNA có nguồn gốc từ gene nào.
4) UMI: Trình tự đại diện cho phân tử bản sao phiên mã (transcript), mỗi UMI khác nhau sẽ được tính là 1 bản sao phiên mã (transcript) của gene đó, còn nếu 2 trình tự có UMI giống nhau thì đó là sự trùng lặp do PCR khuếch đại cDNA gây ra. Nhờ có UMI, việc định lượng biểu hiện gene của từng vị trí (spot) không bị ảnh hưởng bởi các bước PCR trong quy trình.
Sơn Phạm – Dịch và tổng hợp
Tài liệu tham khảo
1) 10X Genomics (PDF). Inside Visium Spatial Technology.
2) 10X Genomics (PDF). Visium Spatial Gene Expression Reagent Kits User Guide.
------------
GENESMART CO., LTD | Phân phối ủy quyền 10X Genomics, Altona, Biosigma, Hamilton, IT-IS (Novacyt), Norgen Biotek, Rainin tại Việt Nam.