Giới thiệu về trình tự RNA đơn bào Single cell

Thời gian đọc: 40 phút 126 lượt xem

Mục lục: Single cell RNA-seq cho phép lập hồ sơ các bản phiên mã trong mẫu một cách hiệu quả và tiết kiệm chi phí. Đó là một bước đột phá lớn vào cuối những năm 00 và kể từ đó trở nên phổ biến hơn bao giờ hết, thay thế phần lớn các công nghệ lập hồ sơ phiên mã khác như microarrays. Một phần thành công của nó là do RNA-seq cho phép lấy mẫu không thiên vị tất cả các bản phiên mã trong một mẫu, thay vì bị giới hạn ở một bộ bản phiên mã được xác định trước (như trong microarrays hoặc RT-qPCR).

Tổng quan về trình tự RNA đơn bào Single Cell

Single cell RNA-seq cho phép lập hồ sơ các bản phiên mã trong mẫu một cách hiệu quả và tiết kiệm chi phí. Đó là một bước đột phá lớn vào cuối những năm 00 và kể từ đó trở nên phổ biến hơn bao giờ hết, thay thế phần lớn các công nghệ lập hồ sơ phiên mã khác như microarrays. Một phần thành công của nó là do RNA-seq cho phép lấy mẫu không thiên vị tất cả các bản phiên mã trong một mẫu, thay vì bị giới hạn ở một bộ bản phiên mã được xác định trước (như trong microarrays hoặc RT-qPCR).

Thông thường, RNA-seq đã được sử dụng trong các mẫu bao gồm hỗn hợp các tế bào, được gọi là RNA-seq số lượng lớn và có nhiều ứng dụng. Ví dụ, nó có thể được sử dụng để mô tả các dấu hiệu biểu hiện giữa các mô trong các mẫu khỏe mạnh/bị bệnh, mẫu hoang dã/đột biến hoặc đối chứng/được xử lý. Hoặc trong các nghiên cứu tiến hóa, sử dụng phương pháp phiên mã so sánh của các mẫu mô giữa các loài khác nhau [refs]. Bên cạnh việc sử dụng nó trong định lượng bản phiên mã, nó còn có thể được sử dụng để tìm và chú thích các gen mới, các dạng đồng phân gen và các bản phiên mã khác, cả ở sinh vật mô hình và không phải mô hình.

Tuy nhiên, với RNA-seq số lượng lớn, chúng tôi chỉ có thể ước tính mức biểu hiện trung bình cho từng gen trên một quần thể tế bào mà không quan tâm đến tính không đồng nhất trong biểu hiện gen trên từng tế bào của mẫu đó. Do đó, việc nghiên cứu các hệ thống không đồng nhất, ví dụ như nghiên cứu phát triển ban đầu hoặc các mô phức tạp như não là chưa đủ.

Để khắc phục hạn chế này, các giao thức mới đã được phát triển cho phép áp dụng RNA-seq ở cấp độ đơn bào (scRNA-seq), với lần xuất bản đầu tiên vào năm 2009 (Tang và cộng sự 2009 ) . Công nghệ này trở nên phổ biến hơn từ khoảng năm 2014 (ref), khi các giao thức mới và chi phí giải trình tự thấp hơn khiến nó dễ tiếp cận hơn. Không giống như phương pháp tiếp cận số lượng lớn, với scRNA-seq, chúng ta có thể ước tính sự phân bố mức độ biểu hiện của từng gen trên một quần thể tế bào.

Điều này cho phép chúng tôi trả lời các câu hỏi sinh học mới trong đó những thay đổi cụ thể của tế bào trong bản phiên mã là quan trọng. Ví dụ: khám phá các loại tế bào mới hoặc hiếm, xác định thành phần tế bào khác biệt giữa các mô khỏe mạnh/bệnh hoặc hiểu được sự phân biệt tế bào trong quá trình phát triển. Một trong những ứng dụng mang tính biểu tượng nhất của công nghệ này là xây dựng tập bản đồ gen (xem hộp bên dưới), cung cấp bản tóm tắt toàn diện về sự đa dạng tế bào ở sinh vật, với nhiều ứng dụng trong y tế cũng như nghiên cứu cơ bản.

Bộ dữ liệu single cell scRNA-seq có phạm vi từ hàng trăm đến hàng triệu tế bào cho mỗi nghiên cứu và tăng kích thước hàng năm. Có sẵn một số giao thức khác nhau, cả truy cập thương mại và truy cập mở, mỗi giao thức đều có ưu điểm và nhược điểm riêng. Chúng ta sẽ thảo luận về một số khía cạnh này trong các phần sau.

Định luật Moore trong phiên mã tế bào đơn, cho thấy sự gia tăng thông lượng của các thí nghiệm từ hàng chục lên hàng triệu tế bào chỉ trong hơn một thập kỷ. (hình ảnh được lấy từ [Svensson và cộng sự](https://arxiv.org/abs/1704.01379))

Hình 1: Định luật Moore trong phiên mã tế bào đơn, cho thấy số lượng thí nghiệm tăng từ hàng chục lên hàng triệu tế bào chỉ trong hơn một thập kỷ. (hình ảnh được lấy từ Svensson và cộng sự. )

Quy trình chuẩn bị mẫu single cell scRNA-seq

Nói rộng ra, một giao thức single cell scRNA-seq điển hình bao gồm các bước sau (được minh họa trong hình bên dưới):

Bóc tách mô và phân tách tế bào để thu được huyền phù tế bào.
Các tế bào có thể được chọn tùy ý (ví dụ dựa trên chất đánh dấu màng, gen chuyển huỳnh quang hoặc thuốc nhuộm nhuộm).
Thu giữ các tế bào đơn lẻ vào các thùng chứa phản ứng riêng lẻ (ví dụ: giếng hoặc giọt dầu).
Chiết xuất RNA từ mỗi tế bào.
Phiên mã ngược RNA thành cDNA ổn định hơn.
Khuếch đại cDNA (bằng cách phiên mã in vitro hoặc bằng PCR).
Chuẩn bị thư viện giải trình tự với các bộ điều hợp phân tử thích hợp.
Trình tự, thường là với các giao thức Illumina kết thúc theo cặp.
Xử lý dữ liệu thô để thu được ma trận đếm từng gen
Thực hiện một số phân tích xuôi dòng (trọng tâm của khóa học này).

Khóa học này chủ yếu đề cập đến bước cuối cùng của quy trình làm việc này, nhưng điều quan trọng là phải xem xét một số bước trước đó vì chúng có tác động đến các thuộc tính của dữ liệu chúng tôi nhận được.

Sơ đồ quy trình làm việc giải trình tự một ô điển hình. Chữ viết tắt: IVT, phiên mã in vitro ; PCR, phản ứng chuỗi polymerase; UMI, định danh phân tử duy nhất. Hình ảnh từ Lafzi et al. 2018.

Chuỗi RNA đơn nhân

Trong các mô khó phân ly tế bào hoặc trong các mẫu mô đông lạnh, thay vì phân lập toàn bộ tế bào đơn lẻ, có thể phân lập các nhân đơn lẻ. Ngoài bước cách ly, quy trình chuẩn bị các thư viện giải trình tự hạt nhân đơn cũng tương tự như quy trình của các giao thức đơn ô. Tuy nhiên, RNA nhân thường chứa tỷ lệ RNA chưa được xử lý cao hơn, với nhiều bản phiên mã được giải trình tự chứa intron hơn. Khía cạnh này cần được xem xét trong các bước xử lý dữ liệu mà chúng tôi sẽ trình bày chi tiết trong chương sau.

Hiện tại có rất nhiều giao thức để chuẩn bị dữ liệu single cell scRNA-seq, mỗi giao thức đều có điểm mạnh và điểm yếu riêng mà chúng ta sẽ đề cập dưới đây. Các phương pháp này có thể được phân loại theo nhiều cách khác nhau, nhưng hai khía cạnh quan trọng nhất là thu thập hoặc phân lập tế bào và định lượng bản sao .

So sánh các giao thức scRNA-seq phổ biến. Chữ viết tắt: cDNA, DNA bổ sung; DNA pol I, DNA polymerase I; FACS, phân loại tế bào được kích hoạt bằng huỳnh quang; PCR, phản ứng chuỗi polymerase; RNase H, ribonuclease H; RT, phiên mã ngược; TSO, oligonucleotide chuyển mẫu. (nguồn: Chen, Teichman và Meyer, 2018 )

Chụp tế bào

Chiến lược được sử dụng để thu thập các ô sẽ xác định thông lượng của thử nghiệm (tức là chúng tôi phân lập bao nhiêu ô), cách chọn các ô trước khi giải trình tự tế bào đơn, cũng như loại thông tin bổ sung nào ngoài trình tự phiên mã có thể thu được. Ba phương pháp được sử dụng rộng rãi nhất là phương pháp dựa trên tấm vi hiệu giá , phương pháp dựa trên mảng vi lỏng và phương pháp dựa trên giọt vi lỏng .

Phương pháp phân lập tế bào đơn

Các phương pháp đĩa vi hiệu giá dựa vào việc phân lập các tế bào vào các giếng riêng lẻ của đĩa bằng cách sử dụng, chẳng hạn như pipet, vi phẫu hoặc phân loại tế bào được kích hoạt bằng huỳnh quang (FACS). Một ưu điểm của các phương pháp dựa trên nền tảng tốt là người ta có thể chụp ảnh các ô trước khi chuẩn bị thư viện, cung cấp một phương thức dữ liệu bổ sung. Ví dụ, người ta có thể xác định và loại bỏ các ô bị hư hỏng hoặc tìm các giếng chứa các ô kép (các giếng có hai ô trở lên). Khi sử dụng tính năng sắp xếp FACS tự động, cũng có thể liên kết thông tin như kích thước ô và cường độ của bất kỳ nhãn nào được sử dụng với tọa độ giếng và do đó với các chỉ số ô riêng lẻ trong phân tích tiếp theo. Hạn chế chính của các phương pháp này là chúng thường có thông lượng thấp và khối lượng công việc yêu cầu trên mỗi ô có thể rất lớn.

Các nền tảng mảng vi lỏng, chẳng hạn như C1 của Fluidigm, cung cấp một hệ thống tích hợp hơn để thu giữ các tế bào và thực hiện các phản ứng cần thiết cho việc chuẩn bị thư viện. Vì vậy, chúng cung cấp năng suất cao hơn so với các phương pháp dựa trên đĩa vi hiệu giá. Thông thường, chỉ có khoảng 10% tế bào được thu giữ trong nền tảng vi lỏng và do đó chúng không phù hợp nếu xử lý các loại tế bào hiếm hoặc lượng đầu vào rất nhỏ. Cũng phải cẩn thận với các kích thước tế bào được mảng thu được, vì các giếng nano được tùy chỉnh cho các kích thước cụ thể (do đó điều này có thể ảnh hưởng đến việc lấy mẫu tế bào không thiên vị trong các mô phức tạp). Hơn nữa, con chip này tương đối đắt tiền, nhưng vì các phản ứng có thể được thực hiện với khối lượng nhỏ hơn nên có thể tiết kiệm tiền mua thuốc thử.

Phương pháp vi lỏng nhỏ giọt mang lại thông lượng cao nhất và là phương pháp phổ biến nhất được sử dụng hiện nay. Chúng hoạt động bằng cách gói gọn các tế bào riêng lẻ bên trong một giọt dầu có kích thước nanolit cùng với một hạt. Hạt chứa đầy enzym và các thành phần khác cần thiết để xây dựng thư viện. Đặc biệt, mỗi hạt chứa một mã vạch duy nhất được gắn vào tất cả các lần đọc trình tự bắt nguồn từ ô đó. Do đó, tất cả các giọt có thể được gộp lại, sắp xếp theo thứ tự với nhau và số lần đọc sau đó có thể được gán cho ô gốc dựa trên các mã vạch đó. Nền tảng giọt có chi phí chuẩn bị thư viện tương đối rẻ khoảng 0,05 USD/ô. Thay vào đó, chi phí giải trình tự thường trở thành yếu tố hạn chế và một thử nghiệm điển hình có phạm vi bao phủ thấp khi chỉ phát hiện được vài nghìn bản phiên mã khác nhau (Ziegenhain và cộng sự 2017) .

Phân loại tế bào được kích hoạt bằng huỳnh quang (FACS) có thể được sử dụng ngược dòng với bất kỳ phương pháp bắt giữ nào, để chọn một quần thể tế bào phụ. Một cách phổ biến được sử dụng là nhuộm các tế bào bằng thuốc nhuộm để phân biệt giữa tế bào sống và tế bào chết (ví dụ do vỡ màng), do đó làm phong phú huyền phù tế bào với các tế bào sống sót.

Định lượng bảng điểm

Có hai loại định lượng bản ghi: độ dài đầy đủ và dựa trên thẻ . Các giao thức có độ dài đầy đủ cố gắng đạt được phạm vi đọc thống nhất trên toàn bộ bản ghi, trong khi các giao thức dựa trên thẻ chỉ ghi được đầu 5′ hoặc 3′. Việc lựa chọn phương pháp định lượng có ý nghĩa quan trọng đối với loại dữ liệu có thể được sử dụng cho loại phân tích nào.

Việc chuẩn bị các thư viện có độ dài đầy đủ cho một ô về cơ bản giống với những gì được thực hiện với số lượng lớn RNA-seq (Hình bên dưới) và bị giới hạn ở các giao thức dựa trên tấm như SMART-seq2. Mặc dù về mặt lý thuyết, các giao thức có độ dài đầy đủ sẽ cung cấp phạm vi bao phủ đồng đều cho các bản phiên mã, nhưng đôi khi có thể có những sai lệch trong phạm vi bao phủ trên toàn bộ cơ thể gen (minh họa bên dưới). Các giao thức có độ dài đầy đủ cũng cho phép phát hiện các biến thể mối nối, điều này rất khó thực hiện với các giao thức khác.

Chuẩn bị thư viện RNA có độ dài đầy đủ cho trình tự Illumina. Các mẫu được làm giàu để chứa RNA chứa đuôi poly(A), giúp tránh giải trình tự rRNA (với cái giá là thiếu các RNA không mã hóa khác). Sau đó, RNA được phân mảnh và phiên mã ngược thành cDNA ổn định hơn, các bộ điều hợp Illumina được nối với từng phân tử và cuối cùng được khuếch đại PCR. Trong trường hợp RNA-seq đơn bào, các bộ điều hợp có mã vạch cụ thể được sử dụng, cho phép xác định các lần đọc trình tự thuộc về từng ô riêng lẻ.

Hình 2: Ví dụ về độ lệch 3′ trong phạm vi bao phủ của gen, sau khi căn chỉnh trình tự đọc theo bản phiên mã. Mỗi dòng biểu thị mức độ bao phủ trung bình trên tất cả các gen trong một tế bào. Trong ví dụ này, ngoài độ lệch 3′ trên tất cả các ô, còn có ba ô trông giống như các ngoại lệ so với các ô còn lại và cần được loại bỏ khỏi phân tích tiếp theo. Đây có thể là những tế bào có chất lượng RNA kém hơn, ví dụ do bị thoái hóa. Nguồn: https://www.labome.com/method/RNA-seq.html

Với các giao thức dựa trên thẻ, chỉ một trong các đầu (3′ hoặc 5′) của bản ghi được sắp xếp theo trình tự. Ưu điểm chính của các giao thức dựa trên thẻ là chúng có thể được kết hợp với các mã định danh phân tử duy nhất (UMI), có thể giúp cải thiện độ chính xác của việc định lượng bản ghi. Lý do cho sự cải tiến này liên quan đến bước khuếch đại PCR trong quá trình chuẩn bị thư viện, tạo ra một số bản sao trùng lặp của mỗi phân tử. Bởi vì sự khuếch đại này là theo cấp số nhân nên các phân tử có thể được biểu diễn không công bằng trong thư viện cuối cùng, dẫn đến việc ước tính quá mức biểu hiện của chúng do các bản sao PCR này. Để giải quyết vấn đề này, mã vạch tế bào được gắn thẻ duy nhất bằng một chuỗi nucleotide ngẫu nhiên, UMI, do đó chuỗi này chỉ dành riêng cho một phân tử. UMI này là một phần của quá trình đọc trình tự và sau đó có thể được tính toán về mặt tính toán khi định lượng mức độ phong phú của bản ghi. Hầu hết các giao thức scRNA-seq hiện tại đều dựa trên thẻ, bao gồm giao thức Crom 10x dựa trên giọt phổ biến , được minh họa trong hình bên dưới. Một nhược điểm của các giao thức dựa trên thẻ là do chỉ bị giới hạn ở một đầu của bản ghi, nó làm giảm khả năng căn chỉnh rõ ràng các lần đọc với bản ghi, cũng như gây khó khăn cho việc phân biệt các dạng đồng dạng khác nhau (Archer và cộng sự 2016 ) .

Tổng quan về giao thức của các thư viện 3′ sử dụng giao thức 10X Crom . Các tế bào được giữ lại trong từng giọt dầu có chứa một hạt (gọi là GEM). Một hạt riêng lẻ chứa các bộ điều hợp có mã vạch chung nhưng các chuỗi Mã nhận dạng phân tử duy nhất (UMI) đa dạng và khác biệt. Mồi poly(dT) được sử dụng để phiên mã ngược mRNA có đuôi poly-A thành cDNA. Sau đó, GEM bị phá vỡ và cDNA gộp lại (từ tất cả các tế bào có mã vạch) được khuếch đại bằng PCR. Cuối cùng, cDNA bị phân mảnh và một bộ chuyển đổi Illumina khác được nối ở đầu kia của phân tử. Thư viện cuối cùng bao gồm một lần đọc chứa mã vạch dành riêng cho tế bào (được sử dụng để xác định các lần đọc từ các ô khác nhau) và UMI dành riêng cho phân tử (được sử dụng để định lượng biểu hiện của gen), trong khi lần đọc thứ hai chứa trình tự từ phân tử cDNA thực tế và có thể được sử dụng để căn chỉnh nó thành một bản ghi tham chiếu. (Nguồn: Hướng dẫn sử dụng Chrome Next GEMSingle Cell 3ʹ )

5′ hay 3′?

Sự khác biệt giữa các giao thức dựa trên thẻ 5′ và 3′ là phần cuối của bản phiên mã được sắp xếp theo trình tự. Mặc dù giao thức 3′ được sử dụng phổ biến hơn nhưng hiện nay nhiều giao thức cho phép giải trình tự từ một trong hai đầu (ví dụ: 10x Chrome hỗ trợ cả hai ). Ưu điểm của giải trình tự đầu 5′ là chúng tôi có được thông tin về vị trí bắt đầu phiên mã (TSS), cho phép khám phá xem liệu có cách sử dụng TSS khác nhau giữa các ô hay không.

Thiết kế thí nghiệm Single cell

Một số cân nhắc cần được tính đến khi thực hiện các thử nghiệm scRNA-seq. Các yếu tố như chi phí cho mỗi ô, số lượng ô cần có hoặc số lượng sắp xếp cho mỗi ô, đều có thể ảnh hưởng đến sự lựa chọn giao thức của chúng ta. Mặt khác, cần phải cẩn thận để tránh sai lệch do các lô được xử lý vào các thời điểm khác nhau và việc thiếu sự sao chép đầy đủ cũng có thể hạn chế các loại phân tích có thể được thực hiện và do đó hạn chế khả năng trả lời một số câu hỏi quan tâm của chúng tôi.

Tôi nên chọn giao thức nào?

Nền tảng phù hợp nhất phụ thuộc vào câu hỏi sinh học hiện tại. Ví dụ, nếu người ta quan tâm đến việc mô tả đặc điểm thành phần của một mô không đồng nhất, thì phương pháp dựa trên giọt nước sẽ phù hợp hơn, vì nó cho phép thu giữ một số lượng rất lớn tế bào theo cách gần như không thiên vị. Mặt khác, nếu người ta quan tâm đến việc mô tả đặc điểm của một quần thể tế bào cụ thể có điểm đánh dấu bề mặt đã biết, thì có lẽ tốt nhất nên làm giàu bằng cách sử dụng FACS và sau đó sắp xếp một số lượng tế bào nhỏ hơn ở độ sâu trình tự cao hơn.

Rõ ràng, việc định lượng bản ghi có độ dài đầy đủ sẽ phù hợp hơn nếu người ta quan tâm đến việc nghiên cứu các dạng đồng dạng khác nhau, vì các giao thức được gắn thẻ bị hạn chế hơn nhiều về mặt này. Ngược lại, UMI chỉ có thể được sử dụng với các giao thức được gắn thẻ và chúng có thể cải thiện việc định lượng ở cấp độ gen.

Nếu một người quan tâm đến các loại tế bào hiếm (không có sẵn các dấu hiệu đã biết), thì cần phải giải trình tự nhiều tế bào hơn, điều này sẽ làm tăng chi phí của thí nghiệm. Một công cụ hữu ích để ước tính số lượng ô cần sắp xếp đã được Phòng thí nghiệm Satija phát triển: https://satijalab.org/howmanycells/ .

Một cách khác để quyết định sử dụng phương pháp nào là dựa vào các nghiên cứu dành riêng cho việc so sánh các giao thức khác nhau. Các nghiên cứu này tập trung vào các vấn đề như độ nhạy (có bao nhiêu gen được phát hiện trên mỗi tế bào), độ chính xác của chúng (ví dụ so với RNA-seq số lượng lớn) và khả năng phục hồi tất cả các loại tế bào có trong một mẫu (được thử nghiệm trên hỗn hợp tế bào có bán trên thị trường) . Ví dụ, một nghiên cứu của Ding et al. vào năm 2020 minh họa cách các phương pháp thông lượng thấp có độ nhạy cao hơn so với các phương pháp thông lượng cao, chẳng hạn như Crom 10x (Hình bên dưới). Mặt khác, các phương pháp thông lượng thấp không thu được một số loại tế bào hiếm hơn trong mẫu của chúng, dẫn đến đặc tính của quần thể tế bào không đầy đủ.

Độ nhạy phát hiện bản phiên mã của các phương pháp khác nhau trong hỗn hợp thương mại của tế bào đơn nhân máu ngoại vi (PBMC). Hình ảnh được lấy từ Ding et al. và hiển thị a) số lượng UMI riêng biệt được phát hiện trên mỗi ô (đối với các phương pháp sử dụng định lượng bản phiên mã dựa trên thẻ) và b) số lượng gen được phát hiện trên mỗi ô trên các phương pháp. Kết quả từ hai lần lặp lại thử nghiệm được hiển thị.

Một nghiên cứu khác của Ziegenhain et al. ( Ziegenhain và cộng sự 2017 ) đã so sánh năm quy trình khác nhau trên cùng một mẫu tế bào gốc phôi chuột (mESCs) và đưa ra kết luận tương tự. Và cuối cùng, một nghiên cứu của Svensson et al. ( Svensson và cộng sự 2017 ) đã sử dụng bản ghi tổng hợp (spike-in) với nồng độ đã biết để đo độ chính xác và độ nhạy của các giao thức khác nhau. So sánh nhiều nghiên cứu khác nhau, họ cũng báo cáo những khác biệt đáng kể giữa các phác đồ (Hình bên dưới).

Hình từ [Svensson et al.](https://doi.org/10.1038/nmeth.4220), so sánh các giao thức khác nhau liên quan đến a) độ chính xác của chúng (được đo bằng mối tương quan của Pearson với dữ liệu RNA-seq số lượng lớn) và b) độ nhạy (số lượng phân tử được phát hiện).

Hình 2.3: Hình từ Svensson et al., so sánh các giao thức khác nhau liên quan đến a) độ chính xác của chúng (được đo bằng mối tương quan của Pearson với dữ liệu RNA-seq số lượng lớn) và b) độ nhạy (số lượng phân tử được phát hiện).

Khi các giao thức được phát triển và cải tiến cũng như các phương pháp tính toán mới để định lượng tiếng ồn kỹ thuật xuất hiện, có khả năng các nghiên cứu trong tương lai sẽ giúp chúng ta hiểu rõ hơn về điểm mạnh của các phương pháp khác nhau. Những nghiên cứu so sánh này không chỉ hữu ích trong việc quyết định nên sử dụng giao thức nào mà còn giúp phát triển các phương pháp mới vì việc so sánh điểm chuẩn giúp xác định chiến lược nào là hữu ích nhất.

Bên cạnh sự khác biệt về thông lượng và độ nhạy giữa các giao thức, chi phí cũng có thể là yếu tố quyết định khi lập kế hoạch thử nghiệm scRNA-seq. Rất khó để ước tính chính xác chi phí của một thử nghiệm là bao nhiêu, mặc dù chúng tôi chỉ ra công cụ này từ Phòng thí nghiệm Satija làm điểm bắt đầu: https://satijalab.org/costpercell/ . Ví dụ: một số giao thức dựa trên giọt như Drop-seq rẻ hơn so với các giao thức thay thế thương mại như 10x Chrome. Tuy nhiên, họ yêu cầu các phòng thí nghiệm phải được trang bị để chuẩn bị cho thư viện cũng như đội ngũ nhân viên được đào tạo và thời gian dành riêng (tốn tiền lương).

Các phương pháp như băm tế bào ( Stoeckius và cộng sự ) có thể giảm thêm chi phí giải trình tự bằng các nền tảng hiện tại. Đặc biệt, phương pháp này bao gồm việc gắn các thẻ oligo vào màng tế bào, cho phép tải nhiều tế bào từ nhiều mẫu hơn cho mỗi thí nghiệm, sau đó có thể được phân tách trong quá trình phân tích.

Những thách thức về dữ liệu giải trình tự tế bào đơn single cell

Sự khác biệt chính giữa single cell RNA-seq số lượng lớn và tế bào đơn là mỗi thư viện giải trình tự đại diện cho một ô duy nhất, thay vì một quần thể tế bào. Do đó, không có cách nào để có “bản sao sinh học” ở cấp độ đơn bào: mỗi tế bào là duy nhất và không thể sao chép. Thay vào đó, các ô có thể được nhóm lại theo độ giống nhau của chúng và sau đó việc so sánh có thể được thực hiện giữa các nhóm ô tương tự (như chúng ta sẽ thấy ở phần sau của khóa học).

Một thách thức lớn khác trong single cell RNA-seq đơn bào là chúng ta có lượng nguyên liệu ban đầu trên mỗi tế bào rất thấp. Điều này dẫn đến dữ liệu rất thưa thớt , trong đó hầu hết các gen vẫn không bị phát hiện và do đó dữ liệu của chúng tôi chứa nhiều số không. Những điều này có thể là do gen không được biểu hiện trong tế bào (số 0 “thực”) hoặc gen đã được biểu hiện nhưng chúng tôi không thể phát hiện ra nó (“bỏ rơi”). Điều này dẫn đến sự biến đổi giữa các tế bào không phải lúc nào cũng mang tính sinh học mà là do các vấn đề kỹ thuật gây ra bởi sự khuếch đại PCR không đồng đều giữa các tế bào và sự “bỏ rơi” gen (trong đó một gen được phát hiện trong một tế bào nhưng không có ở tế bào khác ( Kharchenko, Silberstein, và Scadden 2014 ) ). Cải thiện hiệu quả ghi lại bản ghi và giảm độ lệch khuếch đại là giải pháp cho những vấn đề này và vẫn là lĩnh vực nghiên cứu kỹ thuật đang hoạt động. Tuy nhiên, như chúng ta sẽ thấy trong khóa học này, có thể giảm bớt một số vấn đề này thông qua việc chuẩn hóa dữ liệu thích hợp.

Một khía cạnh quan trọng khác cần tính đến là hiệu ứng hàng loạt. Những điều này có thể được quan sát ngay cả khi giải trình tự cùng một vật liệu bằng các công nghệ khác nhau (hình bên dưới) và nếu không được chuẩn hóa đúng cách, có thể dẫn đến kết luận không chính xác.

Quần thể tế bào giống nhau được giải trình tự bằng ba giao thức đơn bào (màu sắc) khác nhau. Chuyển thể từ Zhang và cộng sự. .

Việc xử lý mẫu cũng phải được thực hiện theo cách tránh gây nhiễu giữa các biến số được kiểm soát bằng thực nghiệm (chẳng hạn như phương pháp điều trị, kiểu gen hoặc trạng thái bệnh) và thời điểm mẫu được chuẩn bị và giải trình tự. Ví dụ: nếu lập kế hoạch cho một thí nghiệm để so sánh các mô khỏe mạnh và bệnh tật của 10 bệnh nhân, nếu chỉ có thể xử lý 10 mẫu mỗi ngày thì tốt nhất nên thực hiện 5 mẫu khỏe mạnh + 5 mẫu bệnh cùng nhau mỗi ngày, thay vì chuẩn bị tất cả các mẫu khỏe mạnh trong một ngày. và tất cả các mẫu bệnh ở một mẫu khác (hình). Một cân nhắc khác là đảm bảo rằng có sự sao chép của các mẫu mô. Ví dụ, khi thu thập mô từ một cơ quan, có thể nên lấy nhiều mẫu từ các bộ phận khác nhau của cơ quan đó. Hoặc xem xét thời gian trong ngày khi mẫu/bản sao được thu thập (do có thể có những thay đổi sinh học trong biểu hiện gen). Tóm lại, tất cả các phương pháp thực hành tốt nhất phổ biến trong thiết kế thử nghiệm cần được tính đến khi thực hiện scRNA-seq.

Minh họa về thiết kế hỗn hợp (bảng trên) và thiết kế cân bằng (bảng dưới). Hình dạng biểu thị các loại mẫu khác nhau (ví dụ như mô hoặc bệnh nhân) và các lô xử lý màu sắc. Trong thiết kế phức tạp, không thể tách rời biến thể sinh học khỏi biến thể do lô xử lý. Trong thiết kế cân bằng, bằng cách sử dụng các bản sao mô và trộn chúng theo từng đợt, có thể phân biệt giữa biến đổi sinh học và biến đổi liên quan đến đợt. Hình từ Hicks et al. .

Tóm tắt

Giải trình tự tế bào đơn scRNA-seq phù hợp lý tưởng để nghiên cứu các quần thể tế bào không đồng nhất. Ví dụ: để xác định các loại tế bào cấu thành mô, xác định “dấu vân tay phiên mã” cho các loại tế bào khác nhau, nghiên cứu sự biệt hóa tế bào, khám phá những thay đổi trong thành phần tế bào do bệnh tật hoặc các yếu tố môi trường, cùng nhiều yếu tố khác.
Quy trình chuẩn bị mẫu single cell điển hình bao gồm phân lập các tế bào đơn lẻ (hoặc nhân), chuyển đổi RNA thành cDNA, chuẩn bị thư viện giải trình tự (Illumina) và giải trình tự.
Nhiều giao thức đơn bào đã được phát triển, một số có sẵn công khai, một số khác được cung cấp thương mại. Chúng chủ yếu khác nhau về thông lượng (có bao nhiêu ô được ghi lại trong mỗi thử nghiệm), loại định lượng (dựa trên độ dài đầy đủ hoặc dựa trên thẻ) và cả chi phí.
SMART-seq2 là một phương pháp thông lượng thấp phổ biến, cung cấp định lượng bản ghi có độ dài đầy đủ. Nó phù hợp lý tưởng để nghiên cứu một nhóm tế bào nhỏ hơn một cách chi tiết hơn (ví dụ: cách sử dụng isoform khác biệt, mô tả đặc điểm của các bản phiên mã được biểu thị thấp).
10x Chrome là phương pháp thông lượng cao phổ biến, sử dụng UMI để định lượng bản ghi (từ đầu 3′ hoặc 5′). Nó rất phù hợp để nghiên cứu các mô có tính không đồng nhất cao và lấy mẫu các quần thể tế bào lớn trên quy mô lớn.
Khi lập kế hoạch thí nghiệm giải trình tự tế bào đơn, cần cẩn thận để tránh gây nhiễu do hiệu ứng lô cũng như đảm bảo mức độ lặp lại phù hợp để giải quyết các câu hỏi quan tâm.

Trích dẫn

Archer, Nathan, Mark D. Walsh, Vahid Shahrezaei, and Daniel Hebenstreit. 2016. “Modeling Enzyme Processivity Reveals That RNA-Seq Libraries Are Biased in Characteristic and Correctable Ways.” Cell Systems 3 (5): 467–479.e12. https://doi.org/10.1016/j.cels.2016.10.012.

Kharchenko, Peter V, Lev Silberstein, and David T Scadden. 2014. “Bayesian Approach to Single-Cell Differential Expression Analysis.” Nat. Methods 11 (7): 740–42. https://doi.org/10.1038/nmeth.2967.

Svensson, Valentine, Kedar Nath Natarajan, Lam-Ha Ly, Ricardo J Miragaia, Charlotte Labalette, Iain C Macaulay, Ana Cvejic, and Sarah A Teichmann. 2017. “Power Analysis of Single-Cell RNA-Sequencing Experiments.” Nat. Methods 14 (4): 381–87. https://doi.org/10.1038/nmeth.4220.

Tang, Fuchou, Catalin Barbacioru, Yangzhou Wang, Ellen Nordman, Clarence Lee, Nanlan Xu, Xiaohui Wang, et al. 2009. “mRNA-Seq Whole-Transcriptome Analysis of a Single Cell.” Nat. Methods 6 (5): 377–82. https://doi.org/10.1038/nmeth.1315.

Ziegenhain, Christoph, Beate Vieth, Swati Parekh, Björn Reinius, Amy Guillaumet-Adkins, Martha Smets, Heinrich Leonhardt, Holger Heyn, Ines Hellmann, and Wolfgang Enard. 2017. “Comparative Analysis of Single-Cell RNA Sequencing Methods.” Mol. Cell 65 (4): 631–643.e4. https://doi.org/10.1016/j.molcel.2017.01.023.

CÔNG TY TNHH KHOA HỌC CÔNG NGHỆ GENESMART