Làm chủ công nghệ giải trình tự gene virus SARS-CoV-2

(khoahocdoisong.vn) - GS.TS Trương Nam Hải, Viện Công nghệ Sinh học, Viện Hàn lâm KH&CN Việt Nam vừa công bố đã hoàn chỉnh và làm chủ công nghệ giải trình tự gene virus SARS-CoV-2.

Độ chính xác tương đương 99,99% 

Đề tài “Giải trình tự de novo virus SARS-CoV-2 gây bệnh viêm đường hô hấp cấp Covid-19 bằng hệ máy giải trình tự thế hệ mới PacBio Sequel” do Viện Công nghệ Sinh học thực hiện vừa được nghiệm thu thành công. Đây là một trong hai nhiệm vụ cấp bách được lãnh đạo Viện Hàn lâm Khoa học và Công nghệ Việt Nam (Viện Hàn lâm KH&CN Việt Nam) giao Viện Công nghệ Sinh học (CNSH) thực hiện, nhằm đáp ứng nhu cầu hỗ trợ xử lý dịch bệnh Covid-19 tại Việt Nam năm 2020.

GS.TS Trương Nam Hải cho biết, tại Việt Nam, để giải trình tự hệ gene virus SARS-CoV-2, các đơn vị trong nước sử dụng công nghệ giải trình tự đoạn ngắn. Sau đó lắp ráp và tham chiếu với hệ gene trước đó. Công nghệ này mất nhiều thời gian để đọc được trọn vẹn hệ gene (3 - 4 ngày) và vẫn có sai sót trong khi đọc.

Hiện nay, đây là thiết bị duy nhất ở Việt Nam, nó không phải đọc đoạn ngắn, mà đọc đoạn dài. Đọc đoạn ngắn thì chỉ đọc 100 - 200 nucleotide/đoạn, sau đó lắp ráp thành hệ gene đầy đủ. Nhưng giải đoạn dài thì có thể đọc hàng nghìn, hàng chục nghìn nucleotide/đoạn và việc đọc đoạn dài thì khi lắp ráp để ra một hệ gene sẽ đơn giản và chính xác hơn, độ chính xác tương đương 99,99% tức là lỗi đọc hầu như không có, lắp ráp rất nhanh. Thời gian để giải trình tự, lắp ráp, phân tích thì mất khoảng 2 ngày là có thể xong hệ gene của một virus.

GS.TS Trương Nam Hải cho biết thêm, đề tài đã giải trình tự toàn bộ hệ gene của 4 chủng virus SARS-CoV-2 với chiều dài trên 29.500 nucleotide/hệ gene. Kết quả phân tích cho thấy chủng virus phân lập bởi Viện Pasteur TPHCM chứa 10 đột biến liên quan đến các gene mã hóa Nsp2, Nsp3, RNA primase, helicase, protein S và protein N. 3 mẫu virus còn lại đều có nguồn gốc từ ổ dịch của Bệnh viện Bạch Mai thu thập trong các ngày 25 và 28/3/2020. Các chủng này chứa 5 đột biến giống nhau và có một chủng chứa 6 đột biến. Các đột biến liên quan đến các gene mã hóa protein Nsp3, RNA primase, protein S và N. Cả bốn chủng virus trên đều chứa đột biến D614G ở protein S.

Cây phân loại cho thấy sự tiến hóa của SARS-CoV-2 cũng như thời điểm các chủng lần lượt xâm nhập vào Việt Nam.

Cây phân loại cho thấy sự tiến hóa của SARS-CoV-2 cũng như thời điểm các chủng lần lượt xâm nhập vào Việt Nam.

Nhìn rõ sự tiến hóa của các chủng đột biến

Theo GS.TS Trương Nam Hải, hệ gene 4 chủng virus trong đề tài do Viện CNSH giải trình tự được phân tích so sánh với trình tự các mẫu virus đã được đưa lên cơ sở dữ liệu GISAID cho đến ngày 25/8/2020 (tổng 75 trình tự) cho thấy sự phân biệt rõ rệt của các chủng theo thời gian và địa điểm, cũng như sự có mặt đủ của 6 nhóm phân loại GISAID (clade) L, S, V, G, GR và GH tại Việt Nam trong năm 2020.

Phân bố của các nhóm virus tại Việt Nam chịu ảnh hưởng lớn của các chủng virus lưu hành trên thế giới: các chủng thuộc các nhóm S, L, V chiếm chủ yếu trong số những người trở về từ Trung Quốc hay có sự liên hệ với các nước châu Á nơi có nhiều giao thương với Trung Quốc trong tháng 1 và 2/2020; Chủng GH liên quan nhiều đến những trường hợp trở về từ Bắc Mỹ, còn chủng GR là từ khu vực châu Âu.

Trong đó, những chủng được giải trình tự trong nghiên cứu này đều có những biến đổi giống với các chủng có nguồn gốc châu Âu và Mỹ, lưu hành từ tháng 3/2020 – thời điểm chủng G (mang đột biến D614G) của virus SARS-CoV-2 bắt đầu lan rộng ra toàn thế giới.

Kết quả so sánh trình tự hệ gene của các chủng virus lưu hành ở Việt Nam cho đến 1/4/2021 cho thấy hiện nay ở Việt Nam đã xuất hiện đủ 8 nhóm (clade S,L,V,G,GR,GH,GV và GRY) của virus SARS-CoV-2 theo phân loại của GISAID với hàng chục biến thể khác nhau.

Việc ứng dụng thành công kỹ thuật giải trình tự hệ gene đoạn dài của PacBio đối với virus SARS-CoV-2 mở ra khả năng giải trình tự hệ gene virus nhanh, chính xác mà không cần dựa vào trình tự gene tham chiếu quốc tế. Dữ liệu giải trình tự hệ gene góp phần vào việc xác định nguồn gốc virus và số lượng nguồn lây (F0) trong các ổ dịch, là cơ sở khoa học, thông tin quan trọng trong xây dựng chiến lược, phương án phòng, chống hiệu quả sự lây lan của virus trong cộng đồng.

Theo Đời sống
back to top