DNA - “ổ cứng” chứa thông tin của toàn nhân loại  


DNA (Deoxyribonucleic acid) từ lâu đã được biết đến như một phân tử của sự sống. Nó chứa toàn bộ thông tin di truyền cho sự phát triển, trưởng thành, vận động và sinh sản của mọi loài sinh vật sống, kể cả một vài loại virus. Vào năm 1953, với vỏn vẹn một trang báo, nhân loại đã tiến gần hơn một bước tới giải mã nguồn gốc sự sống bằng bài viết của Watson và Crick về cấu trúc xoắn kép của DNA [1]. Hai chuỗi xoắn của DNA được hình thành bằng liên kết cộng hóa trị (liên kết phosphodiester) và được nối với nhau thông qua liên kết hydro giữa 2 trong 4 loại tiểu đơn vị A (adenine), G (guanine), T (thymine) và C (cytosine). Các đoạn ngắn của DNA có chứa thông tin di truyền được gọi là gen. Các gen này, sau khi được phiên mã thành RNA (Ribonucleic acid), sẽ được dịch mã thành các protein đóng vai trò quan trọng trong quá trình sinh trưởng và phát triển của tế bào nói riêng và sự sống nói chung. Những thông tin cơ bản về DNA từ lâu đã được đưa vào sách giáo khoa, và phổ cập cho mọi người. Điều đáng nói ở đây là chúng ta đã học được gì, và ứng dụng được gì từ những phân tử tiềm năng mà tạo hóa mang lại?

Hình 1: Cấu trúc của DNA, mỗi chuỗi được tạo thành từ liên kết phosphodiester giữa các tiểu đơn vị A, G, C, T. Hai chuỗi liên kết với nhau bằng liên kết hydro. Nguồn: [Wikipedia]

Những năm gần đây, với sự phát triển vượt bậc của các ngành khoa học, đặc biệt là ngành công nghệ thông tin, lượng tri thức của nhân loại gia tăng một cách chóng mặt. Chỉ trong hai năm trước, tổng lượng thông tin mới được tạo ra nhiều hơn tất cả thông tin trong lịch sử từ trước đến nay gộp lại [2]. Và dĩ nhiên, vấn đề lưu trữ cần được quan tâm. DNA, với sức chứa tối đa lên đến 215 petabytes (215 triệu gigabytes GB) trong một gram, có thể bảo quản thông tin của toàn nhân loại với khối lượng chỉ hơn kém một chiếc xe tải! Cộng với tính chất ổn định, bền vững (do cấu trúc đặc trưng) trong vài trăm ngàn năm, nếu được bảo quản tốt, DNA được xem là “ổ cứng” tối ưu nhất mà con người biết đến.

George Church và cộng sự, các nhà di truyền học tại đại học Harvard, đã thành công trong việc nén 52000 cuốn sách vào các phân tử DNA và giải mã thành công 100% lượng thông tin lưu trữ [3]. Tuy nhiên, mỗi gram DNA chỉ chứa được 1.28 petabytes, ít hơn 150 lần so với sức chứa lý thuyết. Một nghiên cứu mới được công bố trên tạp chí Science năm 2017 bởi Erlich Y và cộng sự, đã mang lại một phương pháp mới, gọi là DNA Fountain. Phương pháp này có khả năng chuyển tín hiệu bit (dữ liệu dạng nhị phân 0 và 1) thành tín hiệu sinh học dưới dạng mã di truyền A, G, C, T, với độ chính xác 100% và sức chứa của DNA lên tới 85% con số lý thuyết [4]. Tuy nhiên, nhóm nghiên cứu của Erlich cũng nhận định rằng phương pháp này, tuy hiệu quả cao, nhưng vẫn còn một số hạn chế, đặc biệt là về vấn đề kinh phí. Cần khoảng 7000 USD để chuyển đổi 2 MB dữ liệu thành mã di truyền, và khoảng 2000 USD để “đọc” chúng. Bên cạnh đó, vấn đề “ghi” và “đọc” dữ liệu của DNA tương đối chậm, nên chúng thích hợp cho việc lưu trữ thông tin dưới dạng thư viện hơn là những thông tin theo kiểu “mỳ ăn liền” [2].

Hình 2: Quy trình lưu trữ và “đọc” thông tin dựa vào vật liệu DNA. Nguồn: Chỉnh sửa từ DNA

Tuy còn nhiều khó khăn, nhưng chúng ta hoàn toàn có thể tin tưởng rằng trong tương lai, một thư viện chứa toàn bộ trí khôn nhân loại, nhỏ vỏn vẹn chỉ bằng lòng bàn tay. Và câu nói phóng đại “Ta đã nắm tất cả mọi kiến thức trong lòng bàn tay” sẽ trở thành sự thật.

Tác giả: Phạm Duy Toàn – Đại học Naresuan, Thái Lan

Tài liệu tham khảo:

1. J.D. Watson et al., Molecular structure of nucleic acids, A structure for deoxyribose nucleic acid. Nature. 4356, 737–738. 1953.

2. Robert Service, DNA could store all of the world's data in one room. Available from: http://www.sciencemag.org/news/2017/03/dna-could-store-all-worlds-data-one-room. 2017.

3. George M. Church et al., Next-generation digital information storage in DNA. Science. (6102), 1628. 2012.

4. Erlich et al., DNA Fountain enables a robust and efficient storage architecture. Science. 355, 950–954. 2017