Viện Nghiên cứu Dữ liệu lớn thuộc Vintech (Tập đoàn Vingroup) vừa công bố dự án Xây dựng cơ sở dữ liệu hệ biến dị di truyền của người Việt. Với mức đầu tư lên tới 4,5 triệu USD, nghiên cứu nhằm tạo ra hệ cơ sở dữ liệu cảnh báo, điều trị sớm một số bệnh, cũng như giúp phát triển các phương pháp chẩn đoán và điều trị bệnh hướng đến từng cá nhân. Đây là dự án về hệ gen có quy mô lớn nhất Đông Nam Á, tính đến thời điểm hiện tại.
Thông tin được Viện Nghiên cứu Dữ liệu lớn công bố tại hội thảo quốc tế trong lĩnh vực nghiên cứu y sinh với sự tham dự của các nhà khoa học Việt kiều Mỹ vừa tổ chức đầu tuần qua tại Hà Nội.
Theo đó, Tập đoàn Vingroup sẽ đầu tư 4,5 triệu USD cho dự án "Xây dựng cơ sở dữ liệu hệ biến dị di truyền cho quần thể người Việt" dựa trên việc giải trình tự toàn bộ hệ gen của 1.000 người. Với quy mô này, dự án sẽ tạo ra một cơ sở dữ liệu biến dị di truyền lớn nhất từ trước tới nay và tạo nguồn dữ liệu nền tảng cho các nghiên cứu về gen người Việt cho cộng đồng nghiên cứu trong và ngoài nước. Nghiên cứu sẽ được khởi động vào đầu năm 2019, kéo dài trong vòng 5 năm.
Trong 3 năm đầu (giai đoạn 1), các nhà khoa học sẽ triển khai thu thập mẫu của 1.000 người Việt và phối hợp với các đối tác quốc tế ở Mỹ, Đức, Singapore, và Nhật Bản... để giải trình và phân tích toàn bộ hệ gen với độ bao phủ cao, từ đó, lập cơ sở dữ liệu biến dị di truyền cho quần thể người Việt.
Từ cơ sở dữ liệu này, các nhà khoa học sẽ xây dựng thêm các danh sách biến dị (panel) tham chiếu phục vụ các nghiên cứu tương quan trên toàn hệ gen, các nghiên cứu về bệnh di truyền và về dược học hệ gen (PGx). Dữ liệu hệ gen sau giải trình tự với độ bao phủ lớn và các dữ liệu sau khi phân tích sẽ cần hàng trăm Terabytes bộ nhớ để lưu trữ. Để phục vụ nghiên cứu, Tập đoàn Vingroup cũng sẽ đầu tư các hệ thống phân tích hiện đại và hệ thống lưu trữ dữ liệu lớn để đáp ứng nhu cầu phân tích và lưu trữ trên.
GS. Vũ Hà Văn, Giám đốc khoa học của Viện Nghiên cứu Dữ liệu lớn nhấn mạnh: "Đây không chỉ là tiền đề cho nghiên cứu trong giai đoạn 2 mà còn là nền tảng cho các nghiên cứu về gen khác ở Việt Nam. Do tính phức tạp và đòi hỏi nguồn kinh phí lớn của việc xây dựng cơ sở dữ liệu về gen, dự án sẽ đóng có góp rất lớn đối với cộng đồng nghiên cứu về các vấn đề liên quan đến gen ở Việt Nam"
Ở giai đoạn 2, dự án tập trung vào các nghiên cứu tương quan trên toàn hệ gen để phát triển các phương pháp xét nghiệm cho một số bệnh di truyền và phản ứng có hại của thuốc.
Hiện nay nhóm nghiên cứu của dự án đã và đang hợp tác với các nhà nghiên cứu về hệ gen và các bệnh di truyền tại Mỹ, Đức, Nhật… Với lĩnh vực PGx, nhóm nghiên cứu cũng đang hợp tác với các nhóm nghiên cứu trong khu vực Đông Nam Á trong dự án "1.000 Pharmacogene Resequencing", trong đó Singapore, Thái Lan, Nhật Bản - những nước tiên phong trong ứng dụng PGx trong lâm sàng. Để giải trình tự và phân tích dữ liệu trên toàn hệ gen ở độ bao phủ lớn cho hàng nghìn hệ gen, dự án cũng hợp tác với các chuyên gia trong và ngoài nước cũng như ứng dụng công nghệ giải trình tự gen thế hệ mới của Illumina.
Việc triển khai các dự án này với sự kết nối với các chuyên gia nước ngoài sẽ giúp xây dựng đội ngũ làm nghiên cứu y sinh, hệ gen, và khoa học dữ liệu trong nước và tiếp cận với những phương pháp nghiên cứu, kỹ thuật phân tích dữ liệu mới nhất theo tiêu chuẩn quốc tế.
Xây dựng và phân tích hệ gen người có tác động lớn đến nhiều lĩnh vực khác nhau, trong đó nổi bật là y học, dược học, công nghệ sinh học và nhân chủng học. Đặc biệt các nghiên về gen giúp đưa ra các phát hiện, cảnh báo, và điều trị sớm một số bệnh, cũng như giúp phát triển các phương pháp chẩn đoán và điều trị bệnh hướng đến từng cá nhân (Y học cá thể hóa). Vì vậy dự án sẽ có tầm ảnh hưởng xã hội rất lớn.