Mô hình trí tuệ nhân tạo ESM3 mô phỏng quá trình tiến hoá hơn 500 triệu năm và tạo ra protein mới

Doanh nghiệp gần bạn nhất

được xác nhận bởi itcctv

Mô hình trí tuệ nhân tạo ESM3 mô phỏng quá trình tiến hoá hơn 500 triệu năm và tạo ra protein mới
Hình ảnh rao vặt

Mô hình trí tuệ nhân tạo ESM3 mô phỏng quá trình tiến hoá hơn 500 triệu năm và tạo ra protein mới

Trí tuệ nhân tạo lại chứng minh được tiềm năng to lớn của nó khi mô phỏng quá trình tiến hoá của protein và tạo ra một loại protein phát quang mới.

Các nhà khoa học đã đạt được một cột mốc đột phá khi sử dụng trí tuệ nhân tạo để mô phỏng 500 triệu năm tiến hóa, dẫn đến việc tạo ra một loại protein phát quang xanh mới (green fluorescent protein - GFP). Thành tựu này được thực hiện nhờ EvolutionaryScale Model 3 (ESM3), một mô hình trí tuệ nhân tạo được phát triển bởi EvolutionaryScale, một startup do các kỹ sư từng làm việc tại Meta sáng lập và được Amazon, NVIDIA hỗ trợ. ESM3 đánh dấu một bước tiến lớn trong thiết kế protein, mang lại những cơ hội chưa từng có cho nghiên cứu khoa học và ứng dụng thực tế.


Protein là những thành phần cơ bản của sự sống, và sự tiến hóa của chúng là yếu tố chính thúc đẩy sự phức tạp sinh học. ESM3 là một mô hình ngôn ngữ lớn (LLM) được huấn luyện trên 3,15 tỷ chuỗi protein có nguồn gốc từ khắp nơi trên thế giới, cùng với cấu trúc và chức năng liên quan của chúng. Bằng cách xử lý 771 tỷ token dữ liệu, mô hình này đã mô phỏng các quá trình tiến hóa tự nhiên kéo dài nửa tỷ năm để tạo ra những protein hoàn toàn mới, không tồn tại trong tự nhiên nhưng vẫn có chức năng và tiềm năng ứng dụng cao.


Protein phát quang esmGFP được tạo ra nhờ ESM3 thông qua việc mô phỏng quá trình tiến hoá


Sự mô phỏng mà ESM3 thực hiện bao gồm sự thay đổi về trình tự, cấu trúc và chức năng của các protein thông qua hàng tỷ năm chọn lọc tự nhiên và thích nghi. Kết quả là sự ra đời của một loại protein phát quang xanh tổng hợp, esmGFP, có trình tự gen tương đồng 58% với họ hàng gần nhất của nó trong thế giới thực, được tìm thấy ở các sinh vật phát quang sinh học như sứa và san hô. Sự tương đồng này cho thấy rằng protein này sẽ cần khoảng 500 triệu năm để tiến hóa một cách tự nhiên. Điều này cho thấy cách mà ESM3 đã nén dòng thời gian tiến hóa khổng lồ thành một khuôn khổ tính toán để khám phá những khả năng mới trong thiết kế protein mà tự nhiên có thể chưa từng đạt được.


Khả năng của ESM3 trong việc mô phỏng các quy mô thời gian tiến hóa rộng lớn như vậy nhấn mạnh tiềm năng của nó trong việc khám phá các câu hỏi cơ bản về sinh học. Một ví dụ cụ thể là các nhà khoa học vẫn luôn tranh luận về đặc tính tiến hoá của sinh vật: ngẫu nhiên (contingency) hay đoán định được (deterministic). Việc tạo ra esmGFP tương đồng 58% với họ hàng gần nhất ủng hộ quan điểm tất định, vì nó cho thấy cách mà các kết quả tiến hóa cụ thể có thể được suy luận thông qua tính toán.


ESM3 dựa trên tập dữ liệu lớn để mô phỏng tiến hoá

Bên cạnh đó, mô hình ESM3 có ý nghĩa rất lớn đối với khoa học và công nghệ. Nó cho phép các nhà nghiên cứu thiết kế protein với các đặc tính cụ thể cho nhiều ứng dụng khác nhau, chẳng hạn như xử lý môi trường, y học và năng lượng sạch. Ví dụ, mô hình này có thể tạo ra các enzyme có khả năng phân hủy rác thải nhựa hoặc các protein có chức năng điều trị vượt trội. Bằng cách làm cho sinh học trở nên lập trình được, ESM3 mở ra những cánh cửa mới trong sinh học tổng hợp và kỹ thuật sinh học.

Một trong những khía cạnh quan trọng nhất của ESM3 là khả năng tiếp cận của nó. Mô hình này được mở cho cộng đồng khoa học toàn cầu, cho phép các nhà nghiên cứu trên khắp thế giới tận dụng khả năng của nó. Việc dân chủ hóa các công cụ AI tiên tiến như vậy có thể đẩy nhanh những khám phá trong nhiều lĩnh vực từ sinh học tiến hóa đến công nghệ sinh học công nghiệp.


Alexander Rives, đồng sáng lập kiêm nhà khoa học trưởng tại EvolutionaryScale, hình dung một tương lai nơi trí tuệ nhân tạo trở thành công cụ nền tảng để thiết kế các hệ thống sinh học từ cơ bản, giống như cách các kỹ sư thiết kế ra hệ thống máy móc hay viết mã lệnh. ESM3 là một bước tiến lớn tới tầm nhìn này bằng cách tích hợp chuỗi dữ liệu, cấu trúc và chức năng vào một khung sinh tổng hợp duy nhất.


ESM3 sẽ tiếp tục được phát triển để mang lại những tác động cho việc nghiên cứu sinh học

Giống như các mô hình AI sinh tổng hợp khác như ChatGPT, ESM3 dự kiến sẽ cải thiện qua từng phiên bản kế tiếp. Các phiên bản tương lai có thể mang lại độ chính xác và tính linh hoạt cao hơn nữa, tăng cường khả năng của nhân loại trong việc giải quyết những thách thức toàn cầu cấp bách thông qua đổi mới sinh học.

Sự phát triển của ESM3 đánh dấu một bước đột phá mang tính cách mạng trong khoa học, minh chứng cho cách AI có thể mô phỏng các quá trình tự nhiên phức tạp như tiến hóa ở quy mô chưa từng có. Bằng cách thu hẹp khoảng cách trong hiểu biết về sinh học protein và mở ra những ứng dụng mới mẻ, công nghệ này có tiềm năng cách mạng hóa nhiều lĩnh vực từ bền vững môi trường đến chăm sóc sức khỏe. Khi các nhà nghiên cứu tiếp tục khám phá khả năng của nó, ESM3 có thể mở đường cho những giải pháp đột phá đối với một số vấn đề trên thế giới.

Nguồn: Popular Mechanics
Nguồn:tinhte.vn/thread/mo-hinh-tri-tue-nhan-tao-esm3-mo-phong-qua-trinh-tien-hoa-hon-500-trieu-nam-va-tao-ra-protein-moi.3953974/
💬 bình luận

Bình luận

Trở thành viên của itcctv — Đăng ký
Thủ thuật tin học văn phòng Thủ thuật Word Thủ thuật Excel
Cuộn