Hướng dẫn về phương pháp và phần mềm dự đoán cấu trúc protein

Để thực hiện các chức năng sinh học của mình, các protein gấp thành một hoặc nhiều sự phù hợp cụ thể, được quyết định bởi các tương tác không cộng hóa trị phức tạp và có thể đảo ngược. Xác định cấu trúc của protein có thể đạt được bằng các kỹ thuật tốn thời gian và tương đối tốn kém như tinh thể học, quang phổ cộng hưởng từ hạt nhân và giao thoa kế phân cực kép. Phần mềm tin sinh học đã được phát triển để tính toán và dự đoán cấu trúc protein dựa trên trình tự axit amin của chúng.

Một bản tóm tắt về cấu trúc protein

Thay thế cho kỹ thuật thí nghiệm, các công cụ phân tích và dự đoán cấu trúc giúp dự đoán cấu trúc protein theo trình tự axit amin của chúng. Việc giải quyết cấu trúc của một loại protein nhất định là rất quan trọng trong y học (ví dụ, trong thiết kế thuốc) và công nghệ sinh học (ví dụ, trong thiết kế các enzyme mới). Do đó, lĩnh vực dự đoán protein tính toán đang phát triển không ngừng, theo sau sự gia tăng sức mạnh tính toán của máy móc và sự phát triển của các thuật toán thông minh.

Có bốn cấp cấu trúc protein (hình 1). Trong dự đoán cấu trúc protein, cấu trúc chính được sử dụng để dự đoán cấu trúc bậc hai và bậc ba.

Cấu trúc thứ cấp của protein được gấp cục bộ trong chuỗi polypeptide được ổn định bởi liên kết hydro. Các cấu trúc protein thứ cấp phổ biến nhất là xoắn alpha và tấm beta.

Cấu trúc bậc ba là dạng cuối cùng của protein một khi các cấu trúc thứ cấp khác nhau đã được xếp lại thành cấu trúc 3D. Hình dạng cuối cùng này hình thành và được tổ chức với nhau thông qua tương tác ion, cầu disulphide và lực van de Waals.

Bốn cấp cấu trúc protein. Hình ảnh từ Khanacademy.org.

Phương pháp và phần mềm dự đoán cấu trúc protein

Một số lượng lớn phần mềm dự đoán cấu trúc được phát triển cho các tính năng và tính đặc biệt của protein, như dự đoán rối loạn, dự đoán động lực học, dự đoán bảo tồn cấu trúc, v.v. dự báo peptide tín hiệu.

Chọn đúng phương pháp luôn bắt đầu bằng cách sử dụng chuỗi chính của protein chưa biết và tìm kiếm cơ sở dữ liệu protein để tìm điểm tương đồng (hình 2).

Biểu đồ ra quyết định cho phương pháp dự đoán cấu trúc protein.

Dưới đây là một số phương pháp chi tiết để dự đoán cấu trúc protein:

  • Công cụ dự đoán cấu trúc thứ cấp

Những công cụ này dự đoán cấu trúc thứ cấp cục bộ chỉ dựa trên trình tự axit amin của protein. Các cấu trúc dự đoán sau đó được so sánh với điểm DSSP, được tính toán dựa trên cấu trúc tinh thể của protein (nhiều hơn về điểm DSSP ở đây).

Các phương pháp dự đoán cho cấu trúc thứ cấp chủ yếu dựa vào cơ sở dữ liệu về cấu trúc protein đã biết và các phương pháp học máy hiện đại như lưới thần kinh và máy vectơ hỗ trợ.

Dưới đây là một số công cụ tuyệt vời để dự đoán cấu trúc thứ cấp.

  • Cấu trúc đại học

Các công cụ dự đoán cấu trúc bậc ba (hoặc 3-D) rơi vào hai phương pháp chính: Ab initio và mô hình protein so sánh.

Các phương pháp dự đoán cấu trúc protein ab initio (hoặc de novo) cố gắng dự đoán cấu trúc bậc ba từ các chuỗi dựa trên các nguyên tắc chung chi phối năng lượng gấp protein và / hoặc xu hướng thống kê của các đặc điểm cấu trúc mà cấu trúc bản địa có được, mà không sử dụng các mẫu rõ ràng.

Tất cả thông tin về cấu trúc cấp ba của protein được mã hóa trong cấu trúc chính của nó (nghĩa là chuỗi axit amin của nó). Tuy nhiên, một số lượng lớn trong số chúng có thể được dự đoán, trong đó chỉ có một loại có năng lượng tự do tối thiểu và độ ổn định cần phải được gấp lại đúng cách. Do đó, dự đoán cấu trúc protein ab initio đòi hỏi một lượng lớn sức mạnh tính toán và thời gian để giải quyết cấu trúc tự nhiên của protein và vẫn là một trong những thách thức hàng đầu của khoa học hiện đại.

Hầu hết các máy chủ phổ biến bao gồm Robetta (sử dụng gói phần mềm Rosetta), SWISS-MODEL, PEPstr, QUARK. Duyệt một danh sách đầy đủ ở đây.

Nếu một protein có cấu trúc bậc ba đã biết chia sẻ ít nhất 30% trình tự của nó với cấu trúc tương đồng tiềm năng của cấu trúc không xác định, thì các phương pháp so sánh che phủ cấu trúc chưa biết giả định có thể được sử dụng để dự đoán cấu trúc có khả năng của ẩn số. Mô hình hóa tương đồng và phân luồng protein là hai chiến lược chính sử dụng thông tin trước về protein tương tự khác để đề xuất dự đoán về một loại protein chưa biết, dựa trên trình tự của nó.

Phần mềm mô hình hóa và phân loại protein tương đồng bao gồm RaptorX, FoldX, HHpred, I-TASSER, v.v.

Người giới thiệu

Dự đoán cấu trúc protein de novo. Wikipedia.

Dự đoán cấu trúc protein. Wikipedia