بخشی از مقاله
چکیده
با توجه به نقش و کارکرد حیاتی پروتئین ها در بدن انسان و وابستگی عمل کرد یک پروتئین به ساختار آن پیش بینی ساختار توالی پروتئین اهمیت فوق العاده ای می یابد. تاکنون روش های مختلفی برای این مسئله از قبیل شبکه های عصبی، روش تکاملی مونت کارلو، روش بهینهسازی ازدحام ذرات، بهینه سازی دسته ی زنبوران و الگوریتم ژنتیک ارائه شده است. همچنین در برخی از این الگوریتم ها از خاصیت آب دوستی و آب گریزی اسیدهای آمینه پروتئین ها برای حل مسئله پیش بینی ساختار پروتئین ها استفاده می کنند.
دانستن ساختار سوم پروتئین بسیار مهم است چراکه مستقیماً به عملکرد آن مرتبط می شود و تمام فعالیت هایی که در سلول انجام می شود بر عهده پروتئین ها است. در این مقاله برای پیش بینی ساختار سوم پروتئین از الگوریتم ژنتیک3 و الگوریتم K-means استفاده شده است. در این روش یک توالی پروتئین به عنوان ورودی به الگوریتم داده می شود که خروجی آن بهترین تا خوردگی با حداقل انرژی کل تعاملات بین اسید آمینه ها می باشد.
-1 مقدمه
یکی از اجزای مهم و اساسی در سلول های موجودات زنده پروتئین ها هستند که انواع مختلفی دارند. هریک از این انواع پروتئین ها فعالیت مخصوص به خود دارند و فعالیت های ضروری موجودات زنده را کنترل می کنند .پروتئین ها از مولکول های پلیمر ناهمگن که از زیر واحدهایی که در یک رشته خطی به هم وصل شده اند، تشکیل یافته اند. زیرواحدهای تشکیل دهنده پروتئین ها اسیدهای آمینه می باشند و در کل 20 نوع اسید آمینه در طبیعت وجود دارد .چگونگی تاخوردن رشته پروتئین و نحوه قرار گرفتن این زیرواحدها، به روش های مختلفی انجام می گیرد که فقط یکی از این تاخوردگی ها باعث می شود پروتئین فعالیت اصلی خود را به درستی انجام دهد و در پایین ترین سطح انرژی قرار بگیرد .نحوه تاخوردگی یک پروتئین به پیش بینی ساختار پروتئین معروف است.
سال های زیادی می باشد که به اهمیت تاخوردگی پروتئین ها پی برده شده است. پروتئین ها در پیچشی که در ساختار سوم به خود می گیرند عمل خاصی را از خود نشان می دهند، بدین معنی که در ساختار سوم عملکرد پروتئین مشخص می شود. عملی که برای یک پروتئین تعیین می گردد با توجه به ساختار طبیعی آن است، که دارای پایین ترین سطح انرژی می باشد
با این وجود، پیچش اشتباه یک پروتئین باعث بروز بیماری های مهمی از جمله آلزایمر، پارکینسون و سرطان می شود . - Dobson 2004 - اگر پروتئینی بطرز ناصحیحی تا بخورد برای سلول های مجاور نیز ایجاد مسمومیت می کند. اگر یک پروتئین تاخورده باز شود، دوباره به همان حالت اصلی خود تا می خورد. همچنین دانش ساختار سوم پروتئین در طراحی داروها نقش مهمی را ایفا می کند
پیش بینی ساختار پروتئین - PSP - 4، یک عمل بسیار مشکل است چراکه پروتئین ها از 20 اسید آمینه مختلف تشکیل شده اند که می تواند یکی از چندین شکل مختلف را به خود بگیرد. با توجه به توالی اسید آمینه پروتئین، مشکل پیدا کردن ساختار سه بعدی پروتئین می باشد، بطوری که انرژی کل تعاملات بین اسید آمینه ها باید حداقل باشد. بنابراین فرآیند پیچش5 پروتئین منجر به ایجاد چنین ساختارهای پیچیده ای و ناشناخته ای می شود
تاکنون رویکردهای مختلفی برای پیش بینی تاخوردن پروتئین ها ارائه شده است. در این روش ها به طور کلی دنباله ای از اسید آمینه ها به عنوان ورودی دریافت می شود و الگوریتم سعی می کند بهترین روش تاخوردن آن را که به ساختار اصلی این پروتئین نزدیک تر است به عنوان خروجی تولید کند. یکی از عواملی که در چگونگی تاخوردن پروتئین ها اثر می گذارد ویژگی های اسیدآمینه های موجود در توالی است.
اسید آمینه های موجود در رشته پروتئین دارای خاصیت آب گریزی یا آب دوستی هستند. اسید آمینه های آب دوست بر خلاف اسید آمینه های آب گریز تمایل زیادی به تماس با مولکول های آب دارند، از این رو به هنگام تا خوردن پروتئین اسید آمینه های آب دوست تمایل دارند که به سمت بیرونی ساختار رفته و نزدیک به مولکول های آب قرار بگیرند. اسید آمینه های آب گریز نیز در مرکز ساختار یک هسته آب گریز تشکیل می دهند.
اهمیت و ضرورت انجام تحقیق بدین علت است که در سایت 6PDB تنها تعداد 7131905 از 7 میلیارد پروتئین موجود تشخیص داده شده است و هنوز تعداد زیادی پروتئین وجود دارد که ساختار آنها مشخص نشده است. تعدادی که در بالا ذکر شد از روش های تجربی 8X-ray و 9NMR بدست آمده است که ساختار را تشخیص داده اند. اما بدلیل پرهزینه بودن و زمان مصرفی بالا، محققان از روش های دیگر برای پیش بینی ساختار سوم پروتئین استفاده کرده اند.
در این مقاله ترکیبی از الگوریتم ژنتیک همراه با الگوریتم جستجوی محلی ممنوعه10 و همچنین از مدل انرژی HP و FCC Lattice برای قرار دادن اتم ها در موقعیت مناسب استفاده شده است. الگوریتم بدین صورت می باشد که جستجوی محلی، الف - یک بار در ابتدا برای تولید جمعیت اولیه برای الگوریتم ژنتیک و ب - دفعات بعدی برای تولید نسل ها مورد استفاده قرار می گیرد. در این مقاله بصورت تجربی نشان داده شده است که عملکرد آنها بهترین جواب را در اختیارشان قرار می دهد.
در این مقاله از الگوریتم ایمنی - IA - 11 که برای حل مشکل پیش بینی ساختار پروتئین استفاده شده است. در این روش پیشنهادی از دو عملگر خاص جهش برای جستجوی موثرتر و همچنین تولید جمعیت مختلف بهره گرفته شده است تا ترکیبی با حداقل انرژی بدست آید. روش AI بر روی شبکه Lattice شناخته شده و مدل انرژی HP آزمایش شده است تا نتایج بهتری را ارائه دهد. نتایج تجربی نشان می دهد که که روش پیشنهادی جواب بهتری را نسبت به الگوریتم های دیگر که با شبکه Lattice کار می کند را ارائه می دهد.
در این مقاله از الگوریتم تکاملی استفاده شده است و روش کار آن به دو بخش تقسیم شده است. در بخش اول با توجه به خواص - آب گریز یا آب دوست بودن - پروتئین توسط الگوریتم ژنتیک جمعیت اولیه تولید می شود. در بخش دوم که بر اساس روش Homology، از روی ساختارهای از قبل تعیین شده در 12 PDB - پایگاه داده پروتئین - ساختار سوم پروتئین پیش بینی می شود. البته PDB کاهش یافته اشت.
همچنین از روش KNN13 برای قرار دادن اتم ها کنار هم در صورتی که کمترین انرژی را داشته باشد استفاده شده است. همچنین روش مورد نظر خود را بر روی 2 پایگاه داده پروتئین دیگر از جمله Rosta and stone Bank و Cuff and Barton Bank نیز آزمایش کرده است . نتایج تجربی نشان داده است روش ارائه شده خیلی بهتر از الگوریتم های دیگر مانند الگوریتم ژنتیک است. همچنین برای کارهای آینده روش بیزین را برای تولید جمعیت اولیه پیشنهاد کرده است.
مساله مورد نظر، پیش بینی ساختار سه بعدی پروتئین از روی توالی اولیه اسید آمینه است - Dill and MacCallum - 2012دانستن. ساختار سوم پروتئین بسیار مهم است چراکه مستقیماً به عملکرد آن مرتبط می باشد و رفتار سلولی و تمام فعالیتهایی که در سلول انجام می شود بر عهده پروتئین ها است. همچنین مطالعه عملکرد پروتئین ها برای ساخت داروهای جدید بهم مرتبط هستند و علم بیوانفورماتیک نقش مهمی در تسریع این دانش دارد. پیش بینی ساختار سوم یکی از قدیمی ترین سوالات است و همچنان بعنوان یکی از بزرگترین چالش ها در علم بیوانفورماتیک می باشد.
در این مقاله تعدادی راه حل های بهینه برای پیش بینی ساختار سوم پروتئین مورد بررسی و مطالعه قرار گرفته است. در این روش ها بطور کلی یک دنباله از اسید آمینه ها به عنوان ورودی دریافت می شود و الگوریتم ها سعی می کنند بهترین روش تاخوردن آن را که به ساختار اصلی این پروتئین نزدیکتر است به عنوان خروجی تولید کنند و معیار انتخاب بهترین تاخوردگی بر پایه کمترین انرژی می باشد.