بخشی از مقاله
چکیده
امروزه با وجود حجم انبوهی از داده هاي بیانی ژن ها مربوط به موجودات مختلف استفاده از روش هاي محاسباتی و رایانه اي براي فهم عملکرد ژن ها مورد نیاز است. می توان از مجموعه داده هاي بیانی به منظور دریافت اطلاعات مفید مانند الگوي رفتاري ژن ها در ارتباط با شرایط محیطی و همچنین برهم کنش هاي بین آن ها استفاده کرد. در این پروژه به منظور بررسی الگوي بیان ژن هاي اسید فسفاتاز در طول زمان رشد در حضور یا عدم حضور فسفات در محیط کشت از توالی هاي یگانه در واکنش RT-PCR نیمه کمی استفاده شد. سپس خوشهبندي دادههاي بیانی با استفاده ازالگوریتم انجام شد و ژنها بر اساس شباهت در الگوي رفتاري خوشه بندي گردیدند. این آزمایش ها و تجزیه و تحلیل داده هاي حاصل نشان داد بر اساس الگوي زمانی بیانی ژن هاي اسید فسفاتاز در ریشه و اندام هوایی به چندین گروه قابل تقسیم هستند. همچنین، این بررسی نشان داد که تنها معدودي از ژن ها رفتارهاي بیانی مشابهی در ریشه و اندام هوایی دارند و یا در خوشه هاي بیانی مشابهی قرار می گیرند.
کلمات کلیدي: داده هاي بیانی، خوشه بندي ژن ها، الگوریتم FCM، اسید فسفاتازها، آرابیدوپسیس
مقدمه
بررسی الگوي بیان ژن ها ابزاري مهم براي بررسی نحوه پاسخ موجود زنده به شرایط محیطی در سطح ژنوم است. گیاهان داراي توانایی تغییر آرام یا سریع در تنظیم بیان ژن هاي خویش در پاسخ به تغییر شرایط محیطی هستند. در بیشتر موارد تغییر در الگوي بیان ژن ها منتهی به سازگاري گیاه در برابر شرایط محیطی نامناسب و تحمل شرایط دشوار می گردد. یعنی اگر گیاه قادر به سازش با شرایط جدید نباشد به عنوان گیاه حساس نسبت به تغییر شرایط در نظر گرفته می شود.
در سال هاي اخیر استفاده از روشهاي محاسباتی و رایانهاي به عنوان راهکاري مهم و تاثیرگذار در زیست شناسی نوین و ژنتیک مطرح شده اند. الگوي بیان ژن در هر دو مورد قادر به تبیین رفتار گیاه نسبت به شرایط محیطی است . - 1 - براي تجزیه و تحلیل داده ها از طریق خوشه بندي از روشهاي متفاوتی استفاده میگردد که ناشی از وجود دیدگاههاي متفاوت است. نقطه اشتراك در روشهاي خوشه بندي آن است که دادههایی که ویژگی مشابهتري دارند در یک خوشه قرار میگیرند. به طور کلی، براي انجام خوشه بندي یک مجموعه داده مراحل انتخاب ویژگی، تعریف معیار شباهت و یا اختلاف، معیار خوشه بندي، مشخص نمودن تعداد خوشه هاو انتخاب الگوریتم مناسب براي خوشه بندي بایستی انجام شود. Eisen و همکاران - 1998 - به بررسی مجموعهي ژنی از مخمر Saccharomyces cerevisiae پرداختند و با تعریف یک معیار شباهت ساده مبتنی بر همبستگیهاي دادههاي بیانی ژن، خوشه بندي را به صورت سلسله مراتبی انجام دادند وژنهایی را که در بازههاي زمانی بیشتري داراي بیان مشابه میباشند را در یک دسته قرار دادند . - 2 - در یک مطالعه Ramoni و همکاران - 2002 - ، خوشه بندي 8613 ژن انسانی را انجام دادند . - 3 -
در این تحقیق با روش آماري مبتنی بر بیزین و استفاده از دادههاي سري زمانی ریزآرایه، دینامیک رفتار ژنها مورد مطالعه قرار گرفته است و ژنهاي داراي الگوي رفتاري شبیهتر در یک خوشه قرار گرفته اند. Cai و همکاران - 2006 - با استفاده از روش SVM و با توجه به پروفایل بیان ژنی نمونههاي تحت بررسی ژن هاي مسئول تومورزایی پروستات و پانکراس را دسته بندي نمودند . - 4 - در این مطالعه برخی از ژنهاي تاثیر گذار بر سرطانهاي فوق کشف شدند. همچنین Islam و همکاران - 2006 - با بررسی تومورهاي مربوط به دستگاه عصبی مرکزي توانستند نشانگرهاي مربوط به وجود و یا عدم تومور را از روي داده هاي بیان ژنی ریز آرایه بدست آورند Beal . - 5 - و همکاران - 2006 - دادههاي سري زمانی بدست آمده از ریزآرایه را با استفاده از روش مبتنی بر مدل مخفی مارکوف یا - Hidden Markov Model - HMM خوشه بندي نمودند و ژنهاي داراي الگوي رفتاري مشابه را در خوشههاي مشابه قرار دادند . - 6 - در این پروژه روشی ارائه شده است تا با بهره گیري از الگوریتم خوشه بنديFuzzy C means یا FCM بتوانیم ژنهاي اسید فسفاتاز گیاه آرابیدوپسیس را که داراي الگوي مشابه رفتاري در پاسخ به تنش فسفات را خوشه بندي نمائیم. به این منظور نرم افزاري به نام طراحی شد که با استفاده از این الگوریتم دادههاي بیانی ژن را خوشه بندي کند. - 7 -
مواد و روش ها
کشت گیاه و بررسی بیان ژن ها در طول زمان در محیط کشت داراي فسفات و بدون فسفات: براي گشت گیاهان در بررسی هاي سري زمانی از روش Malboobi و همکاران 1997 استفاده شد . - 8 - براي نمونه برداري زمان بندي شده، گیاهان 14 روزه رشد یافته در محیط کشت MS مایع با نصف مقادیر درشت مغذي ها به محیط کشت بدون فسفات یا داراي 5 میلی مولار فسفات انتقال یافتند و پس از مدت 3، 7، 14 و 21 روز از تیمار بافت هاي ریشه و اندام هوایی گیاهان تحت تیمار برداشت شدند. یافتن توالی هاي یگانه هر ژن و طراحی آغازگرهاي مناسب: توالی ژن هاي اسید فسفاتاز گیاه آرابیدوپسیس از طریق پایگاه - http://www.ncbi.nlm.nih.gov/projects/mapview - Map Viewer بدست آمد. جهت مشخص کردن توالیهاي یگانه ژن هاي اسید فسفاتاز گیاه آرابیدوپسیس از نرم افزاري استفاده شد که در طول انجام این پروژه طراحی شده بود. توالی هاي یگانه بدست آمده، براي طراحی آغازگرهاي اختصاصی استفاده شدند. براي ژن هاي فسفاتاز با بیش از محصول پیرایشی آغازگرها طوري طراحی شدند که رونوشتهاي مختلف در واکنش PCR از یکدیگر قابل تفکیک باشند.
بررسی بیان ژن ها با استفاده از RT-PCR نیمه کمی: پس از استخراج RNA و سنتز cDNA، الگوي بیان ژن هاي اسید فسفاتاز در طول زمان در حضور و عدم حضور فسفات با استفاده از آغازگرهاي مربوط به منطقه منحصر به فرد هر ژن و روش PCR انجام شد. مقدار cDNA در تمامی واکنش هاي PCR بر اساس شدت باند ژن آلفا توبولین هم تراز گردید. پس از انجام واکنش PCR و تفکیک باندهاي نمونه ها بر روي ژل آگارز، ژل ها با استفاده از دستگاه تایفون - Pharmacia - اسکن شدند. تصاویر حاصل پس از ذخیره شدن توسط نرم افزارهاي TotalLab و نیز ImageQuant مورد بررسی قرار گرفت و شدت بیان هر ژن نسبت به بیان ژن آلفا توبولین بدست آمد.
خوشه بندي عملکردي ژن ها بر اساس الگوي بیان ژن هاي فسفاتاز: به منظور خوشه بندي عملکردي - Functional clustering - ژنهاي اسید فسفاتاز مورد مطالعه گیاه آرابیدوپسیس تالیانا از یک الگوریتم دو مرحلهاي جدید استفاده گردید که بر اساس الگوریتمهاي ویژه گروهبندي K-means و FCM کار می کنند. با استفاده از این روش ژن ها به عنوان نمونه - Sample - و میزان بیان آن ها در طول زمان یا در تیمارهاي مختلف به عنوان ویژگی - Features - در نظر گرفته شد. خروجی مرحله 1 به صورت الگویی ارائه می گردد که این الگو رفتار ژن مورد مطالعه در شرایط آزمایش را به نمایش می گذارد. در مرحله 2 الگوي رفتاري هر ژن به عنوان یک ویژگی جدید براي بررسی ارتباط عملکردي ژن ها مورد استفاده قرار می گیرد. نحوه ارزیابی ارتباطات بین ژنی با استفاده از روش همبستگی پیرسون - Pearson correlation method - محاسبه می گردد.
نتایج و بحث
نظر به اهمیت اسید فسفاتازها در حفظ هموستازي فسفات در گیاه، براي اولین بار از خوشه بندي عملکردي داده هاي بیانی این گروه از ژن ها در طول زمان و در پاسخ به فسفات محیط استفاده شد. به منظور انجام عملیات خوشه بندي ژنها بر اساس الگوي رونویسی، پس از وارد کردن داده ها در نرم افزار GeneExp 1.0 ابتدا تخمینی از بهترین تعداد خوشهها با محاسبه حداقل پراکندگی درون خوشهاي و حداکثر پراکندگی خارج خوشهاي بدست می آید.
ژنهاي اسید فسفاتاز در تیمار بدون فسفات در ریشه و اندام هوایی بر اساس الگوي بیان به ترتیب در 14 و 10 خوشه گروه بندي می گردند - شکل هاي 1 و . - 2 حال آن که در محیط کشت داراي فسفات 5 میلی مولار در طول زمان ژن ها در ریشه در 12 خوشه و در اندام هوایی در 14 خوشه قرار می گیرند - شکل 3 و . - 4 بررسی کلی الگوي رونویسی ژن هاي اسید فسفاتاز در تیمار بدون فسفات در زمان هاي 0، 3، 7، 14 و 21 روز بافت ریشه نشان داد که بر اساس زمان بیان ژن هاي مورد نظر به 4 گروه قابل تقسیم هستند در حالی که در اندام هوایی ژن ها بر اساس الگوي بیان به 6 گروه قابل تقسیم می باشند.
این بررسی نشان می دهد گرچه در تیمارها و بافت هاي مختلف الگوهاي مشابه بیان زنی مشاهده می شود، لکن از نظر کلی ژنها در گروه هاي یکسانی قرار نمی گیرند. استفاده از ارزشهاي بیانی در تیمارهاي بدون فسفات و حضور فسفات در ریشه و ساقه نشان داد که %5/8 از ژن ها در 4 تیمار مورد بررسی داراي الگوي رفتاري مشابهی میباشند و % 22 از مجموع رونوشتهاي مورد بررسی حداقل در 3 تیمار مورد بررسی داراي الگوي رفتاري مشابهی میباشند - داده ها نشان داده نشده است - .