بخشی از مقاله

چکیده

درختان فیلوژنتیکی روابط خویشاوندی را بین موجودات مختلف به صورت گرافیکی نشان میدهند. روشهای مختلفی برای رسم تبارنماها وجود دارد که برخی از آنها از معیارهای بهینگی برای انتخاب بهترین تبارنما در بین مجموعهی تبارنماهای رسم شده استفاده میکنند. یکی از این معیارهای بهینگی، بیشینهی درست-نمایی است. سه جزء اصلی رهیافت بیشینهی درستنمایی شامل داده، مدلی برای توصیف احتمال مشاهدهی داده و معیار بیشینهی درستنمایی است.

در این روش، تبارنمایی که بیشترین احتمال وقوع را داشته است از میان مجموعهی تبارنماهای رسم شده انتخاب میشود. مزیت بزرگ استفاده از رهیافت بیشینهی درست-نمایی در رسم درختان فیلوژنتیکی، قابل اعتماد بودن نتایجِ حاصل از آن است، اما علیرغم کارایی استفاده از این رهیافت در واکاوی-های فیلوژنتیکی، بزرگترین مشکل استفاده از رهیافت بیشینهی درستنمایی محاسبات پیچیده و وقتگیر آن است. به همین دلیل گاهی به جای بیشینهی درستنمایی از سایر رهیافتها مثل بیشینهی پارسمونی استفاده میشود.

مقدمه

روابط فیلوژنتیکی بین موجودات اغلب با رسم درختان فیلوژنتیکی نشان داده میشود. این درختان با استفاده از هم ردیفسازی دادههای حاصل از توالیسنجی دیاِناِی به دست میآید. تبارنماها را میتوان با استفاده از روشهای دستهبندی 1 و روشهای جستوجو 2رسم کرد. روشهای دستهبندی مراحلی را دنبال کرده و به یک تبارنمای واحد میرسند اما بزرگترین محدودیت این روشها این است که آنها فرضیههای مختلف را در مورد تبارنماهای مختلف ارزیابی نمیکنند زیرا فقط یک تبارنما رسم میکنند.  روشهای جستوجو از معیارهای بهینگی مثل بیشینهی پارسمونی3 و بیشینه- ی درستنمایی4 استفاده کرده، بهترین تبارنما را از بین گروهی از تبارنماها انتخاب میکنند.

در روشهای جستوجو برای هر تبارنما یک رتبه تعیین میشود که در اصل نشان دهندهی رابطهی بین تبارنما و دادههای نوکلئوتیدی است. مهمترین مانع استفاده از روش-های جستوجو این است که عملیات محاسباتی بسیار پیچیدهای دارند. در این روشها باید به دو پرسش پاسخ داد: اول این که برای یک گروه تبارنمای ارائه شده چه چیزی معیار ارزش بهینگی است و دوم این که کدام تبارنما از بین تبارنماهای ارائه شده، حداکثر ارزش معیار بهینگی را دارد. در علوم کشاورزی، رسم درختان فیلوژنتیکی در تشخیص و ردهبندی گونههای بیمارگر گیاهی، گونههای بیمارگر دامی، گونههای مفید خاک، گونههای همزیست و غیره کاربرد دارد.[7]

فرآیند جایگزینی در توالی دیانای

در اولین نوع طبقهبندی، شش حالت مختلف برای جایگزینی در توالی دیانای وجود دارد که عبارتند از جایگزینی منفرد ، جایگزینی چندگانه ، جایگزینی تصادفی، جایگزینی موازی، جایگزینی همگرا و جایگزینی برگشتی - شکل . - 1

جایگزینی منفرد: در این حالت یک نوکلئوتید توسط یک نوکلئوتید دیگر جایگزین میشود. بنابراین یک تغییر سبب مشاهده-ی یک تفاوت میشود.

جایگزینی چندگانه: در این حالت یک نوکلئوتید توسط یک نوکلئوتید دیگر جایگزین میشود سپس همان نوکلئوتید توسط یک نوکلئوتید دیگر جایگزین میشود. بنابراین دو تغییر سبب مشاهدهی یک تفاوت میشود.

جایگزینی تصادفی: در این حالت هر نسل یک جایگزینی متفاوت دارد؛ اما علیرغم ایجاد دو تغییر تنها یک تفاوت بین دو نسل دیده میشود.

جایگزینی موازی: در این حالت در هر یک از نسلها یک جایگزینی رخ داده اما نوکلئوتیدهایی که در هر نسل جایگزین نوکلئوتید قبلی شدهاند با هم مشابه هستند؛ بنابراین علیرغم این که دو تغییر رخ داده اما تفاوتی بین دو نسل دیده نمیشود.

جایگزینی همگرا: در این حالت در یک نسل دو تغییر و در نسل دیگر یک جایگزینی رخ میدهد به طوری که نتیجهی این جایگزینیها ایجاد نوکلئوتیدهای مشابه است؛ بنابراین علیرغم این که سه تغییر رخ داده اما تفاوتی بین دو نسل دیده نمیشود.

جایگزینی برگشتی: در این حالت ابتدا یک نوکلوتید جایگزین یک نوکلئوتید دیگر میشود و سپس این نوکلئوتید جدید نیز با نوکلئوتیدی که مشابه نوکلئوتید اول است جایگزین میشود؛ بنابراین علیرغم این که دو تغییر رخ داده اما تفاوتی بین دو نسل دیده نمی-شود. در دومین نوع طبقهبندی، میتوان جایگزینی در توالی دیانای را به جایگزینی همجنس و جایگزینی ناهمجنس تقسیم کرد.

جایگزینی همجنس: در این حالت یک باز پیورین با یک باز پیورین، و یا یک باز پیریمیدین با یک باز پیریمیدین جایگزین می-شود.

جایگزینی ناهمجنس: در این حالت یک باز پیورین با یک باز پیریمدین جایگزین میشود و بالعکس. در دومین نوع طبقهبندی میتوان نوع جایگزینی در ژنهای رمزگذار پروتئین را با توجه به تأثیری که روی پروتئین میگذارد به جایگزینی همنام و جایگزینی ناهمنام تقسیم کرد.

جایگزینی همنام: جایگزینی نوکلئوتید باعث تغییر اسید آمینه نمیشود.

جایگزینی ناهمنام: جایگزینی نوکلئوتید باعث تغییر اسید آمینه می-شود .[7]

مدلهای جایگزینی در توالی دیانای

بسیاری از پیشرفتهای واکاوی در روش بیشینهی درستنمایی در اثر بهبود مدلهای جایگزینی صورت گرفته است. انتخاب مدل جایگزینی دیانای یکی از اساسیترین مراحل واکاوی بیشینهی درستنمایی است و گرایش بیشتری به استفاده از مدلهای پیچیده نسبت به مدلهای ساده وجود دارد. برخی از سادهترین مدلهای جایگزینی در توالی دیانای عبارتند از مدل [5] Jukes-Cantor، مدل دو پارامتری کیمورا [6]، مدل [1] Felsenstein و مدل .[2] Hesegawa, Kishino & Yano.

مدل :Jukes-Cantor این مدل یکی از اولین و سادهترین مدلهای تکامل توالی پیشنهاد شده است. این مدل فرض میکند که چهار باز نوکلئوتیدی فراوانی یکسانی دارند و احتمال جایگزینی همجنس و ناهمجنس با هم برابر است .[5]

مدل دو پارامتری کیمورا: این مدل فرض میکند که چهار باز نوکلئوتیدی فراوانی یکسانی دارند؛ اما احتمال جایگزینی همجنس و ناهمجنس با هم برابر نیست .[6]

مدل :Felsenstein این مدل فرض میکند که چهار باز نوکلئوتیدی فراوانی متفاوتی دارند و احتمال جایگزینی همجنس و ناهمجنس با هم برابر است .[1]

مدل :Hesegawa, Kishino & Yano این مدل فرض میکند که چهار باز نوکلئوتیدی فراوانی متفاوتی دارند و احتمال جایگزینی همجنس و ناهمجنس با هم برابر نیست .[2] روش بیشینهی درستنمایی توسط فیشر که یک آماردان انگلیسی بود در سال 1922 توصیف شد. سه جزء اصلی روش بیشینهی درستنمایی عبارتند از: -1 داده -2 مدلی برای توصیف احتمال مشاهدهی داده -3 معیار بیشینهی درستنمایی .[3] آنچه به عنوان داده در مباحث فیلوژنتیکی به کار میرود الگوی مکانهای نوکلئوتیدی منفرد است که همردیف شدهاند.

در مثال زیر توالی بخشی از ژن A برای چهار آرایه آورده شده است: Taxon A: ACGCGTTG Taxon B: ACGCGTTG Taxon C: ACGCAATG Taxon D: ACACAGGG تعداد تبارنماهای ریشهدار ممکن برای n توالی از رابطهی زیر به دست میآید:  Rn بنابراین در این مثال که چهار توالی وجود دارد، میتوان پانزده درخت ریشهدار کشید. یکی از این درختها در شکل زیر نشان داده شده است: سه گره داخلی موجود در درخت با شمارههای صفر ، یک و دو نشان داده شدهاند. هر کدام از این گرهها ممکن است چهار حالت داشته باشند A - ، T ، C و - G؛ بنابراین 64 حالت ممکن برای این درخت وجود دارد.

احتمال تغییر بازها نیز در شکل با حروف L1 تا L6 مشخص شده است و L0 احتمال قرار گرفتن یک باز خاص در گره صفر است. احتمال L1 تا L6 به بازهای اختصاص داده شده به گرههای صفر، یک و دو بستگی دارد. در هر درخت احتمال درخت از احتمال قرار گرفتن باز در گره صفر ضرب در احتمال جانشینیهای بعدی به دست میآید .[1] همان طور که در شکل زیر مشاهده میشود در ابتدا برای گره صفر و یک باز T و برای گره دو باز G در نظر گرفته میشود. در درخت فوق L0 از فراوانی T به دست میآید و مقدار تقریبی آن 0/25 است. L2 احتمال تبدیل G به T و L5 احتمال تبدیل G به A است. اگر احتمال جایگزینی همجنس را 2×10-6 و احتمال جایگزینی ناهمجنس را 10-6 در نظر بگیریم، احتمال درخت فوق برابر با 5×10-13 خواهد بود.

دومین حالت آرایش درخت در دادههای فوق در شکل زیر نشان داده شده است: برای محاسبه احتمال این درخت، احتمال تبدیل G به - L1 - T و تبدیل G به - L5 - A بایستی محاسبه شود. به همین ترتیب احتمال 62 آرایش ممکن دیگر هم پیدا شده و حاصل تمام 64 احتمال با هم جمع میشود. این محاسبات برای دیگر ستونها در توالی همردیفسازی شده تکرار میشود. در نهایت احتمال هر درخت معین مجموع احتمالاتی است که برای هر ستون محاسبه شده است. هر کدام از پانزده درخت ممکن برای چهار توالی به همین روش مورد ارزیابی قرار میگیرند و درختی که بالاترین احتمال را دارد شناسایی می شود .[1]

آزمون نسبت احتمال در فیلوژنتیک

تمام روشهای فیلوژنتیک دربارهی فرایندهای تکامل فرضهایی دارند مثل فرض مساوی بودن احتمال جایگزینی همجنس و ناهمجنس و یا داشتن یک جد مشترک. یکی از موضوعات بحثانگیز نقش این فرضها در واکاوی فیلوژنتیکی است. قدرت نسبی دو فرض رقیب را میتوان با نسبت احتمال آنها به دست آورد.  اگر L0 احتمال وقوع دادهها تحت فرض صفر و L1 احتمال وقوع همان داده-ها تحت فرض یک باشد، نسبت احتمال با A نشان داده شده و عبارت است از حداکثر احتمالی که تحت فرض صفر بیان میشود بخش بر حداکثر احتمالی که تحت فرض صفر بیان میشود.

در این حالت اگر A بزرگتر از یک باشد فرض دوم رد میشود. اگر مدلها زیر مجموعهی یکدیگر باشند - یعنی فرض صفر نوع خاصی از فرض یک باشد - ، -2log A دارای توزیع مربع کای - 2 - با درجهی آزادی q است. زمانی که مقدار مشاهدهشدهی 2 در جدول از -2log A محاسبه شده بزرگتر باشد آزمون معنیدار است و فرض صفر پذیرفته میشود در غیر این صورت فرض یک پذیرفته خواهد شد. به طور معمول معنیداری در سطح 5 درصد مورد بررسی قرار میگیرد.

مزایا و معایب روش حداکثر احتمال

روش بیشینه درستنمایی به یک مدل تکاملی نیاز دارد که این امر میتواند هم به عنوان نقطهی ضعف و هم به عنوان مزیت آن در نظر گرفته شود. مزیت آن در این است که مدل، اطلاعاتی را دربارهی فرضیات به کار رفته ارائه میکند؛ اما وابستگی به مدل این سؤال را ایجاد میکند که آیا استفاده از آن درست بوده است؟ و این که مقدار فراسنجهها مثل نسبت جایگزینی همجنس به ناهمجنس چقدر باید باشد؟

در روش بیشینهی درستنمایی لازم است که علاوه بر بهترین تبارنما بهترین مدل را نیز پیدا کنیم که غالباً به دلیل مشکلات محاسباتی پیدا کردن یک جواب با اشکال مواجه میشود. مشکل دیگر این روش محاسبات پیچیده و وقتگیر آن است به ویژه هنگامی که تعداد توالیها زیاد باشد در این حالت تعداد درختهای ممکن آنقدر زیاد است که جستوجوی کامل امکان پذیر نیست - به عنوان مثال تنها برای 10 توالی میتوان بیش از 34 میلیون درخت ریشهدار کشید - همچنین ملزومات رایانهای این روش بسیار گران است. به همین دلیل گاهی به جای روش بیشینهی درستنمایی از روش بیشینهی پارسمونی استفاده میشود اگرچه نتایج استفاده از این دو روش همیشه با هم سازگار نیست.

در متن اصلی مقاله به هم ریختگی وجود ندارد. برای مطالعه بیشتر مقاله آن را خریداری کنید