شبکه های بیزی، خوشه بندی، تنظیمات ژنی، رگرسیون

ارائه شده با شبکه های استنتاج شده به وسیله الگوریتم های قبلی بیشتر می شود. همچنین زمانی که از این الگوریتم برای یاد گیری شبکه های با ساختار تصادفی استفاده می شود، الگوریتم ارائه شده قادر است تا شبکه هایی را بازیابی کند که از لحاظ مطابقت با شبکه واقعی معادل شبکه های استنتاج شده به وسیله روش های قبلی است.

ضرورت انجـام طرح

شبکه های تنظیم کننده ژنتیکی نقش مهم و عمده ای را در تمام فرآیندهای حیاتی از جمله تفکیک سلولی، متابولیسم، چرخه سلولی و هدایت سیگنال ایفا می کنند. با فهمیدن دینامیک این گونه شبکه ها، قادر خواهیم بود تا به میزان زیادی مکانیزم بیماری هایی را که از به هم خوردن نظم این فرآیندهای سلولی بوجود می آیند دریابیم. همچنین پیش بینی دقیق رفتار شبکه های تنظیم کننده ژنتیکی سرعت انجام پروژه های بیوتکنولوژیکی را افزایش می بخشد. چون این گونه پیش بینی ها قطعاً از آزمایش های واقعی در محیط آزمایشگاه سریع تر و ارزان تر هستند.

نگاه کلی به فصل های رساله

در فصل دوم از این رساله، ابتدا تعریف دقیق تری از شبکه های تنظیم کننده ژنی و نقش آن ها در فرآیندهای سلولی ارائه می شود. سپس، روش های موجود برای استنتاج شبکه های تنظیمات ژنی معرفی خواهند شد و ویژگی های هر یک بررسی می شوند.
در فصل سوم، تئوری های مربوط به شبکه های بیزین دینامیک و گراف های scale-free مرور می شوند. در ادامه این بخش، الگوریتم پیشنهادی برای یادگیری شبکه های بیزین دینامیک با ساختار scale-free ارائه می گردد.
در فصل چهارم، آزمایش های انجام شده و نتایج بدست آمده از آن ها گزارش داده می شوند. در این بخش، توانایی الگوریتم پیشنهادی برای استنتاج کردن شبکه هایی با ساختار scale-free و یا با ساختار تصادفی با الگوریتم های موجود برای یادگیری شبکه مقایسه می شود.
در پایان، خلاصه ای از دست آوردهایی تحقیق ارائه می گردد.

فصل دوم

پیشینه تحقیق

2-1- مقدمه

دراین بخش ابتدا مفاهیم زیستی مربوط به این تحقیق مرور می شود. این مفاهیم شامل تعاریف و توضیحات مربوط به ژن، بیان ژن و شبکه های تنظیمات ژنی است. در قسمت بعدی این بخش روش های عمده برای استنتاج شبکه های تنظیم کننده ژنی معرفی شده، به اختصار توضیح داده می شوند.

مقدمات زیستی

در زیر به بیان مفاهیم مربوط به ژن، بیان ژن و شبکه های تنظیمات ژنی پرداخته می شود.

2-2-1- ژن12
ژن قسمتی از DNA است که یک خصوصیت ویژه موروثی را کد می کند. دنباله های دیگر موجود در DNA اهداف ساختاری دارند و یا نقش تنظیم کننده را برای استفاده از اطلاعات ژن ها ایفا می کنند. طول یک ژن بر اساس تعداد بازهای موجود در آن بیان می شود و می تواند از چند صد تا چند صد هزار باز را شامل شود؛ اما به طور متوسط یک ژن شامل صد هزار تا صد و پنجاه هزار باز است.
یک ژن می تواند بیش از یک فرم داشته باشد که هر کدام یک آلل13 خوانده می شوند. آلل های مختلف می توانند خصوصیات فنوتیپیکی مختلفی را ایجاد کنند. برای مثال آلل های مختلف ژن مرتبط با رنگ چشم می توانند موجب ایجاد چشم با رنگ سبز یا قهوه ای شوند. با این وجود، بسیاری از اختلافات ژنی تأثیر قابل مشاهده ای ندارند.
ژن ها دستور العمل ساخت پروتئین یا RNA را کد می کنند. پروتئین ها مهم ترین واحد کاری سلول ها هستند و در تقریباً در تمام فرآیندهای سلولی نقش اساسی ایفا می کنند. گروهی از پروتئین ها ساختاری هستند و مسئولیت شکل دادن به سلول ها و بافت ها را بر عهده دارند. گروه دیگر پروتئین ها آنزیم هستند و باعث سرعت بخشیدن به واکنش های درون سلول می شوند. برخی از پروتئین ها نقش جا به جا کردن مولکول های دیگر را برعهده دارند و برخی دیگر مسئول ارسال و دریافت سیگنال هستند. یکی دیگر از نقش های مهم پروتئین ها تنظیم فرآیندهای درون سلول است.

2-2-2- بیان ژن14
در تمامی ارگانیسم ها دو مرحله اصلی برای ساخت پروتئین از روی ژنی که آن پروتئین را کد می کند وجود دارد. در مرحله اول، طی فرآیندی به نام نسخه برداری15، از روی DNA حاوی ژن مورد نظر RNA پیام رسان16 (mRNA) تولید می شود. در مرحله دوم که ترجمه17 نام دارد، از روی mRNA پروتئین ساخته می شود. فرآیندی که طی آن یک مولکول عملیاتی زیستی از نوع RNA یا پروتئین تولید می شود بیان ژن نام دارد. مولکول تولید شده محصول ژن18 خوانده می شود.

2-2-3- شبکه های تنظیم کننده ژنی
یک شبکه تنظیمات ژنی مجموعه ای است از قسمت هایی از DNA که به طور غیر مستقیم، از طریق محصول ژنی که می تواند پروتئین یا RNA باشد، با یکدیگر و مواد دیگر درون سلول در تعاملند و در نتیجه این تعامل نرخ تولید mRNA از روی ژن ها را کنترل می کند. قبلاً اشاره شد که پروتئین ها نقش های مختلف و اساسی در سلول ایفا می کنند. بعضی از پروتئین ها وظیفه فعال یا غیر فعال کردن ژن ها را بر عهده دارند. به این گونه پروتئین ها فاکتورهای رونویسی19 گفته می شود و نقش اصلی را در شبکه های تنظیم ژنی بازی می کنند.
در پیش هسته ای ها، شبکه های تنظیمات به محیط خارجی سلول واکنش نشان می دهند و بدین وسیله شرایط را برای زنده ماندن سلول در آن محیط فراهم می سازند. در ارگانیسم های چند سلولی مانند حیوانات همین شبکه ها شکل بدن را کنترل می کنند. در فرآیند تقسیم سلولی، ژنوم سلول های فرزند به طور کامل با ژنوم سلول مولد یکی است اما ژن هایی که در هر یک از این سلول ها ف
عالند می توانند با هم متفاوت باشند.
یکی از ویژگی های مهم حیوانات چند سلولی استفاده از گرادیان های مورفوژنی است که یک سیستم مکان یابی را بوجود می آورند که به سلول اطلاع می دهد که در چه نقطه ای از بدن قرار گرفته است و متعاقباً چه ویژگی هایی باید داشته باشد.
ژنی که در یک سلول فعال می شود می تواند پروتئینی تولید کند که از سلول خارج شده و وارد سلول های مجاور شود و زمانی که میزان آن در سلول مقصد به میزان مشخصی بیشتر شد ژن های خاصی را در آن سلول فعال سازد. در این مرحله ممکن است سلول مقصد در اثر فعال شدن ژن های جدید محصولی تولید کند که بر روی سلول اولیه تأثیر گذارد.
در فواصل طولانی تر مورفوژن ها می توانند از فرآیند انتقال سیگنال استفاده کنند. چنین سیگنال هایی ایجاد یک نقشه از بدن را کنترل می کنند. همچنین از طریق فرآیندهای بازخورد نگه داری یک بدن بالغ را کنترل می کنند. اختلال چنین بازخوردهایی که به علت جهش های ژنتیکی بوجود می آیند می تواند باعث ایجاد سرطان شود.
همچنین به موازات این فرآیندها شبکه تنظیمات می تواند ژن هایی را فعال سازد که پروتئین های ساختاری تولید می کنند و باعث می شوند تا سلول خصوصیات فیزیکی مورد نیاز را پیدا کند.
یک شبکه تنظیمات ژنی می تواند چنین توصیف شود:
ژن ها می توانند به عنوان گره های شبکه دیده شوند که ورودی آن ها پروتئین ها (فاکتورهای نسخه برداری) و خروجی آن ها میزان بیان ژن است. خود گره ها می توانند به صورت توابعی تفسیر شوند که با انجام عملیات بر روی ورودی ها خروجی را تولید می کنند. انجام این فرآیند عملکرد مولکولی را مشخص می کند.
در عمل، معمولاً تمامی گره ها ژن در نظر گرفته می شوند و ورودی هر ژن نیز از ژن های دیگری می آید که به طور مستقیم، از طریق محصولات پروتئینی، بر فعالیت آن ژن تاثیر می گذارند.

مطلب مشابه :  منبع پایان نامه ارشد دربارهگیاه، گیاهان، ترکیبات، دارای

روش های یاد گیری شبکه های تنظیم کننده ژنی

برای استنتاج شبکه های تنظیم کننده ژنی با استفاده از داده های بیان ژن از روش های متعددی استفاده شده است. این روش ها در سطحی که ارتباطات بین ژن ها را مدل می کنند و همچنین در قابلیت مدل کردن فرآیند های طبیعی و واقعی که در شبکه های تنظیم کننده ژنی روی می دهند با هم تفاوت دارند. در زیر به اختصار چندین روش عمده که برای استنتاج شبکه های تنظیم کننده ژنی ارائه شده اند معرفی می شود.

2-3-1- روش های مبتنی بر خوشه بندی
خوشه بندی روشی است که در آن ژن ها بر اساس تشابه بیان ژن گروه بندی می شوند. بدین معنا که اگر بیان دو ژن به صورت تقریبی با هم زیاد یا کم می شوند، این دو ژن در یک گروه قرار می گیرند. در برخی از روش های خوشه بندی تعداد گره ها به عنوان پارامتر ورودی باید به الگوریتم داده شود. در روش های نوین تر تعداد خوشه ها بر اساس خود داده ها بدست می آیند.
استفاده از روش های خوشه بندی برای استنتاج شبکه های تنظیم کننده ژنی در [17] توضیح داده شده است. در روش ارائه شده از خوشه بندی سلسله مراتبی20 برای بدست آوردن اطلاعات در مورد ژن ها استفاده شده است.
در [18] برای کاهش تعداد ژن های مسئله از 18432 ژن به 6 گروه ژنی استفاده شده است و سپس تلاش شده است تا ارتباط بین ژن ها در این 6 گروه مشخص شود.
در [19] روش های سنتی خوشه بندی ارتقاء یافته اند. در روش ارائه شده در این تحقیق هر ژن می تواند متعلق به چندین خوشه باشد.
ایراد عمده روش مبتنی بر خوشه بندی این است که این روش ارتباط بین ژن ها را در سطح خیلی بالایی مشخص می کند. در واقع، استفاده از این روش ارتباط بین گروه های مختلف ژنی، نه ارتباط بین خود ژن ها، را مشخص می کند. ایراد دیگر این گونه روش ها این است که در برخی از آن ها باید تعداد خوشه ها از قبل مشخص گردند. همچنین پس از اینکه گروه ها مشخص شدند، راه مطمئنی برای ارزیابی دقت و صحت گروه ها وجود ندارد.

2-3-2- روش های مبتنی بر رگرسیون
تکنیک های رگرسیون روش های آماری هستند که برای فهمیدن روابط بین متغیرهای مستقل و وابسته استفاده می شوند. رگرسیون معمولاً شامل حل کردن و یا تخمین بهترین حل برای مجموعه ای از معادلات است که رفتار متغیرها را مشخص می کنند.
در [20] مسئله استنتاج شبکه های تنظیم کننده ژنی به دو قسمت تقسیم شده است: در مرحله اول تعدادی راه حل برای مسئله به وسیله singular value decomposition بوجود می آیند. سپس از رگرسیون استفاده می شود تا بهترین شبکه از میان راه حل ها انتخاب شود. در تحقیق ارائه شده در [21] از روش رگرسیون بیزین برای انتخاب شبکه با تعداد ارتباطات محدود استفاده شده است.
2-3-3- روش های مبتنی بر اطلاعات متقابل21
اطلاعات متقابل روشی آماری است که میزان وابستگی بین دو متغیر را اندازه گیری می کند. اطلاعات متقابل بر اساس تفاضل بین مجموعه آنتروپی دو متغیر و آنتروپی شرطی یک متغیر بر حسب متغیر دیگر تعریف می شود. آنتروپی می تواند برای متغیر های گسسته و پیوسته تعریف شود [22].
از روش های مبتنی بر اطلاعات متقابل برای استنتاج شبکه های تنظیم کننده ژنی در [22] استفاده شده است.

مطلب مشابه :  منبع مقاله با موضوعسیگنال، نمایش، #include، افزایش

2-3-4- روش های تابعی22
در روش های تابعی سعی بر این است که تغییرات در بیان هر ژن بر اساس تابعی (معمولاً بولین) از تغییرات در ژن های دیگر مدل شود. برای این منظور، معمولاً از شبکه های بولین استفاده می شود.
الگوریتم REVEAL برای یادگیری شبکه های بولین از شناخته شده ترین روش ها برای استنتاج شبکه های تنظیمات ژنی از روی داده های بیان ژن است [23]. در این روش
بر اساس ارتباط متقابل بین بیان ژن ها برای رفتار هر ژن تابع بولینی ایجاد می شود . از این توابع برای تشخیص ژن هایی که بر روی رفتار ژن مورد نظر تاثیر دارند استفاده می شود. اثبات ریاضی این مدل و همچنین آنالیز پیچیدگی محاسباتی برای آن در تحقیقات بعدی ارائه گردید [24]. به مدل های بعدی که در این زمینه ارائه شدند این قابلیت افزوده شد که بتوانند ارتباطات بین متغیر هایی با بیش از دو مقدار را مدل کنند [25].

2-3-5- روش های مبتنی بر تئوری سیستم
در حالی که اغلب روش های استنتاج شبکه از روش پایین به بالا برای ساختن شبکه استفاده می کنند، روش های مبتنی بر تئوری سیستم از روش مخالف، یعنی بالا به پایین، استفاده می کنند. در این گونه روش ها، شبکه به ماژول های مختلف دسته بندی می شود و تلاش می شود تا ارتباطات بین این ماژول های سطح بالا مشخص شود. برای ماژوله کردن شبکه می توان از دانش قبلی در مورد شبکه استفاده کرد و یا اینکه این کار را از طریق روش های خوشه بندی انجام داد [26].

2-3-6- روش های بیزین
روش های بیزین روش هایی هستند که بر احتمال همبستگی سطوح بیان برای ژن های مختلف تکیه دارند. برای ساختن شبکه در این روش ها، هر کدام از ژن ها یک متغیر تصادفی در نظر گرفته می شود. سپس سعی می شود تا توزیع احتمالی که رفتار این متغیرها را توصیف می کند بدست آید. وابستگی های موجود در بهترین توریع ارتباط بین ژن ها را مشخص می کند.
ابزار مورد استفاده در روش های بیزین، شبکه های بیزین هستند. از شبکه های بیزین برای اولین بار در تحقیق انجام شده به وسیله Friedman برای بازیابی شبکه های تنظیمات ژنی استفاده شد [6]. در [27] هر کدام از یال های شبکه بیزین عنوان گذاری شدند تا نوع ارتباط بین ژن ها مشخص شود. ارتباط یک ژن با ژن دیگر می تواند باعث افزایش و یا کاهش فعالیت ژن تاثیر پذیرنده شود.
یکی از محدودیت های شبکه های بیزین این است که امکان تعیین قطعی جهت ارتباط بین دو ژن حین یادگیری شبکه وجود ندارد. مشکل دیگر این است که چون روش های بیزین روش های آماری هستند و میزان داده های آموزشی که برای یاد گیری شبکه های تنظیم کننده ژنی استفاده می شوند کم است، شبکه های استنتاج شده توسط این روش ها به ناهنجاری های داده های آموزشی حساس هستند. مشکل دیگر این است که امکان مدل کردن ارتباط های حلقه ای (مانند چرخه های بازخورد در شبکه های تنظیم کننده ژنی) در شبکه های بیزین وجود ندارد.
برای رفع برخی از مشکلات مطرح شده در مورد شبکه های بیزین، در تحقیقات بعدی از شبکه های بیزین دینامیک استفاده شد [28،29]. این شبکه ها می توانند برای استنتاج شبکه های تنظیم کننده ژن از روی داده های سری زمانی بیان ژن مورد استفاده قرار گیرند. در این شبکه ها، جهت هر یال مشخص و قطعی است. همچنین شبکه های بیزین دینامیک قابلیت مدل کردن ارتباطات حلقه ای را دارند.
در [28]، شبکه های بیزین دینامیکی را برای مدل کردن واکنش هایی که به علت تغییرات فیزیولوژیکی درEscherichia coli رخ می دهند تولید کردند. در این روش از دانش بیولوژی برای گروه بندی ژن هایی که با یکدیگر رونویسی می شوند و در نتیجه co-regulated هستند استفاده شده بود. این عمل باعث کاهش تعداد پارامترها

Leave a Comment