بیزین دینامیک، شبکه های بیزی، تنظیمات ژنی، تئوری اطلاعات

دانلود پایان نامه

ی مسئله و افزایش کارایی این مدل شد. این متد بر روی 169 ژن در 9 پترن از E.Coli آزمایش شد و توانست correlation های موجود در 4 پترن از 9 پترن را به درستی شناسایی کند.
[7] شبکه بیزین دینامیکی را ارائه کرد که شامل متغیرهای پنهان بود تا بدین طریق مشکل نویزهای بیولوژیکی و نویزهای اندازه گیری را حل کند. این مدل از یکی از انواع مدل های رگرسیون خطی و نویز با توزیع نرمال استفاده می کند. روش قید شده بر روی شبکه ترمیم DNA در E.Coli با تمرکز بر روی 8 ژن اصلی آزمایش شد و نتایج بدست آمده نشان داد که این مدل قادر است تا مدارهای اصلی تنظیمات ژنی را استخراج کند.
در [30] از شبکه بیزین دینامیک برای مدل کردن زیر شبکه ای از 45 ژن در سیستم چرخه سلولی Yeast استفاده شد. با مقایسه شبکه بدست آمده در این آزمایش و شبکه ای که قبلاً در پایگاه داده KEGG موجود بود، نویسندگان این تحقیق نتیجه گرفتند که شبکه بیزین دینامیک تعداد زیادی از یال های موجود در شبکه را به درستی استخراج می کند.
برای آزمایش کردن کاربرد شبکه های بیزین دینامیک در کار با داده های بیان ژن و اندازه گیری دقت آن در [10] آزمایشی مبتنی بر شبیه سازی انجام شد. بر خلاف کار با داده های بیولوژیکی واقعی، هنگام کار با داده های شبیه سازی شده ساختار واقعی شبکه تولید کننده داده ها مشخص است و مقایسه کامل شبکه بدست آمده با شبکه اصلی به سادگی امکان پذیر می باشد. نتایج بدست آمده نشان داد که در حالی که ساختار کلی شبکه بدست آمده مفید نیست، ساختار های محلی تا اندازه ای بازیابی می شوند.
در [8] از شبکه بیزین دینامیک با تأخیرهای زمانی مختلف استفاده شده است. در این روش از شیفت دادن سری های زمانی به اندازه مشخص پیش بینی شده استفاده شد و این روش بر روی داده های چرخه سلولی Yeast به کار گرفته شد.
در [31] از اطلاعات متقابل بین پروفایل های بیان دو ژن و تست χ^2 برای تشخیص درجه اهمیت اطلاعات متقابل برای تصمیم گیری در مورد ساختار شبکه استفاده شده است.
در [32] از نگرشی مشابه اطلاعات متقابل استفاده شد؛ اما در این تحقیق اصل کوتاه ترین طول توصیف برای بدست آوردن آستانه اهمیت و حذف یال ها اضافی بکار گرفته شد. با این حال به علت استفاده کردن از قالب های کد کردن مختلف این روش شبکه های غیر یکتایی را تولید می کند.
[33] بر این مشکل با استفاده از اندازه گیری طول توصیف بر اساس یک مدل کلی غلبه یافت. مدل کلی در این تحقیق شباهت بیشینه نرمال شده می باشد.

فصل سوم

روش پیشنهادی

3-1- مقدمه

همان گونه که در فصل قبل عنوان شد، شبکه های بیزین دینامیک از عمده ترین مدل هایی هستند که برای استنتاج شبکه های تنظیمات ژنی استفاده می شوند. از مزایای شبکه های بیزین دینامیک می توان به توانایی مدل کردن ماهیت تصادفی رفتار شبکه های تنظیمات ژنی، توانایی مدل کردن حلقه های بازخورد و قابلیت استفاده از منابع اطلاعاتی مختلف برای استنتاج شبکه اشاره کرد.
یکی از منابع اطلاعاتی مهم که برای استنتاج دقیق تر شبکه های تنظیمات ژنی می تواند مورد استفاده قرار گیرد ساختار کلی این گونه شبکه ها است. ویژگی اصلی که در این تحقیق مورد استفاده قرار می گیرد این است که درجه خروجی گره ها (ژن ها) در شبکه های تنظیمات ژنی از توزیع سری-توانی پیروی می کند. این بدین معنی است که احتمال اینکه فعالیت یک ژن بر روی فعالیت K ژن دیگر اثر داشته باشد را می توان با توزیع P(k)∝k^(-α) تخمین زد. گراف هایی که این خاصیت را دارند، گراف های scale-free خوانده می شوند.
در این تحقیق، با تمرکز بر روی ویژگی scale-free بودن شبکه های تنظیمات ژنی و استفاده از شبکه های بیزین دینامیک، الگوریتمی ارائه می گردد که می تواند با پیچیدگی محاسباتی چند جمله ای شبکه اصلی را با دقت بالایی نسبت به روش های متداول استنتاج کند.
مطالب ارائه شده در این فصل عبارتند از: در قسمت اول این بخش به مرور مفاهیم و تعاریف مربوط به شبکه های بیزین دینامیک پرداخته می شود و همچنین روش های یاد گیری متداول این گونه شبکه ها بررسی می شوند. در قسمت بعد شبکه های scale-free معرفی خواهند شد و خواص این شبکه ها با شبکه های تصادفی مقایسه خواهند شد. در قسمت آخر این فصل الگوریتم پیشنهادی برای یادگیری شبکه های بیزین دینامیکی که درجه خروجی در آن ها از سری توانی پیروی می کنند ارائه خواهد شد.

3-2- شبکه های بیزین دینامیک

شبکه های بیزین دینامیک [34،35] گونه ارتقاء یافته ای از شبکه های بیزین هستند که قابلیت مدل کردن فرآیندهایی که در طول زمان رخ می دهند را دارند. برای این منظور زمان باید به گام های گسسته تقسیم گردد. همچنین فرآیندی که توسط این شبکه ها مدل می شود، باید فرض Markov را ارضا کنند. به بیان ساده، مقادیر بعدی متغیرهای سیستم باید فقط به مقادیر فعلی این متغیرها وابسته باشد و از مقادیر آن ها در گام های زمانی قبلی مستقل باشد. بدین طریق، شبکه های بیزین دینامیک قادر هستند تا علاوه بر رابطه بین متغیرها در یک گام زمانی، رابطه آن ها در گام های زمانی متوالی را نیز نشان دهند.
فرض کنید که Z={Z^1,Z^2,…,Z^N} مجموعه ای از N متغیر و Z_t مجموعه ای از مقادیر این متغیرها در گام زمانی t می باشد. یک شبکه بیزین دینامیک از دو شبکه بیزین مجزا (B_1,B_→) تشکیل شده است. B_1 شبکه بیزینی است که رابطه متغیرهای موجود در مجموعه Z در اولین گام زمانی را نمایش می دهد. به بیان دیگر، B_1 نشان ده
نده توزیع توام متغیرهای مجموعه Z_t است. B_→ یک شبکه بیزین دو قطعه زمانی23 است که رابطه بین متغیرها در گام های زمانی متوالی را نشان می دهد. به عبارت دقیق تر، B_→ نشان دهنده توزیع توام P(Z_t |Z_(t-1)) برای گام های زمانی دوم به بعد است. شایان ذکر است که توزیع P(Z_t |Z_(t-1)) برای تمامی گامهای زمانی یکسان است و تغییری نمی کند. شکل 3-1 مثالی از این دو شبکه را نمایش می دهد.

مطلب مشابه :  پایان نامه ارشد درباره−، k، x، FDTD

شکل 3-1- مثالی از دو شبکه های بیزین تشکیل دهنده یک شبکه بیزین دینامیک

با توجه به استقلال بین متغیرها که به وسیله یک شبکه بیزین دینامیک نمایش داده می شود، P(Z_t |Z_(t-1)) بصورت زیر فاکتورگیری می شود:

P(Z_t |Z_(t-1)) = ∏_(i=1)^N▒〖P(Z_t^i |π(Z_t^i))〗

(3-1)

π(Z_t^i) تابعی است که مجموعه ای شامل والدهای متغیر Z_t^i را برمی گرداند. اعضای این مجموعه می توانند متغیر های در گام زمانی فعلی (t)، و یا گام زمانی قبلی (t-1) باشند. در یک شبکه بیزین دینامیک، به یال هایی که روابط بین متغیرها را در یک گام زمانی نشان می دهند یال های درون گام24 گفته می شود و یال هایی که روابط بین متغیر ها را در گام های متوالی نشان می دهند یال های بین گامی25 نامیده می شوند.
با در نظر گرفتن فرض Markov و همچنین فرمول (3-1)، برای توزیع توام تمامی متغیر ها در طول کل فرآیند داریم:

P(Z_1, Z_2,…Z_T )=P(Z_1) ∏_(t=2)^T▒〖P(Z_t |Z_(t-1))〗= ∏_(t=1)^T▒∏_(i=1)^N▒〖P(Z_t^i |π(Z_t^i))〗

(3-2)

3-3- یادگیری شبکه های بیزین دینامیک

الگوریتم هایی که برای یاد گیری شبکه های بیزین دینامیک استفاده می شوند را می توان به دو دسته تقسیم بندی کرد:
الگوریتم هایی که بر اساس روش جستجو و ارزیابی26 عمل می کنند.
الگوریتم هایی که بر اساس شبیه سازی Markov Chain Monte Carlo (MCMC) استفاده می کنند.
الگوریتم هایی که جزء دسته اول طبقه بندی می شوند کیفیت یک شبکه بیزین دینامیک را، با توجه به داده های آموزشی، بر اساس امتیازی که به آن شبکه اختصاص می دهند می سنجند. در واقع در این گونه الگوریتم ها، هدف یافتن شبکه ای با بالا ترین امتیاز است. بنابر این اگر G^* نشان دهنده بهترین شبکه باشد، داریم:

G^*=argmax Score(G;D)
(3-3)

Score(G;D) تابعی است که یک شبکه را بر اساس داده های آموزشی ارزیابی می کند و یک عدد حقیقی را به عنوان امتیاز آن شبکه باز می گرداند.
روش های امتیازدهی به شبکه به دو دسته تقسیم می شوند: روش های امتیازدهی بیزین، و روش های امتیازدهی بر اساس تئوری اطلاعات. در ادامه به معرفی این روش ها پرداخته می شود.

3-3-1- روش های امتیازدهی بیزین
در روش های امتیازدهی بیزین از فرمول بیز برای سنجش کیفیت یک شبکه استفاده می شود. طبق فرمول بیز، احتمال صحت یک شبکه بر اساس داده های آموزشی برابر است با:

P(G|D)=(P(D|G)P(G))/(P(D))
(3-4)

در فرمول بالا، P(G) نشان دهنده میزان باور قبلی ما به صحت شبکه G و P(D|G) نشان دهنده میزان احتمال داده های آموزشی با فرض تولید این داده ها به وسیله شبکه G می باشد. P(D) احتمال حاشیه ای داده های آموزشی را نشان می دهد که برای تمامی شبکه ها مقدار ثابتی است. چون بهترین شبکه مستقل از این احتمال است، می توان آن را در نظر نگرفت و برای یافتن بهترین شبکه از فرمول زیر استفاده کرد:

P(G|D)∝P(D|G)P(G)
(3-5)

در روش های امتیازدهی بیزین در عمل از لگاریتم (3-4) برای امتیاز دهی استفاده می شود.

Score(G;D)∝log⁡〖P(D│G)〗+log⁡〖P(G)〗
(3-6)
P(G) توزیع احتمالی اولیه بر روی ساختار شبکه است و میزان باور اولیه ما را برای صحت شبکه G نشان می دهد. یکی از روش های متداول برای تعریف این احتمال، استفاده از ماتریس احتمالی یال ها می باشد. برای شبکه ای متشکل از N متغیر، ماتریس احتمالی یال ها ماتریسی N×N است که عنصر (i,j)ام آن برابر است با احتمال اولیه اینکه در شبکه متغیر iام والد متغیر jام باشد. در این صورت، اگر ماتریس احتمالی یال ها را با E و عنصر (i,j)ام آن را با e_ij نشان دهیم، P(G) چنین تعریف می شود:

مطلب مشابه :  منبع مقاله با موضوعنقطه تقاطع، زمان واکنش

P(G)= ∏_(i=1)^N▒∏_(j=1)^N▒〖〖e_ij〗^(I_ij )×〖(1-e_ij)〗^(1-I_ij ) 〗
(3-7)

I_ij نشانگری است که اگر در شبکه بین متغیر iام و متغیر jام یالی وجود داشته باشد، مقدار یک می گیرد و در غیر این صورت، مقدار آن برابر با صفر است.
در فرمول (3-6)، زمانی که پارامترهای توزیع های احتمال شرطی شبکه G نامعلوم هستند، مقدار P(D|G) از فرمول زیر بدست می آید:

P(D│G)= ∫_θ▒〖P(D|G,θ)P(θ)dθ〗
(3-8)

برای شبکه های بیزین با متغیرهای گسسته، توزیع های مربوط به P(θ) را از خانواده توزیع های Dirichlet انتخاب می کنند. توزیع Dirichlet این گونه تعریف می شود:

P(θ_1,θ_2,…,θ_(K-1),α_1,α_2,…,α_K )= (∏_(i=1)^K▒〖Γ(α_i)〗)/(Γ(∑_(i=1)^K▒α_i )) ∏_(i=1)^K▒θ_i^(α_i-1)
(3-9)

θ_i متغیرهای تصادفی هستند که باید دو شرط زیر را ارضا کنند:

θ_1,θ_2,…,θ_K 0
∑_(i=1)^K▒θ_i =1
(3-10)

α_i ها پارامترهای توزیع هستند و می توانند مقادیری بزرگ تر از صفرداشته باشند.
همان گونه که در بالا ذکر شد، برای شبکه های بیزین با متغیرهای گسسته، توزیع های مربوط به P(θ) را از خانواده توزیع های Dirichlet انتخاب می کنند. در این حالت، بعد از انتگرال گیری در فرمول (3-8)، P(D│G) برابر می شود با:

P(D│G)=∏_(i=1)^N▒∏_(j=1)^(q_i)▒〖(Γ(N_ij^’))/(Γ(N_ij+N_ij^’)) ∏_(k=1)^(r_i)▒(Γ(N_ijk+N_ijk^’))/(Γ(N_ijk^’))〗
(3-11)

در فرمول بالا، q_i برابر با تعداد حالات مختلف برای مقداردهی به والدهای متغیر iام است و r_i تعداد مقادیری که خود این متغیر می تواند داشته باشد. N_ijk برابر است با تعداد دفعاتی که متغیر iا
م مقدار kام را در دامنه خود داشته است به شرطی که مقادیر والدهای این متغیر در حالت jام باشند. N_ijk^’ پارامتر توزیع Dirichlet مربوط به متغیر iام، در حالتی که والدهای این متغیر در حالت jام باشند، است. همچنین داریم: N_ij^’= ∑_(k=1)^(r_i)▒N_ijk^’ و N_ij= ∑_(k=1)^(r_i)▒N_ijk .

3-3-1-1- امتیازدهی به روش K2
در صورتی که در فرمول (3-11) تمامی پارامترهای توزیع برابر یک قرار داده شوند، P(D│G) معادل تابع امتیازدهی K2 می شود. در این حالت داریم:

P(D│G)=∏_(i=1)^N▒∏_(j=1)^(q_i)▒〖(〖(r〗_i-1)!)/(N_ij+r_i-1)! ∏_(k=1)^(r_i)▒〖N_ijk !〗〗
(3-12)

3-3-1-2- امتیازدهی به روش BDe
اگر در فرمول (3-11) N_ijk^’ مطابق فرمول زیر تعریف شود، P(D│G) معادل تابع امتیازدهی BDe می شود.

N_ijk^’=N^’×P(Z^i=k, π(Z^i )=j|G)
(3-13)

در فرمول بالا، شرط Z^i=k یعنی متغیر iام مقدار kام خود را داشته باشد و π(Z^i )=j یعنی مجموعه مقادیر والدهای متغیر iام در حالت jام خود باشد. N^’ میزان باور ما را به توزیع اولیه نشان می دهد.

3-3-2- روش های امتیازدهی بر اساس تئوری اطلاعات
روش های بر گرفته شده از تئوری اطلاعات که برای امتیازدهی شبکه های بیزین استفاده می شوند، بر اساس فشرده سازی اطلاعات عمل می کنند.در این گونه روش ها، کیفیت یک شبکه بیزین متناسب است با میزانی که شبکه قادر است با توجه به کدی که تولید می کند داده های آموزشی را فشرده سازی کند. کدی که یک شبکه بیزین تولید می کند بر اساس ساختار گراف شبکه و گزاره های استقلال یا عدم استقلال بین متغیرها که توسط یال های گراف مشخص می شود، تعیین می گردد. حد نهایی فشرده سازی اطلاعات طبق تئوری شانون مشخص می شود. طبق این تئوری، وقتی تعداد نمونه های مستقل با توزیع یکنواخت یک مجموعه به بینهایت میل می کند، هیچ روش فشرده سازی قادر نیست، بدون از دست دادن اطلاعات، پیغامی را با طولی کوتاه تر از اندازه ای که با آنتروپی شانون مشخص می شود ایجاد کند.
کدهای متعددی هستند که به صورت حدی می توانند پیغامی را تولید کنند که اندازه آن به اندازه ای که با آنتروپی شانون مشخص می شود میل کند. برای ساختن چنین کدی باید یک توزیع احتمالی بر روی داده ها تعریف شود. این توزیع احتمالی به صورت قطعی می تواند توسط یک شبکه بیزین مشخص گردد. بر همین اساس، روش های امتیاز دهی زیر تعریف می شوند.

3-3-2-1- امتیازدهی به روش log-likelihood (LL)
تابعی که در این روش امتیازدهی استفاده می شود چنین تعریف می شود:

LL(G│D)=∑_(i=1)^N▒∑_(j=1)^(q_i)▒∑_(k=1)^(r_i)▒〖N_ijk log⁡〖(N_ijk/N_ij )〗 〗
(3-14)

مشکل اصلی این تابع این است که هر چه در شبکه تعداد یال بیشتری وجود داشته باشد، شبکه امتیاز بیشتری می گیرد. در واقع در این روش امتیازدهی، شبکه ای که در آن تمامی یال ها وجود دارند و گراف شبکه یک گراف کامل است، بیشترین امتیاز را می گیرد. برای رفع این مشکل از

Leave a Comment