ترسیم نمودارهای Gene Ontology

ترسیم نمودارهای Gene Ontology

حاشیه‌نویسی ژنی یا annotation

حاشیه‌نویسی ژنی یا annotation بر اساس هستی‌شناسی ژن یا همان Gene Ontology به ما کمک می‌کند که یک ساختار سلسله‌مراتبی را از آنچه درون سلول رخ می‌دهد داشته باشیم. در حقیقت این اطلاعات مانند یک لغت‌نامه برای ما کار می‌کند که می‌تواند درک بهتری از اجزای سلول، فرایندها و مکان آن‌ها به ما بدهد.

تلاش شده است که اطلاعات درون این لغت‌نامه منحصربه‌فرد باشد و همچنین به کمک آن بتوانیم ارتباط بین اجزا را شناسایی کنیم. به دلیل آنکه چندین اسم برای یک مفهوم وجود داشت و یا اینکه یک اسم به چندین مفهوم اطلاق می‌شد، شاهد نوعی بی‌ثباتی یا inconsistency در زبان بودیم. مشکلی که درک مفاهیم را برای ما سخت می‌کرد.

درنتیجه، هستی‌شناسی ژن یا ژن انتولوژی قصد داشته که چنین مشکلی را حل کند و به همین دلیل ایجاد شده است. مثلاً بعضی از محققین به‌جای استفاده از سنتز گلوکز از عبارت گلوکز بیوسنتز، گلوکز فرمیشن، گلوکز آنابولیسم یا گلوکونئوجنسیس استفاده می‌کردند که همگی به تولید زیست اشاره می‌کند. این‌گونه بی‌ثباتی‌ها سبب شد که یک لغت‌نامه کلی برای این مشکل ایجاد شود تا همگی بر روی نام استفاده شده اتفاق‌نظر داشته باشد و به یک اسم یا مفهوم جامع تبدیل شود.

کاربرد دیگری که ژن انتولوژی یا هستی‌شناسی دارد این است که به کمک آن می‌توانیم مجموعه‌داده‌های بزرگ را بررسی کنیم. کاری که برای بررسی انجام می‌دادیم خوشه‌بندی بود. به کمک الگوریتم‌های بیوانفورماتیک می‌توانیم عملکردی را به این ژن‌های مشابه اختصاص دهیم تا عملکرد را بررسی کنیم.

با وجود توسعه روش‌های اومیکس، اطلاعات در سطوح مختلف به دست آمده است که باید annotation برای آن‌ها نیز انجام شود. به همین دلیل نیاز به یک روش annotation به‌صورت اتوماتیک داریم که بتواند این کار را به‌خوبی و با سرعت بیشتری انجام دهد.

علاوه بر مشکلاتی که درمورد اسم‌ها وجود داشت، بین ارگانیسم‌های متفاوت نیز تفاوت وجود دارد. مثلاً در بین ارگانیسم‌ها، به یک پروتئین مشابه نام‌های مختلفی اطلاق می‌شد که باز این موضوع نیز بر پیچیدگی ماجرا اضافه می‌کرد. هستی‌شناسی ژن یا ژن انتولوژی قصد داشته که این مشکل را نیز برطرف کند.

هر گره در هستی‌شناسی‌های GO به انواع دیگر اطلاعات، از جمله پایگاه‌های اطلاعاتی ژنی و پروتئینی مانند SwissPROT، Gen-Bank، EMBL، DDBJ، PIR، MIPS، YPD & ، Pfam، SCOP و ENZYME متصل می‌شود. یکی از دلایل این امر این است که وضعیت دانش بیولوژیکی درباره کاری که ژن‌ها و پروتئین‌ها انجام می‌دهند بسیار ناقص بوده و به‌سرعت در حال تغییر است. اکتشافاتی که درک ما را از نقش محصولات ژنی در سلول‌ها تغییر می‌دهد، به‌صورت روزانه منتشر می‌شود که باید مورد بررسی قرار گیرد.

Gene Ontology

این حوزه به سه دسته کلی تقسیم‌بندی می‌شود. ما برای ژن‌ها و محصولات پایین‌دستی آن‌ها سه دسته اطلاعات به دست می‌آوریم که دسته اول می‌گوید در چه فرایندی دخیل است. دسته دوم اشاره می‌کند که این ژن از لحاظ مولکولی دقیقاً چه عملکردی را انجام می‌دهد، مثلاً محصول ژن به چه چیزی متصل می‌شود و اینکه چه کاری می‌کند. در دسته سوم نیز درمورد جایگاه آن در سلول صحبت می‌شود که می‌گوید مثلاً پروتئین در غشا قرار دارد یا در سیتوزول. درنتیجه ما در ژن انتولوژی سه دسته اطلاعات خواهیم داشت و یک ترم یونیک برای هرکدام از اجزا استفاده می‌شود.

فرایند بیولوژیکی (biological process)

فرایند بیولوژیکی (biological process) به یک هدف بیولوژیکی اشاره دارد که ژن یا محصول ژنی به ایجاد آن کمک می‌کند. یک فرایند از طریق یک یا چند مجموعه منظم از توابع مولکولی انجام می‌شود. فرایندها اغلب شامل یک دگرگونی شیمیایی یا فیزیکی هستند، به این معنا که چیزی وارد یک فرایند می‌شود و چیز متفاوتی از آن خارج می‌شود.

نمونه‌هایی از اصطلاحات فرایند بیولوژیکی (فرایندهای سطح بالا) عبارت‌اند از “رشد و نگهداری سلول” (cell growth and maintenance) یا “تبدیل سیگنال” (signal transduction). نمونه‌هایی از اصطلاحات فرایندی خاص‌تر (فرایندهای سطح پایین‌تر) عبارت‌اند از «ترجمه» (translation)، «متابولیسم پیریمیدین» (pyrimidine metabolism) یا «بیوسنتز cAMP» (cAMP biosynthesis).

عملکرد مولکولی (molecular function) به‌عنوان فعالیت بیوشیمیایی (شامل اتصال خاص به لیگاندها یا ساختارها) در یک محصول ژنی تعریف می‌شود. این سطح فقط آنچه را که انجام می‌شود بدون مشخص‌کردن مکان یا زمان وقوع رویداد توصیف می‌کند. نمونه‌هایی از اصطلاحات کاربردی گسترده عبارت‌اند از «آنزیم»، «حامل» یا «لیگاند». نمونه‌هایی از اصطلاحات کاربردی خاص‌تر عبارت‌اند از “آدنیلات سیکلاز” یا “لیگاند گیرنده Toll”.

جزء سلولی (cellular component) به مکانی در سلول اشاره دارد که یک محصول ژن در آن فعال است. این اصطلاحات درک ما از ساختار سلول یوکاریوتی را نشان می‌دهد. همان‌طور که برای دیگر هستی‌شناسی‌ها صادق است، همه اصطلاحات برای همه موجودات قابل‌استفاده نیستند. مؤلفه سلولی شامل عباراتی مانند «ریبوزوم» یا «پروتئزوم» است که مشخص می‌کند محصولات چند ژن در کجا یافت می‌شوند. همچنین این اصلاحات شامل عباراتی مانند “غشای هسته‌ای” یا “دستگاه گلژی” نیز می‌شوند.

ویژگی دیگر ژن انتولوژی یا هستی‌شناسی ژن، وجود ارتباط بین این اجزای سلولی است. فرایندها می‌توانند زیرمجموعه هم قرار بگیرند و به همین دلیل یک ساختار سلسله‌ مراتبی بین آن‌ها وجود دارد. مثلاً biological process به دودسته metabolic process و cellular process تقسیم می‌شود و هرکدام از این موارد به ‌مراتب ریزتر تقسیم می‌شوند. گرافی که در اینجا داریم جهت‌دار است و نودهای گراف (node) را به‌صورت سلسله‌مراتبی به هم متصل می‌کند. نکته دیگر اینکه گراف هیچ دوری ندارد و تنها در یک‌جهت حرکت می‌کند.

در ادامه ژن انتولوژی می‌توانیم از آنالیزهای غنی‌سازی ژن یا gene enrichment استفاده کنیم. در آنالیزهای غنی‌سازی بررسی می‌شود که ژن‌های ما چه ترم‌های دارند و آن را با ژن‌هایی که خارج از دسته افتاده‌اند بررسی می‌کنند. به همین دلیل می‌توانیم ببینیم که ژن‌های ما در مقایسه با مواردی که درون دسته نیستند چه عملکردی دارند.

مطالعه صدها مطلب علمی در حوزه بیولوژی

آرشیو جدیدترین خبرهای روز دنیای بیولوژی

از این مطلب چقدر راضی بودید؟

روی ستاره کلیک کنید تا نظرتون ثبت بشه

3.7 / 5. تعداد رای دهندگان: 3

تا حالا امتیازی برای این مطلب ثبت نشده؛ با ثبت نظرتون مارو خوشحال می‌کنید