حاشیهنویسی ژنی یا annotation
حاشیهنویسی ژنی یا annotation بر اساس هستیشناسی ژن یا همان Gene Ontology به ما کمک میکند که یک ساختار سلسلهمراتبی را از آنچه درون سلول رخ میدهد داشته باشیم. در حقیقت این اطلاعات مانند یک لغتنامه برای ما کار میکند که میتواند درک بهتری از اجزای سلول، فرایندها و مکان آنها به ما بدهد.
تلاش شده است که اطلاعات درون این لغتنامه منحصربهفرد باشد و همچنین به کمک آن بتوانیم ارتباط بین اجزا را شناسایی کنیم. به دلیل آنکه چندین اسم برای یک مفهوم وجود داشت و یا اینکه یک اسم به چندین مفهوم اطلاق میشد، شاهد نوعی بیثباتی یا inconsistency در زبان بودیم. مشکلی که درک مفاهیم را برای ما سخت میکرد.
درنتیجه، هستیشناسی ژن یا ژن انتولوژی قصد داشته که چنین مشکلی را حل کند و به همین دلیل ایجاد شده است. مثلاً بعضی از محققین بهجای استفاده از سنتز گلوکز از عبارت گلوکز بیوسنتز، گلوکز فرمیشن، گلوکز آنابولیسم یا گلوکونئوجنسیس استفاده میکردند که همگی به تولید زیست اشاره میکند. اینگونه بیثباتیها سبب شد که یک لغتنامه کلی برای این مشکل ایجاد شود تا همگی بر روی نام استفاده شده اتفاقنظر داشته باشد و به یک اسم یا مفهوم جامع تبدیل شود.
کاربرد دیگری که ژن انتولوژی یا هستیشناسی دارد این است که به کمک آن میتوانیم مجموعهدادههای بزرگ را بررسی کنیم. کاری که برای بررسی انجام میدادیم خوشهبندی بود. به کمک الگوریتمهای بیوانفورماتیک میتوانیم عملکردی را به این ژنهای مشابه اختصاص دهیم تا عملکرد را بررسی کنیم.
با وجود توسعه روشهای اومیکس، اطلاعات در سطوح مختلف به دست آمده است که باید annotation برای آنها نیز انجام شود. به همین دلیل نیاز به یک روش annotation بهصورت اتوماتیک داریم که بتواند این کار را بهخوبی و با سرعت بیشتری انجام دهد.
علاوه بر مشکلاتی که درمورد اسمها وجود داشت، بین ارگانیسمهای متفاوت نیز تفاوت وجود دارد. مثلاً در بین ارگانیسمها، به یک پروتئین مشابه نامهای مختلفی اطلاق میشد که باز این موضوع نیز بر پیچیدگی ماجرا اضافه میکرد. هستیشناسی ژن یا ژن انتولوژی قصد داشته که این مشکل را نیز برطرف کند.
هر گره در هستیشناسیهای GO به انواع دیگر اطلاعات، از جمله پایگاههای اطلاعاتی ژنی و پروتئینی مانند SwissPROT، Gen-Bank، EMBL، DDBJ، PIR، MIPS، YPD & ، Pfam، SCOP و ENZYME متصل میشود. یکی از دلایل این امر این است که وضعیت دانش بیولوژیکی درباره کاری که ژنها و پروتئینها انجام میدهند بسیار ناقص بوده و بهسرعت در حال تغییر است. اکتشافاتی که درک ما را از نقش محصولات ژنی در سلولها تغییر میدهد، بهصورت روزانه منتشر میشود که باید مورد بررسی قرار گیرد.
این حوزه به سه دسته کلی تقسیمبندی میشود. ما برای ژنها و محصولات پاییندستی آنها سه دسته اطلاعات به دست میآوریم که دسته اول میگوید در چه فرایندی دخیل است. دسته دوم اشاره میکند که این ژن از لحاظ مولکولی دقیقاً چه عملکردی را انجام میدهد، مثلاً محصول ژن به چه چیزی متصل میشود و اینکه چه کاری میکند. در دسته سوم نیز درمورد جایگاه آن در سلول صحبت میشود که میگوید مثلاً پروتئین در غشا قرار دارد یا در سیتوزول. درنتیجه ما در ژن انتولوژی سه دسته اطلاعات خواهیم داشت و یک ترم یونیک برای هرکدام از اجزا استفاده میشود.
فرایند بیولوژیکی (biological process)
فرایند بیولوژیکی (biological process) به یک هدف بیولوژیکی اشاره دارد که ژن یا محصول ژنی به ایجاد آن کمک میکند. یک فرایند از طریق یک یا چند مجموعه منظم از توابع مولکولی انجام میشود. فرایندها اغلب شامل یک دگرگونی شیمیایی یا فیزیکی هستند، به این معنا که چیزی وارد یک فرایند میشود و چیز متفاوتی از آن خارج میشود.
نمونههایی از اصطلاحات فرایند بیولوژیکی (فرایندهای سطح بالا) عبارتاند از “رشد و نگهداری سلول” (cell growth and maintenance) یا “تبدیل سیگنال” (signal transduction). نمونههایی از اصطلاحات فرایندی خاصتر (فرایندهای سطح پایینتر) عبارتاند از «ترجمه» (translation)، «متابولیسم پیریمیدین» (pyrimidine metabolism) یا «بیوسنتز cAMP» (cAMP biosynthesis).
عملکرد مولکولی (molecular function) بهعنوان فعالیت بیوشیمیایی (شامل اتصال خاص به لیگاندها یا ساختارها) در یک محصول ژنی تعریف میشود. این سطح فقط آنچه را که انجام میشود بدون مشخصکردن مکان یا زمان وقوع رویداد توصیف میکند. نمونههایی از اصطلاحات کاربردی گسترده عبارتاند از «آنزیم»، «حامل» یا «لیگاند». نمونههایی از اصطلاحات کاربردی خاصتر عبارتاند از “آدنیلات سیکلاز” یا “لیگاند گیرنده Toll”.
جزء سلولی (cellular component) به مکانی در سلول اشاره دارد که یک محصول ژن در آن فعال است. این اصطلاحات درک ما از ساختار سلول یوکاریوتی را نشان میدهد. همانطور که برای دیگر هستیشناسیها صادق است، همه اصطلاحات برای همه موجودات قابلاستفاده نیستند. مؤلفه سلولی شامل عباراتی مانند «ریبوزوم» یا «پروتئزوم» است که مشخص میکند محصولات چند ژن در کجا یافت میشوند. همچنین این اصلاحات شامل عباراتی مانند “غشای هستهای” یا “دستگاه گلژی” نیز میشوند.
ویژگی دیگر ژن انتولوژی یا هستیشناسی ژن، وجود ارتباط بین این اجزای سلولی است. فرایندها میتوانند زیرمجموعه هم قرار بگیرند و به همین دلیل یک ساختار سلسله مراتبی بین آنها وجود دارد. مثلاً biological process به دودسته metabolic process و cellular process تقسیم میشود و هرکدام از این موارد به مراتب ریزتر تقسیم میشوند. گرافی که در اینجا داریم جهتدار است و نودهای گراف (node) را بهصورت سلسلهمراتبی به هم متصل میکند. نکته دیگر اینکه گراف هیچ دوری ندارد و تنها در یکجهت حرکت میکند.
در ادامه ژن انتولوژی میتوانیم از آنالیزهای غنیسازی ژن یا gene enrichment استفاده کنیم. در آنالیزهای غنیسازی بررسی میشود که ژنهای ما چه ترمهای دارند و آن را با ژنهایی که خارج از دسته افتادهاند بررسی میکنند. به همین دلیل میتوانیم ببینیم که ژنهای ما در مقایسه با مواردی که درون دسته نیستند چه عملکردی دارند.
مطالعه صدها مطلب علمی در حوزه بیولوژی
آرشیو جدیدترین خبرهای روز دنیای بیولوژی