دیتابیس های پرکاربرد در اومیکس و فرمت‌های فایل های سیستم بیولوژی مانند SBML

دیتابیس های پرکاربرد در اومیکس

درباره دیتابیس های پرکاربرد در اومیکس و فرمت‌های فایل های سیستم بیولوژی مانند SBML

هدف نهایی محققین در حوزه بین‌رشته‌ای سیستم بیولوژی حل مسائل بیولوژیکی در سطح کل یک سیستم است. برای اینکه به این هدف دست پیدا کنیم، باید از تلاش‌های زیست‌شناسان در سال‌های اخیر بهره ببریم که اطلاعات تجربی و آزمایشگاهی زیادی را تولید کرده‌اند. با قراردادن این اطلاعات در یک بستر یکپارچه درنهایت به دیتابیس های پرکاربرد در اومیکس یا پایگاه‌های داده زیست‌شناسی می‌رسیم. دیتابیس‌های زیستی شامل اطلاعات مختلفی در سطوح، ژنومیکس، پروتئومیکس، متابولومیکس و بیان ژن میکرواری هستند و یا اطلاعاتی درمورد فیلوژنی دارند.

دیتابیس های پرکاربرد در اومیکس

به همین دلیل دیتابیس‌های زیستی را می‌توان بر اساس نوع داده در دسته‌بندی‌های مختلفی موردبررسی قرار داد. مثلاً دیتابیس‌های مولکولی شامل توالی‌ها یا مولکول‌ها هستند، دیتابیس‌های عملکردی حاوی اطلاعاتی درمورد فیزیولوژی، فعالیت آنزیمی و فنوتیپ را در خود جمع‌آوری کرده‌اند. دیتابیس‌هایی که اطلاعات تاکسونومیک را در اختیار دارند نیز برای گونه‌های مختلف و رتبه‌های تاکسونومی مورداستفاده قرار می‌گیرند.

به بیشتر دیتابیس‌های زیستی و دیتابیس های پرکاربرد در اومیکس از طریق اینترنت دسترسی وجود دارد و علاقه‌مندان می‌توانند درمورد داده‌های خود در اینترنت جست‌وجو انجام دهند و حتی به دیگر دیتابیس‌ها نیز لینک شوند. دیتابیس‌ها با یکدیگر نیز در ارتباط هستند و یک سامانه اصلی را تشکیل داده‌اند که اطلاعات را در یکدیگر به هم متصل می‌کنند و این خود پایگاه دانش بزرگ‌تری را می‌سازد.

دیتای موجود در دیتابیس‌ها قابل دانلود است و شما از صفحه خود سایت، به کمک سایت‌های کمکی یا حتی استفاده از دستورات لینوکس می‌توانید این دیتا را دانلود کرده و در سرور یا کامپیوتر شخصی خود تحلیل کنید. داده‌ها در دیتابیس‌ها فرمت‌های مختلفی دارند. مثلاً شما می‌توانید دیتای text، دیتای توالی، ساختار پروتئین و لینک‌ها را پیدا کنید. هرکدام از این موارد نیز به فرمت خاصی وجود دارند که می‌توانید آن را دریافت کنید.

اطلاعات مبتنی بر text را می‌توانید در دیتابیس‌هایی مانند PubMed (دیتابیسی از مقالات در حوزه زیست‌پزشکی) یا OMIM (دیتابیسی از بیماری‌های مختلف) پیدا کنید. دیتای توالی نیز از سایت‌هایی مانند DDBJ، GenBank و UniProt قابل‌دسترسی است که دو مورد اول درمورد توالی ژن و مورد آخر درمورد توالی پروتئین است.  برای پیداکردن ساختار پروتئین نیز می‌توانید از دیتابیس‌هایی مانند PDB استفاده کنید.

برای انتقال داده‌های مربوط به سیستم بیولوژی بهتر است از فرمت‌های فایل مخصوصی استفاده کنیم که به کمک آن بتوانیم اطلاعات را دسته‌بندی کنیم و حتی به کمک نرم‌افزارهای موجود آن را تحلیل یا ترسیم کنیم. در زیر تعدادی از این فرمت‌های فایل در سیستم بیولوژی آورده شده است.

دیتابیس های پرکاربرد در اومیکس

 

برای‌آنکه بتوانند دیتای عظیم دیتابیس های پرکاربرد در اومیکس را برای مدل یک ارگانیسم متمرکز کنند از فرمت خاصی به نام Systems Biology Markup Language یا به‌صورت خلاصه، SBML استفاده می‌کنند. با بازکردن این فایل، شما می‌‌توانید واکنش‌ها و اجزای آن را در یک فایل به‌صورت سیستماتیک و مرتب شده پیدا کنید. هرکدام از این اجزا یا واکنش‌هایی که آن‌ها را به هم مربوط می‌کند، به دیتابیس‌هایی لینک داده شده‌اند. پس در فایل نتورک متابولیکی یک ارگانیسم، شما می‌توانید اطلاعات این دیتابیس‌ها را در کنار یکدیگر و در تعامل با هم پیدا کنید.

Biological PAthway eXchange (BioPAX) یک زبان استاندارد برای یکپارچه‌سازی، تبادل و تجزیه و تحلیل داده های مسیر بیولوژیکی است. فایل فرمت CellML یک زبان نشانه‌گذاری XML برای ذخیره و تبادل مدل‌های ریاضی مبتنی بر کامپیوتر است.

SBGN یا Systems Biology Graphical Notation یک فایل فرمت سیستم بیولوژی گرافیکی استاندارد برای مصورسازی داده‌های زیستی است. در حال حاضر این فرمت از سه زبان تشکیل شده است که توضیحات فرآیندهای زیستی (Process Descriptions)، روابط موجود (Entity Relationships) و فعالیت (Activity Flows) را توصیف می‌کند. علاوه بر این، SBGN-ML یک فرمت فایل مبتنی بر XML است که برای مصورسازی استفاده می‌شود و در عین حال مفاهیم زیستی را در خود حفظ می‌کند.

فرمت فایل SBOL یا  Synthetic Biology Open Language زبانی کاربردی برای سینتیک بیولوژی یا زیست‌شناسی مصنوعی است که برای تبادل اطلاعات مربوط به اجزای سینتیک بیولوژی مورد استفاده قرار می‌گیرد.

 

دیتابیس های پرکاربرد در اومیکس

دیتابیس‌های مختلفی هستند که در حوزه سیستم بیولوژی مورداستفاده قرار می‌گیرند. مثلاً برای‌آنکه به دیتابیسی درمورد ریزمتابولیت‌های بدن دسترسی داشته باشید باید از دیتابیس HMDB استفاده کنید که خلاصه Human Metabolome Database است. KEGG یکی از مهم‌ترین پایگاه‌های داده زیست‌شناسی و یکی از دیتابیس های پرکاربرد در اومیکس است که مورداستفاده قرار می‌گیرد. این پایگاه‌ داده اطلاعات مهمی را در سطوح ژنوم، مسیرهای زیستی (biological pathways)، بیماری‌ها، داروها و محصولات شیمیایی در بر دارد.

این پایگاه‌داده در حوزه بیوانفورماتیک کاربرد گسترده‌ای دارد و برای آنالیز داده در ژنومیکس، متاژنومیکس، متابولومیکس و غیره کاربرد دارد. همچنین مدل‌سازی و شبیه‌سازی در سیستم بیولوژی نیز با کمک داده‌های این دیتابیس مهم انجام می‌گیرد. ساخت این دیتابیس در سال 1995 توسط دانشگاه کیوتو کشور ژاپن کلید خورد و تا به امروز در حال گسترش بوده است.

به دلیل آنکه به یک منبع کامپیوتری برای تحلیل بیولوژیکی داده‌های توالی ژنوم نیاز است، kegg pathway نیز فعالیت خود را شروع کرد. این دیتابیس که در دل دیتابیس اصلی KEGG قرار دارد، شامل مسیرهای متابولیکی است که به‌صورت دستی ترسیم شده و نشان‌دهنده یک رابطه بیولوژیک بین اجزای این مسیر زیستی است. این رابطه از لحاظ تجربی اثبات شده و هر نقشه‌ای در این دیتابیس نشان‌دهنده شبکه‌ای از تعاملات مولکولی است و ژن‌ها نیز به محصولات خود پیوند داده شده‌اند که بیشتر از جنس پروتئین هستند. این دیتا شرایطی را فراهم کرده است که به کمک آن بتوانیم مسیرها و عملکردهای متابولیکی مربوط به ژن‌ها و محصولات آن‌ها را بهتر بشناسیم و استفاده کنیم.

یکی دیگر از دیتابیس های پرکاربرد در اومیکس ، wikipathway است. این دیتابیس نیز مانند مورد قبل شامل داده‌هایی درمورد مسیرهای بیولوژیکی است که با سرچ کردن ژن، پروتئین یا یک مسیر زیستی می‌توانید به اطلاعات مربوط به آن دسترسی داشته باشید. این دیتابیس اطلاعاتی درمورد ارگانیسم‌های مختلف مانند انسان، باکتری‌ها، مخمر، گونه‌های گیاهی و c. elegans دارد به همین دلیل کاربردهای دیگری جز زیست‌پزشکی نیز دارد. BRENDA دیتابیس دیگری است که حاوی اطلاعات مربوط به آنزیم‌هاست. به کمک این دیتابیس می‌توان خواص بیوشیمیایی و کینتیکی آنزیم‌ها، مهارکننده‌ها، محصولات، مواد اولیه و اطلاعاتی ازاین‌دست را پیدا کنیم.

برای دسترسی به داده‌های حاصل از میکرواری می‌توانید به GEO مراجعه کنید و دیتای مدنظر خود را بر اساس نوع بیماری، پلتفرم و تعداد نمونه‌های در دسترس انتخاب کرده و تحلیل کنید. دیتابیسی مانند TargetScan نیز هدف بیولوژیکی miRNAها را پیش‌بینی می‌کند. برای دسترسی به دیتای مربوط به پروسه‌های بیولوژیکی نیز می‌توانید به GO مراجعه کنید. دیتابیس‌هایی مانند pharmgkb نیز برای حوزه pharmacogenomics طراحی شده‌اند. مثلاً در این دیتابیس، ارتباط بین واریانت‌های ژنی و نحوه پاسخ بدن به درمان‌ها بررسی می‌شود.

 

دیتابیس های پرکاربرد در اومیکس

دیتابیس های پرکاربرد در اومیکس در این حوزه یکپارچه شده و برای پاسخ به سؤالات زیستی مورداستفاده قرار می‌گیرد.

کارآموزی طراحی و مدلسازی سلولی: سیستم بیولوژی

از این مطلب چقدر راضی بودید؟

روی ستاره کلیک کنید تا نظرتون ثبت بشه

5 / 5. تعداد رای دهندگان: 2

تا حالا امتیازی برای این مطلب ثبت نشده؛ با ثبت نظرتون مارو خوشحال می‌کنید

1 دیدگاه برای “دیتابیس های پرکاربرد در اومیکس و فرمت‌های فایل های سیستم بیولوژی مانند SBML

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *