آزمایشگاه بیوانفورماتیک ساختاری و آزمایشگاه بیولوژی شبکه ، به رهبری دکتر پاتریک آلیو ، محقق ICREA ، با استفاده از مدل های محاسباتی عمیق یادگیری ماشین ، اطلاعات زیست فعالیت را برای یک میلیون مولکول تکمیل کرده است. همچنین ابزاری برای پیش بینی فعالیت بیولوژیکی هر مولکول ، حتی در صورت عدم دسترسی به داده های آزمایشی ،ایجاد کرده است.
این روش جدید مبتنی بر Chemical Checker یا شیمی جستجوگر است ، بزرگترین پایگاه اطلاعاتی از مشخصات زیست فعال شبه دارویی تا به امروز توسط همین آزمایشگاه توسعه یافته و در سال 2020 منتشر شده است. شیمی جستجوگر اطلاعات را از 25 جایگاه فعال زیستی برای هر مولکول جمع آوری می کند.جایگاه فعال مکانی از ساختار مولکول است که توانایی انجام واکنش دارد.
این جایگاها به ساختار شیمیایی مولکول ، اهدافی که با آن برهم کنش دارد یا تغییراتی که در سطح بالینی یا سلولی ایجاد می کند ، مرتبط هستند. با این حال ، این اطلاعات بسیار دقیق در مورد مکانیسم عملکرد برای اکثر مولکولها ناقص است ، و این بدان معنی است که برای یک مورد خاص ممکن است اطلاعاتی برای یک یا دو فضای فعالیت زیستی وجود داشته باشد اما برای هر 25 مورد وجود ندارد.
با این پیشرفت جدید ، محققان تمام اطلاعات تجربی موجود را با روش های یادگیری ماشین عمیق ادغام می کنند ، بنابراین تمام پروفایل های فعالیت مولکول ها ، از سطح شیمی گرفته تا سطح بالینی ، برای تمام مولکول ها قابل تکمیل است.
این ابزار جدید همچنین به ما امکان می دهد تا جایگاه فعال مولکول های جدید را پیش بینی کنیم ، و این در فرآیند کشف دارو بسیار مهم است زیرا می توانیم مناسب ترین کاندیداها را انتخاب کرده و و مواردی که مناسب نیستند ، کنار بگذاریم. ”
کتابخانه به صورت نرم افزار در سایت bioactivitysignatures.org برای جامعه علمی آزادانه قابل دسترسی است و با در دسترس قرار دادن اطلاعات بیشتر فعالیت های بیولوژیکی ، توسط محققان به طور منظم به روز می شود. با هر به روزرسانی داده های آزمایشی در شیمی جستجوگر ، شبکه های عصبی مصنوعی نیز اصلاح می شوند تا تخمین ها را اصلاح کنند.