مقدمهای بر تجزیه و تحلیل بقا
در بسیاری از مطالعات سرطان، پیامد اصلی مورد ارزیابی، زمان رسیدن به یک رویداد مورد نظر است. نام عمومی این زمان، زمان بقا است، اگرچه ممکن است به زمان «زنده ماندن» از بهبودی کامل تا عود یا پیشرفت، به همان اندازه برای زمان تشخیص تا مرگ اطلاق شود. اگر رویداد در همه افراد رخ می داد، بسیاری از روش های تجزیه و تحلیل قابل استفاده خواهند بود.
با این حال، معمول است که در پایان پیگیری، برخی از افراد رویداد مورد نظر را نداشته اند و بنابراین زمان واقعی آنها تا رویداد مشخص نیست. علاوه بر این، دادههای بقا به ندرت به طور معمول توزیع میشوند، اما منحرف هستند و معمولا شامل بسیاری از رویدادهای اولیه و نسبتا کمی دیررس هستند. همین ویژگی های داده هاست که روش های خاصی به نام تحلیل بقا را ضروری می کند.
بیشتر تحلیلهای بقا در مجلات سرطان از برخی یا همه نمودارهای Kaplan-Meier (KM)، تستهای لوگرانک و رگرسیون کاکس استفاده میکنند. ما پیشینه و تفسیر هر یک از این روشها و همچنین سایر رویکردهای تحلیل را که شایسته استفاده بیشتر هستند، مورد بحث قرار خواهیم داد. در این متن، مفاهیم اساسی تجزیه و تحلیل بقا، از جمله نحوه تولید و تفسیر منحنیهای بقا و نحوه کمیسازی و آزمایش تفاوتهای بقا بین دو یا چند گروه از بیماران را ارائه خواهیم داد.
انواع رویداد در مطالعات سرطان
در بسیاری از مطالعات پزشکی، زمان تا مرگ رویداد مورد نظر است. با این حال، در سرطان یکی دیگر از معیارهای مهم زمان بین پاسخ به درمان و عود یا زمان بقای بدون عود (که زمان بقای بدون بیماری نیز نامیده می شود) است. مهم است که بگوییم رویداد چیست و دوره مشاهده چه زمانی شروع و چه زمانی به پایان می رسد. به عنوان مثال، ممکن است ما علاقه مند به عود در بازه زمانی بین پاسخ تایید شده و اولین عود سرطان باشیم.
مشکلات خاص مربوط به تجزیه و تحلیل بقا عمدتاً از این واقعیت ناشی می شود که فقط برخی از افراد این رویداد را تجربه کرده اند و متعاقبا زمان بقا برای زیر مجموعه ای از گروه مورد مطالعه ناشناخته خواهد بود. این پدیده سانسور نامیده می شود و ممکن است به روش های زیر ایجاد شود:
- یک بیمار (هنوز) پیامد مربوطه مانند عود یا مرگ را تا زمان پایان مطالعه تجربه نکرده است.
- بیمار در طول دوره مطالعه برای پیگیری از دست می رود.
- یک بیمار رویداد متفاوتی را تجربه می کند که پیگیری بیشتر را غیرممکن می کند.
چنین زمان های بقای سانسور شده زمان واقعی (اما ناشناخته) تا رویداد را دست کم می گیرند. با تجسم فرآیند بقای یک فرد به عنوان یک خط زمانی، رویداد آنها (با فرض اینکه رخ دهد) فراتر از پایان دوره پیگیری است. این وضعیت اغلب سانسور درست نامیده می شود. سانسور همچنین می تواند رخ دهد اگر ما وجود یک حالت یا شرایط را مشاهده کنیم اما ندانیم از کجا شروع شده است.
به عنوان مثال، مطالعه ای را در نظر بگیرید که زمان عود سرطان را پس از برداشتن تومور اولیه با جراحی بررسی می کند. اگر بیماران 3 ماه پس از عمل جراحی برای تعیین عود معاینه می شدند، در آن صورت افرادی که عود داشتند، مدت زمان بقای خود را سانسور می کردند زیرا زمان واقعی عود کمتر از 3 ماه پس از جراحی رخ می داد.
دادههای زمان رویداد همچنین ممکن است سانسور فاصلهای باشند، به این معنی که افراد وارد و خارج از مشاهده میشوند. به طور کلی، ویژگی سانسور به این معنی است که روش های خاصی برای تجزیه و تحلیل مورد نیاز است و نمی توان از روش های گرافیکی استاندارد کاوش و ارائه داده ها، به ویژه نمودارهای پراکنده استفاده کرد.
دادههای بقا به طور کلی بر اساس دو احتمال مرتبط، یعنی بقا و خطر، توصیف و مدلسازی میشوند. احتمال بقا (که تابع بازمانده نیز نامیده می شود) S(t) احتمال زنده ماندن یک فرد از مبدأ زمانی (مثلاً تشخیص سرطان) تا زمان مشخص t آینده است. این برای تجزیه و تحلیل بقا اساسی است زیرا احتمال بقا برای مقادیر مختلف t اطلاعات خلاصه مهمی را از زمان تا داده رویداد ارائه می دهد. این مقادیر به طور مستقیم تجربه بقای یک گروه مطالعه را توصیف می کنند.
خطر معمولا با h(t) یا λ(t) نشان داده می شود و احتمال این است که فردی که در زمان t تحت نظر است در آن زمان یک رویداد داشته باشد. به عبارت دیگر، نرخ رویداد آنی را برای فردی که قبلا تا زمان t زنده مانده است را نشان می دهد. توجه داشته باشید که برخلاف تابع Survivor که بر روی نداشتن رویداد تمرکز دارد، تابع خطر بر روی رویدادی که رخ می دهد تمرکز می کند و وسیله ای برای تعیین یک مدل بقا فراهم می کند. به طور خلاصه، خطر به نرخ رویداد (جاری) مربوط می شود، در حالی که بقا منعکس کننده عدم وقوع تجمعی است.
برخی از الزامات کلیدی برای تجزیه و تحلیل داده های بقا
سانسور روشهای استاندارد مورد استفاده برای تجزیه و تحلیل دادههای بقا با مشاهدات سانسور شده تنها در صورتی معتبر هستند که سانسور غیر اطلاعاتی باشد. به عبارت دیگر، کسانی که به دلیل از دست دادن پیگیری در یک مقطع زمانی معین سانسور می شوند، باید به اندازه افرادی که در مطالعه باقی می مانند، رویداد بعدی را تجربه کنند.
سانسور اطلاعاتی ممکن است زمانی رخ دهد که بیماران به دلیل سمیت دارو یا بدتر شدن وضعیت بالینی از یک کارآزمایی بالینی خارج شوند. روش های استاندارد برای تجزیه و تحلیل بقا زمانی که سانسور اطلاعاتی وجود دارد معتبر نیستند. با این حال، زمانی که تعداد بیماران از دست رفته برای پیگیری کم باشد، احتمالا سوگیری بسیار کمی از اعمال روشهای مبتنی بر سانسور غیر اطلاعاتی ایجاد میشود.
مدت زمان پیگیری به طور کلی و طراحی یک مطالعه بر نحوه تجزیه و تحلیل آن تأثیر می گذارد. مطالعات زمان تا رویداد باید پیگیری کافی برای ثبت رویدادهای کافی و در نتیجه اطمینان از وجود قدرت کافی برای انجام آزمون های آماری مناسب داشته باشد.
طول پیشنهادی پیگیری برای یک مطالعه آینده نگر اساسا بر اساس شدت بیماری یا پیش آگهی شرکت کنندگان خواهد بود. به عنوان مثال، برای یک کارآزمایی سرطان ریه، پیگیری 5 ساله بیش از اندازه کافی خواهد بود، اما این مدت پیگیری تنها نشانه کوتاه مدت تا میان مدت زنده ماندن بیماران سرطان پستان را نشان می دهد.
شاخص طول مدت پیگیری، میانگین زمان پیگیری است. در حالی که این در تئوری می تواند به عنوان میانگین زمان پیگیری همه بیماران در نظر گرفته شود، بهتر است از پیگیری در میان افراد با داده های سانسور شده محاسبه شود. با این حال، هر دوی این روش ها تمایل به دست کم گرفتن پیگیری دارند.
کامل بودن پیگیری هر بیمار که رویدادی نداشته باشد، میتواند در آنالیز بقا تا زمانی که در آن سانسور میشود، وارد شود، اما کامل بودن پیگیری همچنان مهم است. پیگیری نابرابر بین گروههای مختلف، مانند گروههای درمانی، ممکن است باعث سوگیری در تحلیل شود. شمارش ساده شرکت کنندگان از دست رفته در پیگیری یکی از شاخص های ناقص بودن داده ها است، اما ما را در مورد زمان از دست رفته آگاه نمی کند و معیار دیگری پیشنهاد شده است (کلارک و همکاران، 2002).
نیاز به تجزیه و تحلیل بقا با تنظیم متغیرهای کمکی
هنگام مقایسه درمانها از نظر بقا، اغلب معقول است که عوامل مرتبط با بیمار را که به عنوان متغیرهای کمکی یا مخدوشکننده شناخته میشوند، تنظیم کنیم، که به طور بالقوه میتوانند بر زمان بقای بیمار تأثیر بگذارند. برای مثال، فرض کنید علیرغم تصادفی شدن درمان در کارآزمایی سرطان ریه، بیماران مسنتر اغلب به گروه پرتودرمانی اختصاص داده میشوند.
این گروه پیش آگهی اولیه بدتری خواهد داشت و بنابراین تجزیه و تحلیل ساده ممکن است اثربخشی آن را در مقایسه با درمان ترکیبی، که به عنوان مخدوش کننده بین درمان و سن نامیده می شود، دست کم گرفته باشد. همچنین، ما گاهی می خواهیم توانایی پیش آگهی عوامل مختلف را بر بقای کلی تعیین کنیم.
تجزیه و تحلیل بقا مجموعه ای از روش های آماری برای تجزیه و تحلیل داده ها است که در آن متغیر نتیجه مورد علاقه زمان تا وقوع یک رویداد است. به دلیل سانسور (عدم مشاهده رویداد مورد علاقه پس از یک دوره پیگیری) نسبتی از زمان بقای مورد علاقه اغلب ناشناخته خواهد بود.
فرض بر این است که آن دسته از بیمارانی که سانسور می شوند، چشم انداز بقای مشابهی با بیمارانی دارند که همچنان دنبال می شوند، یعنی سانسور غیر اطلاعاتی است. داده های بقا به طور کلی بر اساس دو تابع مرتبط، تابع بازمانده و تابع خطر، توصیف و مدل سازی می شوند. تابع بازمانده نشان دهنده احتمال زنده ماندن یک فرد از زمان پیدایش تا مدتی فراتر از زمان t است. این به طور مستقیم تجربه بقای یک گروه مطالعه را توصیف می کند و معمولا با روش KM برآورد می شود. آزمون لوگرانک ممکن است برای آزمایش تفاوت بین منحنیهای بقا برای گروهها، مانند بازوهای درمانی استفاده شود.
تابع خطر، پتانسیل آنی وقوع یک رویداد را در یک زمان، با توجه به بقا تا آن زمان، می دهد. این در درجه اول به عنوان یک ابزار تشخیصی یا برای تعیین یک مدل ریاضی برای تجزیه و تحلیل بقا استفاده می شود. در مقایسه درمانها یا گروههای پیشآگهی از نظر بقا، اغلب لازم است عوامل مرتبط با بیمار را تنظیم کرد که به طور بالقوه میتوانند بر زمان بقای بیمار تأثیر بگذارند. عدم تنظیم عوامل مخدوش کننده ممکن است منجر به اثرات جعلی شود. تجزیه و تحلیل بقای چند متغیره، شکلی از رگرسیون چندگانه، راهی برای انجام این تعدیل ارائه می دهد.
همچنین بخوانید:
کارآموزی سیستم بیولوژی: R و آنالیز داده های میکرواری
نویسنده: مریم آقازاده