كيف يتم تحديد القيمة الاحتمالية في تحليل مسار IPA؟

IPA (Ingenuity Pathway Analysis) یقوم بحساب قیمة P باستخدام التحلیل الإحصائي. قیمة P هي مؤشر يقیم ما إذا كانت البیانات المراقبة تحصل بشكل إحصائي على مقارنتها بما يمكن الحصول علیه بالصدفة في الظروف العشوائیة.

Table of contents

مسار التحليل التفصیلي للمسار
كیف یتم تسجیل المسار؟
ما هو اختبار التبادل؟
كيفية حساب قيمة P؟

مسار التحليل التفصیلي للمسار

یتم حساب قیمة P في تحلیل المسار باستخدام الخطوات التالیة:

معالجة البیانات الداخلیة: یتم إدخال البیانات الحیویة الخام مثل بیانات تعبیر الجینات وتعبیر البروتینات إلخ لتحلیل المسار.
اختیار المسار: یتم اختیار المسار الحیوی الذي یهم التحلیل، على سبیل المثال، مسارات انتقال الإشارة أو المسارات الأيضیة المرتبطة بداء معین.
تسجیل المسار: یتم حساب درجة أهمیة الجینات والبروتینات المشمولة في المسار المختار. ویتم ذلك باستخدام تحلیلات مثل تحلیل التعبیر التفاضلي لبیانات تعبیر الجینات أو تحلیل التغیر في تعبیر البروتینات وغیرها.
اختبار التبادل: بناءً على درجات الجینات والبروتینات في المسار، ننشئ مجموعة بیانات عشوائیة. یتم بناء مجموعة البیانات العشوائیة هذه على الحفاظ على خصائص البیانات الداخلیة ولکن بتخصیص عشوائي لدرجات الجینات والبروتینات.
حساب قیمة P: باستخدام مجموعة البیانات العشوائیة التي تم إنشاؤها بواسطة اختبار التبادل، ننشئ توزیعًا عشوائيًا للدرجات. بعد ذلک، نقوم بتقییم موقع الدرجة المراقبة في هذا التوزیع العشوائي، ومن ثم نقوم بحساب قیمة P. قیمة P تُظهر احتمال حصول الدرجة المراقبة بالصدفة في التوزیع العشوائي.

كلما کانت قیمة P أقل، کلما کانت احتمالیة الحصول على الدرجة المراقبة بالصدفة أقل. عموما، إذا كانت قیمة P أقل من 0.05 (غالباً أقل من 0.01)، یعتبر ذلك إحصائیًا معنويًا. في هذه الحالة، یعتبر وجود ارتباط حیوی ذا معنی بالفعل، لأن احتمال الحصول على الدرجة المراقبة بالصدفة هو منخفض جدا.

كیف یتم تسجیل المسار؟

في تسجیل المسار، نقوم بتقییم أهمیة الجینات من خلال ترقیمها وتقییمها عددیًا.

کمثال محدد، لنفترض وجود ثلاثة جینات مرتبطة بمسار ما (A، B، C)، ومستوى تعبیر كل منها کما یلی:

مستوى تعبیر الجین A: 10 مستوى تعبیر الجین B: 5 مستوى تعبیر الجین C: 8

في هذه الحالة، نحسب ترقیم الجینات بناءً على مستوى تعبیرها، ولنفترض تقییمها على مقیاس من 0 إلى 10. یحصل الجین A على أعلى مستوى تعبیر، لذلك یحصل على 10 نقاط. الجین B لدیه مستوى تعبیر متوسط، لذلك یحصل على 5 نقاط. الجین C لدیه أيضا مستوى تعبیر عالی، لذلك یحصل على 8 نقاط.

ثم نقوم بتحقیق تسویة لهذه النقاط. على سبیل المثال، لنفترض أننا نقوم بتحویلها إلى نطاق من 0 إلى 1. في هذه الحالة، سیكون لدى الجین A القیمة 1.0، الجین B القیمة 0.5، والجین C القیمة 0.8.

باستخدام هذه الطریقة، یمكننا تقییم نقاط الجینات داخل المسار وبالتالي تقییم أهمیتها ودورها ضمن المسار.

ما هو اختبار التبادل؟

في اختبار التبادل، نقوم بترتیب البیانات عشوائیًا لإجراء التحلیل الإحصائي. یتنبأ هذا الترتیب العشوائي بالنتائج التي قد تحصل علیها البیانات عندما تكون في حالة عشوائیة.

عندما نعرف تعبیر الجین A والجین B من بیانات المرضى، مثلاً، ونود تقییم ما إذا كانت هذه الجینات تشارك في المسار X، فيمكننا إجراء اختبار التبادل على النحو التالي:

تجهيز البيانات: استخراج بيانات تعبير الجين A وتعبير الجين B من بيانات المرضى.
تقييم جين التسجيل: إعطاء تقييم لكل جين من جين A وجين B باستخدام بيانات تعبير الجين A وتعبير الجين B. قد يتم ضبط طريقة حساب التقييم بناءً على مستوى تعبير الجين وأهميته.
الاستعداد لاختبار التبادل: تحضير بيانات تقييم جين A وجين B لاختبار التبادل.
تنفيذ التبادل: ترتيب بيانات تقييم جين A وجين B عشوائيًا وتنفيذ اختبار التبادل. يتيح ذلك التبادل التنبؤ بالنتائج التي قد تكون مرتبطة بجين A وجين B في حالة عشوائية.
تكرار التبادل: تكرار التبادل عدة مرات لإنشاء مجموعة من مجموعات البيانات العشوائية. عادة ما يتم تنفيذ آلاف التكرارات.
تقييم النتائج: مقارنة البيانات الأصلية مع مجموعات البيانات العشوائية التي تم الحصول عليها من خلال اختبار التبادل. يتم تقييم موقع تقييم جين A وجين B في مسار X إحصائيًا عن طريق التحقق من موقعهما ضمن مجموعات البيانات العشوائية.

من خلال اختبار التبادل، يمكن تقييم ما إذا كانت للجين A والجين B ترابط إحصائي مع مسار X. يمكن بذلك التحقق إحصائيًا مما إذا كان جين معين مشاركًا في مسار محدد أم لا.

كيفية حساب قيمة P؟

بعد تنفيذ اختبار التبادل، يتم تقييم موقع البيانات الأصلية ضمن مجموعات البيانات العشوائية.
لتقييم ذلك، يتم حساب الإحصائيات الخاصة بالبيانات الأصلية (على سبيل المثال، الفرق المطلق بين تقييم جين A وتقييم جين B أو معامل الارتباط وما إلى ذلك).
يتم حساب نسبة الحصول على الإحصائيات الأصلية في مجموعات البيانات العشوائية التي تم الحصول عليها من اختبار التبادل.
هذه النسبة تُعد قيمة P. قيمة P تُظهر احتمالية الحصول على الإحصائيات الأصلية بشكل عشوائي.

على سبيل المثال، لنفترض حساب الفرق المطلق بين تقييم جين A وتقييم جين B.

تنفيذ اختبار التبادل عن طريق ترتيب بيانات تقييم جين A وتقييم جين B عشوائيًا.
حساب الفرق المطلق بين تقييم جين A وتقييم جين B في البيانات الأصلية.
عد مرات الحصول على الفرق المطلق في مجموعات البيانات العشوائية التي تم الحصول عليها من اختبار التبادل.
قسمة هذا العدد على عدد تكرارات اختبار التبادل لحساب النسبة.

قيمة P تُظهر احتمالية الحصول على الفرق المطلق في البيانات الأصلية بشكل عشوائي. وكلما كانت قيمة P أصغر، زادت احتمالية عدم حصول البيانات الأصلية بشكل عشوائي. في الاختبار الإحصائي، عند مقارنة قيمة P بمستوى الدلالة المحدد (عادةً 0.05 أو 0.01)، إذا كانت قيمة P صغيرة، يُعتبر النتيجة إحصائيًا ذات دلالة.

هذا هو مثال لطريقة حساب قيمة P. بواسطة هذه الطريقة، يمكن تقييم نتائج اختبار التبادل إحصائيًا وحساب احتمالية الحصول على البيانات الأصلية بشكل عشوائي.

على سبيل المثال، توضح الشكل النتائج بشكل مبسط.