הקדמה: השימוש בנתוני עתק (ביג דאטה) נמצא בשלבים הראשוניים של חדירתו לעולם הרפואה. מחקר של נתוני עתק מאפשר ניתוח (אנליזה) היקפים גדולים מאוד של נתונים כדי למצוא בהם חוקיות סטטיסטית וקלינית. אבחנת סרטן הכרכשת מוחמצת במקרים רבים עקב העובדה שאנשים רבים מעל גיל 50 שנים נמנעים מביצוע בדיקת הסקירה של דם סמוי.
מטרות ושיטות: במכון המחקר של מכבי פותחה שיטה לזיהוי מקרים אלה על ידי ניתוח של נתוני עתק של ירידת רמות ההמוגלובין והמטוקריט, עדיין בתחום הערכים הנורמאליים, שנים לפני הזיהוי הקליני. שיטה זו (הקולונסקור) נמצאה מדויקת ויעילה בזיהוי מוקדם של סרטן הכרכשת בחולים שהחמיצו את בדיקת הדם הסמוי בצואה.
מפרשת החולה: בפרשת החולה במאמרנו מדווח על גבר בן 70 שנים שאובחן בסרטן הכרכשת, לאחר שהחמיץ את כל בדיקות הסקירה לדם סמוי בצואה. עיון בתיקו גילה שרמות ההמוגלובין שלו ירדו במשך שלוש שנים שקדמו לאבחנה, אם כי נותרו בתחום הנורמה. שימוש בנתוני עתק עם מספר גדול של חולים עם סרטן הכרכשת במכבי ובבריטניה הביא ליצירת ואישוש אלגוריתם שיכול לגלות סיכון לסרטן הכרכשת לפי ספירות הדם שנעשו שנים לפני האבחנה הקלינית.
דיון וסיכום: שימוש באלגוריתמים סטטיסטיים מתוחכמים המסוגלים "ללמוד" כמויות אדירות וסוגים שונים של נתונים בשיטות לימוד מכונה (machine learning). העושר העצום של מאגרי המידע הרפואיים הדיגיטליים בישראל בשילוב עם חוקרים העוסקים בפיתוח אלגוריתמים מורכבים מעמידים את ישראל בחזית המחקר העולמית. כבר כיום, מיושם הקולונסקור במכבי לניבוי סרטן הכרכשת המסייע באיתור מוקדם של חולים בעלי פוטנציאל מוגבר לממצאים ממאירים. בשנתיים הראשונות להפעלתו ברמת רופא המשפחה זוהו מעל לחמישים מקרי סרטן הכרכשת בעקבות הקולונסקור, יותר מאשר בבדיקת דם סמוי בצואה.