איך להפוך נעלמים לשימושיים בבניית מודל ניבוי למגיפות עתידיות- וליהנות מזה

איך להפוך נעלמים לשימושיים בבניית מודל ניבוי למגיפות עתידיות- וליהנות מזה

מאת: אחוה יאלר צוריה, מידענית

לא יצא לי לכתוב כבר די הרבה זמן. אני מניחה שזה דבר חיובי בסך הכל כי הייתי עסוקה בעבודה אמיתית, חשובה ונהדרת. 

שנת 2020 הייתה שנה.. מלאת אירועים. פתחתי את העסק שלי ב-5 לינואר 2020. ככה שאני חוגגת עסקולדת השבוע. זאת גם לא הייתה השנה הכי טובה לפתוח בה עסק, כי מרבית הזמן ישבנו כולנו בבית, מפוחדים וחוששים לעתידנו, עבודה לא הייתה דבר שהיה קל להתרכז בו. אני לא יודעת איך תראה 2021, ובסך הכל הצבנו רף די נמוך, אבל נכון לעכשיו- השחקנית הראשית מהפרקים הקודמים- הקורונה, עדיין איתנו.

חורף קורונה
אחח אין על החורף.. שוקו חם, מסכה מבד מפנק, ואורות מרצדים על רקע לבן שלוג

כתבתי כבר די הרבה על הקורונה באופן ספציפי, ועל אינפודמיות באופן כללי, מושג שהגעתי אליו מעצם העיסוק בנתוני הוירוס. עד כה היה לי ברור שיש בעיה מרכזית ומאוד משמעותית בהתייחסות רצינית לנתונים שמדווחים מרחבי העולם. ולא. לא מדובר בסילוף נתונים בהכרח. הבעיה המרכזית היא שונות רבה מידי במשתנים המתערבים האחרים שיש לכל מדינה כשעולה הצורך לחשב את חומרת המחלה.

עד כמה מסוכנת הקורונה

הדרך בה מחשבים את חומרת המחלה היא באמצעות נוסחה פשוטה שמחלקת את מספר הנפטרים מהמחלה, במספר החולים במחלה, וכופלת ב-100. האחוז שמתקבל הוא הסיכוי של המחלה להרוג את החולים בה (Infection Fatality Ratio, או IFR). 

ה-IFR של וירוס הקורונה הוא 0.36% (ללא שכלול גיל האוכלוסייה. עם שכלול זה 0.35%). כלומר, 0.35% מתוך אלו שאומתו כחולים, ימותו. ה-IFR של השפעת העונתי 0.039%.

אך הציון הזה מעט שטחי. קיימים שלל משתנים מתערבים כמו גיל האוכלוסייה, בריאות התושבים במדינה, איכות הרפואה, וכדומה, שיכולים להשפיע על כמות הנפטרים ממנה. המשתנים האלו אינם מתבטאים באופן דומה בין מדינות, והשונות הזו יכולה להשפיע על הנוסחה מה שיוצר סיכון שונה לאותה מחלה במדינות שונות.

זאת בעיה, מאחר והנתון הסופי שמתקבל באופן גורף לכלל העולם עלול להוביל אותנו לקבל החלטות שלא מתאימות לנתונים בשטח במדינה שאנו חיים בה, כמו להטיל סגר מיותר ולפגוע בכלכלה מצד אחד, או להעריך את סיכון המחלה לאוכלוסייה במדינה נתונה באופן חסר ולסכן אלפים במוות שיכולנו למנוע.

אבל בואו נסתכל על זה הפוך

כאמור, מדובר בבעיה. אך השבוע קמתי בוקר אחד עם פרספקטיבה אחרת. הנתונים השונים בכל מדינה הם עובדות, ומספרי הנדבקים והמתים מהווירוס, הם עובדות (כן, גם אם אנחנו לוקחים בחשבון את הדיווחים הבעייתים על חולים ועל נפטרים שייתכן ומתו בנסיבות אחרות לחלוטין). כלומר, יש לנו את הנתונים היבשים האלו, ואיתם אנחנו יכולים לנסות לתת ציון בכל מדינה לבריאות התושבים ולבריאות מערכת הבריאות.

ציפור מבולבל
מה קראתי עכשיו

קצת מסובך. אני צריכה שתישארו איתי רגע.

העובדה היא שמערכות הבריאות בכל מדינה שונה, והבריאות הבסיסית של התושבים משתנה. התמודדות עם הקורונה תלויה במידת מה גם בגיל התושבים, באופן בו הם מתמודדים עם מחלות ויראליות, וכיצד מערכת הבריאות מסוגלת לטפל בחולים רבים ולשמור על רפואת חירום ורפואת שגרה במצב מתפקד.

אם אנחנו מניחים שבריאות התושבים בשגרה, בשנה ללא מגיפה עולמית, היא גורם משפיע על תמותה בזמן מגיפה, ואם אנחנו מניחים שיציבות ויעילות מערכת הבריאות באותה מדינה יכולות להשפיע על אופן הטיפול במגיפה- אנחנו יכולים לתת לכל מדינה ציון תקן לבריאות התושבים ולבריאות מערכת הבריאות. ציוני התקן, אם נכניס אותם למשוואה הדמיונית שלנו יוכלו לעזור לנו לנבא כמה אנשים ימותו בהינתן חומרת מגיפה מסוכנת כמו הקורונה, או יותר. 

הרעיון הוא להשתמש בנתונים שיש לנו משנת 2018-2019, ולהשוות את שיעורי התמותה מהשפעת העונתית, לשיעורי התמותה מווירוס הקורונה. הפער בין שני האחוזים יוסבר בחלקו מחומרתה המוגברת של הקורונה, אך ייתכן והיא לא תוכל להסביר את כל הפער. שארית הפער בין אחוזי התמותה משפעת עונתית לתמותה מקורונה שלא נובעים מחומרת המחלה המוגברת, הוא חסינות האוכלוסייה ויציבות מערכת הבריאות.  

בטח שאפשר דוגמה לרעיון הזה. בכיף. עליי.

ייתכן ובמדינה שבה הנתונים ממוות קורונה דומים לאחוזים של תמותה משפעת עונתית (נניח במשתני הגיל, מחלות רקע, מגדר, מצב סוציו אקונומי) בריאות התושבים ומערכת הבריאות היא במצב יחסית טוב. מדינה בה תושבים מתים כשהם צעירים יותר, ללא מחלות רקע, ובכמויות, יכולה להעיד על כך שהבריאות הבסיסית של התושבים היא נמוכה, ושמערכת הבריאות אינה מסוגלת להתמודד עם מחלות ויראליות ולהמשיך לתפקד כמו שצריך, ואינה מספקת טיפול ראוי לתושבים באותה מדינה. אם יש לנו מדינה שבה נפטרו מקורונה פי עשרים יותר מאשר משפעת עונתית, והמסוכנות של קורונה היא רק פי 10 יותר משפעת עונתית, יש לנו פער מסוים שיכול לנבוע ממשתנים מתערבים.

מתודולוגיה פוטנציאלית

בשלב הזה מדובר בתיאוריה. הדרך לבחון אותה היא לאסוף נתונים מכמה מדינות (התפלגות דמוגרפית של נפטרים משפעת עונתית והתפלגות דמוגרפית של נפטרים מקורונה), לחשב את הפער בין הנתונים פחות החומרה המוגברת של הקורונה, ולגלות את הביתא (𝞫) שיסביר את שאר הפער. אחר כך ניתן יהיה ליצור נוסחה, להריץ אותה עבור מדינות שאספנו רק את נתוני התמותה משפעת עונתית עבורן, ולראות אם אנחנו מצליחים לקלוע נכונה למספר הנפטרים מקורונה. אם הצלחנו, יש לנו פה מודל ניבוי. אפשר להכניס אליו נתון של מגיפה דמיונית עם IRF של 10%, ולראות כמה אנשים ימותו ממנה בהינתן בריאות התושבים ובריאות מערכת הבריאות בכל מדינה.


אם נשארתם עד כאן, אתם כנראה מסוקרנים לפחות כמוני לגלות מה יעלו הנתונים. התחלתי במלאכת איסוף הנתונים, משימה טיפה מורכבת וכוללת נבירה בדוחות בריאותיים ממגוון מדינות במגוון שפות, וייתכן וזה ייקח קצת זמן. מבטיחה לעדכן בכל שלב.

One Reply to “איך להפוך נעלמים לשימושיים בבניית מודל ניבוי למגיפות עתידיות- וליהנות מזה”

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *