אוי לא נגמר הדאטה- מחשבות על מגבלות המשאבים המתכלים של עולם הטכנולוגיה

בזמן שכולם סביבי רוכבים על בועת ה-AI ומפיצים שמועות מרחיקות לכת על קפיצות גדילה מרשימות של מודלים מבוססי שפה, ופריצות דרך משמעותיות שמתבדות כל יומיים, והעיתונים מתפקעים מכותרות מפוצצות שמכילות אזהרות חמורות על העתיד המתקרב בו בוטים ייקחו את מקומות העבודה שלנו– אני מוצאת את עצמי במחנה היותר סקפטי.

זה לא שאני מניחה שבני אדם תמיד יהיו נעלים על הטכנולוגיה, ושאין מצב שאנחנו מוצאים את עצמנו בעולם פוסט אפוקליפטי נטו בגלל ההתפתחות הטכנולוגית הספציפית הזו- פשוט לפי הכיוון שדברים הולכים אליו והמסגרת בה אנחנו עובדים- יש סיכוי שזה יראה מאוד שונה ממה שמוכרים לנו, פשוט כי שכחנו את העובדה הקטנטנה אך המאוד משמעותית- המשאבים שלנו מוגבלים.

האם בוטים חולמים על תקרות זכוכית?

כאמור, השיח על AI מתקיים כאילו בעולם מקביל בו אין הגבלות ואין גדרות ואין משאבים סופיים- עולם אקספוננציאלי שרק ממשיך לגדול ולהתרחב ולהתפתח ככל שהזמן עובר. שזה מיינדסט קפליטליסטי נהדר שמאוד עזר לדור שלם של מילניאלס לשקוע בדיכאון קיומי עוד לפני משבר אמצע החיים.

מסתבר שאני לא יכול להיות כל מה שאני רק יכול לחלום עליו, או לממן קניות בסופר

בפועל, העולם הדיגיטלי אינו מנותק באופן מוחלט מהעולם הפיזי. זה משהו שאנחנו צריכים לזכור ולקחת בחשבון גם בדיונים אחרים, כמו למשל בסוגיית הבריאות הנפשית והפיזית שלנו והאופן בו היא מושפעת מההרגלים הדיגיטליים שלנו. גם הניתוק של הזהות הדיגיטלית שלנו מהקיום הביולוגי-פיזי שאנחנו מתחזקים היא סוגייה שיש להכביד ראש בה. אבל איכשהו, בעוד כל הנושאים האלה קלים יחסית לעיכול וחיבור למציאות, המחשבה על כך שמודלים של AI ובוטים מעוגנים בסופו של דבר לעולם הפיזי ותלויים בו, היא קצת פחות אינטואיטיבית. התלות הזאת מתבטאת בכמה רבדים משמעותיים שמציבים חסמים וגבולות להתפתחות האינסופית של הצעד הגדול הטכנולוגי הבא.

גם בוטים מושפעים ממשבר האקלים

בעוד AI מג'נרט תמונות של גרטה טונברי על חסקה עם סלבס כאילו פתרנו את כל משבר האקלים, ארה"ב הולכת לצמצם את מעורבתה בארגונים ומדיניות סביבתית, ואנחנו צופים במו עניינו בשינויי אקלים קטלניים– המחשבה על ההשפעה על הבוטים שמקיפים אותנו היא ככל הנראה האחרונה בסדר העדיפויות. להיפך, ייתכן ובעתיד נראה מודלים חכמים משמשים דווקא לפתרון או חיזוי של אסונות טבע מה שיאפשר הכנה מוקדמת ופרואקטיביות בפתרון של בעיות פוטציאליות משינויי האקלים. הנדסת אקלים היא לא מדע בדיוני בשלב הזה של ההתפתחות הטכנולוגית שלנו, ואפשר רק לקוות שהיא תשמש את האנושות בצורה חיובית לפחות חלק מהזמן.

מצד שני, מי השתייה וכיבוי השריפות מוסתים באופן תדיר אל עבר חוות שרתים לקירור מחשבי המודלים, ושנהרות מוסתים ממסלולם ומרוקנים על מנת לענות לדרישה המוגברת של החוות הללו ככל שהזמן עובר מה שיפגע בעיקר במדינות מתפתחות. כל שאילתא קצרה ומיותרת בצ'אט ג'יפיטי "עולה" לפלנטה שלנו בזיהום נוסף שבאמת לא היינו צריכים. העומס על צריכת החשמל משפיעה על האופן בו אנחנו מייצרים חשמל, ולמרות הפתרונות הירוקים הקיימים, רוב ייצור החשמל עדיין מזהם. בשלב הזה המושפעים העיקריים פה הם עדיין בני האדם, המערכת האקולוגית שסביבם (חיות, צמחים), והמשאבים המתכלים שיש לנו על כדור הארץ.

אבל מה יקרה בהמשך? נניח שבני אדם עוברים לשתות בוץ ולאכול חרקים ששרדו שואה גרעינית, כל זה בשביל לאפשר לבוטים חוות שרתים קרירות ונעימות לרווחתם. לאחר שכדור הארץ ירוקן ממשאבים טבעיים לתמיכה בחשמל ומים באופן שוטף- הגדילה הפוטנציאלית של המודלים תיעצר. השרתים יתחממו יתר על המידה, החשמל יקרוס, רשתות האינטרנט עליהם המודלים מסתמכים יתפרקו, המזבלה שמעופפת סביבנו בחלל תחסום את שירותי האינטרנט הלוויני, וממש כמו בני האדם הגשמיים והמגושמים- גם המודלים החכמים יגיעו לנקודת קצה.

"אמא הבטחת לנו דאטה לשבת"

המשאב העיקרי שאותו זוללים המודלים הוא דאטה. המנגנון של חילוף החומרים האלגוריתמי הוא די פשוט בהגיון הבסיסי שלו- יש מאגר נתונים מעובדים, המודל רץ עליהם, מנתח אותם לפי קוד שהוגדר לו מראש, ומוציא פלט שמסתמך על התוכן שהוא אכל. האם AI יכול לייצר אבן שהוא לא נתקל בה בתוך מסד הנתונים שהוא מבוסס עליו? התשובה היא לא. הוא לא יכול, כי לא באמת מדובר באינטיליגנציה מלאכותית, שמסוגלת לחשיבה יצירתית ופורצת גבולות. אפשר להתווכח ולהגיד שכל הרעיונות האנושיים גם הם מבוססים על משהו שהם ראו או חוו לפני כן, פשוט הם הצליחו לייצר זווית יצירתית לעיבוד של הנתונים הקיימים. זאת שאלה פילוסופית ברמה מסוימת, שאני אישית לא לגמרי בטוחה מה העמדה שלי לגביה. אני נוטה להאמין שרעיונות יצירתיים כוללים בתוכם גרעין ממטי מסוים, אך שהרבדים שבני אדם מעמיסים על אותו גרעין הם מוטיציה מאוד מפותחת שלו, שתלויים באינטראקציה עם הסביבה שלהם, סקרנות והשערות לגבי מורכבויות עתידיות אפשריות, וקמצוץ של חוש הומור.

העניין הוא כזה- על מנת שמודלים של AI יהיו מסוגלים להמשיך להתפתח ולהפוך למתוחכמים יותר ויותר, הם זקוקים ליותר ויותר דאטה במסדות התזונתיים שלהם. מאחר והם מסוגלים לעכל נתונים רבים בזמן קצר, המלאי העולמי של נתונים שמיוצרים כיום פשוט לא מספיק כדי לתחזק את הגדילה האקספוננציאלית שלהם.

מרבית הנתונים מגיעים מהרשת הפתוחה. מה היא הרשת הפתוחה? האחוז הקטנטן של האינטרנט שחשוף לכל- רשתות חברתיות, אתרי מידע וחדשות, אתרים עסקיים של ארגונים וחברות, מאמרים פתוחים, מאגרים נגישים לכל וכן הלאה. המודלים אוכלים את הנתונים האלה במהירות בלתי נתפסת, והם לא שבעים.

אחת מהבעיות שרשתות חברתיות רבות נתקלות בהן הוא שבוטים קצת.. איך נגיד את זה.. מבריחים אנשים אנושיים. כשטמבלר הוצפה בבוטים והמשתמשים התאגדו כדי לנקות אותה, השנה הייתה 2017. הפלישה הבוטית ניצחה בסופו של דבר, והתרחבה גם לרדיט (בעזרתו המאוד נדיבה של ספאז המנכל של רדיט), וכיום אנחנו רואים את ערימות הבוטים בפייסבוק וב-X. ישנם עמודים שלמים שמנוהלים על ידי בוטים, התגובות והשיתופים הם של בוטים, וכל התוכן המוצג הוא קיא של AI. כשאנשים (שהם לא בומרים, סליחה) צופים בתאונת רכבת כזאת, שלרוב מאוד מחמיאה למנהלי הרשתות החברתיות כי הטראפיק גדל והמניות יכולות לטפוח, יש נטייה להסתובב ולחפש משהו אחר. העין האנושית שהתפתחה לאורך האבולוציה לזהות את ה-uncanny valley עובדת כעת שעות נוספות ומצליחה לזהות בקלות פרסומות, בוטים, תוכן ממומן ומג'ונרט, ושיחות מזוייפות. אנשים צעירים- למשל, הבנות שלי מדור האלפא, כל כך מושחזות במיומנות הזאת, שנכון לעכשיו אין מודל AI שיצליח להתגנב ולהעמיד פנים שהוא אנושי סביבן.

אבל זו רק המנה הראשונה

המנה הבאה יכולה להיות הרשת הסגורה- כל אותם נתונים שמתקיימים בחשבונות פרטיים שסגורים מאחורי סיסמאות, חשבונות מיילים פרטיים, מאגרים ממשלתיים חסויים, וחומות תשלום כאלה ואחרות. בעלי המודלים עושים כל שביכולתם לרכוש בכסף את הגישה לנתונים האלה כדי להאכיל את המודלים הרעבים שלהם. רכישה של נתונים מנטפליקס, וויקיפדיה, גוגל, מאגרי DNA של חברות ריצוף גנטי, ודאטה רפואי מקופות חולים- כל אלו הם היעד הבא של בעלי המודלים. זהב נוצץ ומלא פוטנציאל. אך גם כאן ישנה בעיה אינהרנטית- המידע והנתונים שקיימים, על אף הכמות שלהם, אינם בהכרח התזונה הבריאה ביותר עבור המודלים. כלומר- הנתונים שם, חלקיים. לא כל המדינות עושות שימוש במידע דיגיטלי כל כך (למשל, גרמניה). לא כל המידע שלנו מנוהל בצורה אחידה שמאפשרת הזנה של מודלים מבניים (רק במערכת החינוך יש מעל 70 מערכות שונות שמטפלות במידע בניסוחים ובהבנייה שונה לחלוטין). ובעיקר- כמות המידע הלא נגיש הפוטנציאלי הוא עדיין לא מספיק כדי להשביע מודל רעב.

מה הקינוח?

נתונים שעדיין לא עברו דיגיטציה. ההשערה שלי היא שבעתיד הלא כל כך רחוק, בני אדם יעודדו יותר ויותר, בהתחלה בהתנדבות ולאחר מכן ככל הנראה בכפייה, להעלות את המידע שלהם למערכות דיגיטליות במטרה להאכיל בוטים רעבים. ברגע ששדות הדאטה הקיימים ימוצו, והם ימוצו די מהר, עינם האדומה והמכנית של הבוטים תעבור להסתכל עלינו כבטריות לייצור דאטה שוטף.

ההבדל הוא שכדי שנייצר יותר ויותר דאטה צריך יותר ויותר אנשים, וצריך שיותר ויותר אנשים ישתפו את הנתונים האלה עם בעלי מסדות הנתונים באופן שוטף. כמות המידע שמייצר אדם יכולה להיות די גבוהה בסך הכל- נתונים פיזיים, מטא נתונים, גירויים מהסביבה, ניטור פולסים חשמליים במוח ובמערכת העצבים, חיבור לנתונים דמוגרפיים שמקיפים את הגוף הפיזי, ועוד ועוד. כל אחד מאיתנו הוא מכרה קטן של נתונים מאוד יקרים, וכדאי שנתחיל להסתכל על עצמנו ונבין שמי שמחזיק במידע הזה עלינו הולך להתעשר על חשבוננו. לא בהכרח שאיכות החיים שלנו תיפגע, להיפך, יכול להיות שהזרמה שוטפת של נתונים למערכות תספק לנו עתיד מגובה לחלוטין (טוב אם אנחנו רוצים אליבי לכך שהלב שלנו דפק במהירות רגילה ולא שיקרנו כששאלנו אותנו מי סיים את העוגה במקרר), או להשתמש באגרגציה של הנתונים האלו כדי לזהות מצבים מסכני חיים ולפעול לטפל בהם לפני שהם הורגים אותנו. כאנליסטית, קל מאוד למכור לי עתיד מהסוג הזה. הפרטיות שלי היא משנית בסדר העדיפויות שלי אם תרומת איברים של נתוני בדיקות הדם שלי יוכלו לסייע בפיתוח מענה לאנמיה לקהל הרחב. מצד שני, ההימור שלי היא שככל שהזמן יעבור פחות ופחות "ישאלו" אותנו אם אפשר להשתמש בנתונים שלנו ויותר ויותר נמצא את עצמנו מנסים להגדיר מחדש מי אנחנו מאחורי המספרים.

מי מעצב את כל הברדק הזה בכלל

וכאן הנקודה הנוספת שאני מקווה שתוכל לעודד מישהו. השימוש בנתונים, בין אם לצורך הזנה שוטפת של אלגוריתמים של בוטים לבצע כסף ובין אם למטרה מדעית חשובה שתטיב עם האנושות- תצריך הרבה שיחות פתוחות על אתיקה. נכון להיום יש סגמנטציה מאוד גדולה בין מי שבונה את המודלים ומי ששואל את השאלות הפילוסופיות עליהן. אנחנו לגמרי בשלב ה- "Can we?" ועוד לא לגמרי בשלב ה- "Should we?". יש זמן ומקום לכל דבר ואני בטוחה שזה יגיע. אבל נכון לעכשיו, אחד מהמשאבים המשמעותיים ביותר שחסרים ל-AI כדי להוות את הקפיצה הטכנולוגית הגדולה הבאה של האנושות הוא סטודנטים לפילוסופיה.

טוב, אולי לא סטונדטים-סטודנטים. אבל בוגרי מדעי הדשא

כמות האנשים שנכנסים לתחום הזה באופן רשמי הולך וקטן, מה שמייצר עבור המודלים תקרת זכוכית נוספת. פחות אנשים ששואלים שאלות פילוסופיות על מוסר ואתיקה בשימוש בנתונים= פחות הסכמות חברתיות שנובעות מתוך דיונים הכרחיים= יותר חסמים לאימוץ טכנולוגיה מעבר לדרגת ה- early adaptors= פחות נתונים להאכיל בהם את המודלים. כאשר מהנדסי אלגוריתמים מתמקצעים בניסוח מודלים ללא חבירה לאנשי צוות מהתחום ההומני והחברתי, הם בעצם מייצרים עבור עצמם נקודות עיוורות רבות שאין להם דרך לתת להם מענה בתוך המודלים עצמם ובסביבה שבה הם אמורים להתקיים. אם אנחנו מסכימים שה-AI לא חי בוואקום, ושהוא ניזון מאינטראקציות תכופות עם אנשים, רצוי שמתכנני המערכות האלו יכירו לעומק את טיבן של אותן אינטראקציות, ושהאנשים שצפויים לקחת חלק בהן יכירו לעומק את טיבם של המודלים.

מודלים שהופכים ליותר ויותר חצופים ככל שמשתמשים שפונים אליהם עושים שימוש בשפה לא מנומסת והפוך, היא אלמנט שיכול להרתיע ולהרחיק אינטראקציות פוטנציאליות נוספות (מעבר לנהוראי מכיתה ג' בשיעור מחשבים שממש מתלהב מלנסות להוציא קללות מצ'אט ג'יפיטי). מרביתנו רוצים להשתמש בכלים האלה לעבודה, לפרודקטיביות, לחשיפה לתוכן חדש, ולהגברת היצירתיות שלנו. לבני אדם יש חוקים עבור אינטראקציות שונות, וככל שאלו יהפכו למורכבות יותר- יהיה צורך ביותר ויותר פילוסופיים מחודדים שיאתגרו את תהליכי הלמידה הילדיים של הבוטים.

לסיכום- לא משנה עד כמה נעמיד פנים שעברנו סופית למימד הדיגיטלי ושמודלים מבוססי שפה יצילו אותנו, ישעבדו אותנו, או ישנו את כלל המהות האנושית- זה עדיין לא המצב. עד שלא נצליח להתגבר על הבעיות המהותיות שמחברות בין הדיגיטציה לעולם הפיזי, לא נוכל לראות קפיצה משמעותית. האתגרים האלו הם גדולים, נכון לפברואר 2025, אף חברה (אמריקאית או סינית) לא הצליחה לתת להם מענה אמיתי.

אם אתם מחפשים כמה המלצות צפייה שיורידו לכם את הייפ מ-AI באופן כללי, הנה כמה-

One Reply to “אוי לא נגמר הדאטה- מחשבות על מגבלות המשאבים המתכלים של עולם הטכנולוגיה”

פינגבאק: המלחמה בבוטים החלה- אמנים במרוץ חימוש נגד AI | נפקא

אוי לא נגמר הדאטה- מחשבות על מגבלות המשאבים המתכלים של עולם הטכנולוגיה

האם בוטים חולמים על תקרות זכוכית?

גם בוטים מושפעים ממשבר האקלים

"אמא הבטחת לנו דאטה לשבת"

אבל זו רק המנה הראשונה

מה הקינוח?

מי מעצב את כל הברדק הזה בכלל

פוסטים קשורים

פותחת חזית מול מגדל השן- והפעם: על הפוליטיקה שמאחורי המגזינים האקדמיים

האורגניזם החברתי ומערכת החיסון הקוגניטיבית

איך להפוך נעלמים לשימושיים בבניית מודל ניבוי למגיפות עתידיות- וליהנות מזה

One Reply to “אוי לא נגמר הדאטה- מחשבות על מגבלות המשאבים המתכלים של עולם הטכנולוגיה”

כתיבת תגובה לבטל