באחד הימים הלוהטים של חודש אוגוסט, בנסיעה יחסית ארוכה, היא התחילה להרגיש את כובד העפעפיים. הדרך נמתחה לפניה כמו רצועה עשויה אספלט. אחיזת ההגה התרשלה, והתשישות הורגשה עם כל קילומטר. בדיוק ברגע שבו תשומת הלב שלה החלה לנדוד - קול עדין של פעמונים הידהד במכונית ותאורת הדשבורד האירה, באופן שלכד מיד את הקשב שלה בחזרה. מבלי שידעה, טכנולוגיית זיהוי הרגשות המתקדמת (Emotion Detection) שהוטמעה במכונית הבחינה בשינויים העדינים שבהבעת הפנים שלה. ברגע המכריע הזה, המערכת זיהתה את הסימנים המטרימים של תשישות מסוכנת והתערבה כמו מלאך שומר. בקולה המרגיע, המכונית הציעה תחנות ריענון קרובות ושיטות נוספות לעורר מחדש את הנהגת, ולהבטיח שתגיע הביתה בחתיכה אחת.
בחשבון הסופי של העבודה על הכתבה הזאת אצטרך להשמיט את פסקת הפתיחה, מהסיבה הפשוטה שהיא לא נכתבה על ידי. זו התוצאה הראשונה ששלף מודל הבינה המלאכותית הפופולרי ChatGPT כשביקשתי ממנו שיכתוב עבורי פסקה שמדגישה את היתרונות שבשימוש בבינה מלאכותית בתוך תא הנהג, ובאופן ספציפי בטכנולוגיית "זיהוי רגשות" - יישום אחד קטן מתוך שלל היישומים האפשריים של AI בתעשיית הרכב (עוד עליה - בהמשך). בניכוי כמה קלישאות והתלהבות כללית מורגשת מהטכנולוגיה (בכל זאת - ביקשתי לעסוק ביתרונות שלה בלבד), אפשר להגיד שהמודל עשה עבודה די טובה בתיאור בסיסי של תרחיש נהיגה שלקוח מהעתיד הלא מאוד רחוק. עכשיו קחו את יכולות השפה האלה ודמיינו מה הן מסוגלות לעשות בשבילכם בדרכים.
בינה מלאכותית יוצרת (Generative AI) היא כנראה התחום המזנק והמדובר ביותר בשנה החולפת. על פניו, בין שלל יישומי AI שכן רלוונטיים לתעשיית הרכב (רשימה חלקית למדי כוללת מערכות ADAS, ניהול תחזוקת רכב, ניהול רמזורים חכם, מיפוי וניווט, סיוע בחניה, ניהול ושימור אנרגיה ואפילו זיהוי תבניות נהיגה מסוכנות ומניעת תאונות), אפשר היה לחשוב שבתחום הגנרטיבי - מלבד כתיבת קמפיינים ליצרניות רכב ואולי קצת גרפיקה שתעזור למעצבים לדמיין את מכוניות העתיד לטובת איזו פגישה עסקית - לזינוק הנוכחי בטכנולוגיה אין השפעה של ממש על התעשייה.
אבל האמת היא שמודלים של שפה רלוונטיים לחוויית הנהיגה הרבה יותר מכפי שנדמה לנו, וכבר עכשיו יש מי שבוחנים את גבולות הטכנולוגיה ואת היישומים האפשריים שלה בתוך מרחב המחיה של הנהג.
ההיסטריה סביב בינה מלאכותית יוצרת - ובהרחבה, בינה מלאכותית בכלל - כבר לא מאפשרת לנו לעצום עיניים ולהתנהג כאילו כלום לא קורה פה. נכון, המושג הזה מפומפם בתעשיות טכנולוגיות כבר יותר מעשור, הוא ממילא נופח כל כך עד שקשה לדעת מה יש מתחת, והרבה פעמים אין הרבה יותר מכמה מילות באזז שנועדו למשוך משקיעים ולהזרים כסף לסטארטאפים שהנגיעה שלהם לבינה מלאכותית מסתכמת באתר תדמית לא מבריק. ובכל זאת, הגל הנוכחי של ההתלהבות מגובש יותר ומבוסס יותר, משום שהוא מגיע עם יישומים ברורים, זמינים לשימוש, ולא פחות חשוב - הם חינם.
בתוך כמה חודשים של שיטפון AI נוצרה שפה חדשה: אנחנו מתקשרים עם המכונות באמצעות פרומפטים (הנחיות), מג'נרטים (יוצרים, מלשון Generate) איורים וטקסטים, ואז גם שוטפים את הרשתות החברתיות ב"יצירות" שלנו.
גם מקצוע חדש כבר נולד: מהנדסי פרומפטים הם מי שיודעים להפיק את המיטב ממודלים מלאכותיים ליצירה, ומשרות מהסוג הזה כבר אפשר למצוא בלינקדאין הקרוב לביתכם. בינתיים, כל מוצר שנוגע באזורים של עיצוב גרפי והפקת טקסט הספיק לשלב יישום כלשהו שמתבסס על המודלים האלה - רק כדי להצליח להישאר רלוונטי. אבל מנעד היישומים ממשיך להתפתח, והוא כולל גם כיוונים שלא בהכרח חשבנו עליהם מהרגע הראשון.
אבל עוד קודם, על מה בכלל מדברים כשמדברים על בינה מלאכותית יוצרת? דמיינו מטחנה שבקצה העליון שלה ניזונה מכמויות אדירות של טקסט דיגיטלי: כל מה שיש באינטרנט, פחות או יותר, מיצירות ספרותיות ועד דיונים בטוויטר, יכול תיאורטית למצוא את דרכו פנימה. פעילות המנגנון מפרקת את הטקסטים ליחידות בסיסיות, כלומר, טוחנת את הטקסט עד דק, ועכשיו אנחנו יכולים להכין מזה המבורגר. או קבב. או קציצות טקסטואליות. אם צריך תיאור סצנה בתסריט ללהיט החדש של נטפליקס - מבקשים מהמטחנה (ומקבלים את שביתת התסריטאים של הוליווד). אם צריך מילים לשיר חדש, סלוגן פרסומי, חרוז למילה תפוז או פסקת פתיחה לכתבה על בינה מלאכותית בתעשיית הרכב - פשוט מבקשים מהמכונה.
ה"מטחנה" הזאת היא מה שנקרא מודלי שפה גדולים (Large Language Models) - ולכל ענקית טכנולוגיה יש כבר אחד כזה. הפופולרי ביותר הוא GPT, שפותח על ידי OpenAI ונרכש על ידי מיקרוסופט, והוא המודל שעומד בבסיס ChatGPT הפופולרי. לגוגל יש את הצ'אטבוט בארד, שפותח על בסיס מודלי השפה שלהם: קודם LaMDA וכעת PaLM. גם למטא (פייסבוק לשעבר) יש מודל שפה גדול משלה בשם LLaMA, שה"מטחנה" שלו ניזונה מיותר מ-65 מיליארד פרמטרים. כן, זה הרבה מאוד מידע טקסטואלי.
עכשיו דמיינו שבמקום לבקש קציצות של מילים, אפשר לתכנת את המטחנה להוציא בצד השני קבבים של תמונות. בקצה העליון שלה, המטחנה ניזונה מצמדים של איורים או תמונות דיגיטליות והתיאורים המילוליים שלהם. הרי במקום שיש באינטרנט דימוי ויזואלי - יש גם תיאור טקסטואלי שלו. עכשיו המכונה שלנו לומדת לטחון את הפרמטרים האלה וליצור על בסיסם איורים ותמונות מבוססי טקסט, להחליף מילים בפיקסלים. זה מה שקורה מתחת למכסה המנוע של כלים כמו Dall-E ומידג'ורני, שמג'נרטים דימויים ויזואליים מרהיבים גם עבור מי שלא מסוגלים לצייר חיפושית על דף נייר.
שרדנו את הברברת הטכנית (המופשטת להחריד), אבל איך כל זה רלוונטי למכונית? זוכרים את הפסקה הראשונה בטקסט? זה כמה שמודלי השפה האלה עובדים טוב (לפחות באנגלית, אבל ממש לא רק). כן, הם יוצרים נהדרים, אבל הם גם מפגינים איכויות שיחה כמו-אנושיות. בינה מלאכותית שמסוגלת לשוחח עם בני אדם בשר ודם היא כלי עזר שקשה להמעיט בכוח שלו.
דוגמה מצוינת ליישום כזה היא זו של Pi, עוזר מלאכותי שמספיק לשוחח איתו במשך חמש דקות כדי להיכנס להלם אפוקליפטי ולהשתכנע בעליונות המכונות. Pi הוא יישום שמדגיש איכויות שיחתיות, שמעודד שיחה בכל נושא, שמביע תמיכה רגשית ואפילו מבין קצת הומור (ולא מהסס להצחיק בחזרה).
כשחושבים על הסייעות הקוליות המוגבלות שקיימות היום קצת קשה לדמיין שיחה של ממש עם מכונה. אבל נניח שבמקום סירי יש לכם איזה Pi כזה מתוכנת באוטו, שאפשר לדבר איתו בכל שעה, למשך כמה זמן שרוצים, כמעט על כל נושא שבעולם. שאפשר לבקש ממנו שיבצע בשבילנו פעולות במכונית - להגביר את מיזוג האוויר עבור הנוסעים במושב האחורי, לחפש את הפרק ההוא של הפודקאסט שהפסקנו באמצע, למצוא לנו תחנת רענון קרובה. להשאיר אותנו ערניים על ההגה עם שיחה. להסביר לנו מה רוצה הנורית הקטנה שנדלקה בלוח המחוונים ואיך לתפעל את התקלה. לתת לנו הנחיות מילוליות במצבי סכנה - במקום הצפצופים המכניים של מערכות ADAS. ללמד נהיגה. וכן, גם לזהות על בסיס תבניות קוליות וטקסטואליות מה אנחנו מרגישים במהלך הנהיגה ומתי תשומת הלב שלנו נודדת מהכביש, ולהחזיר אותנו לשליטה.
מי שכבר עכשיו בוחנת את השילוב של מודלי שפה גדולים בתוך סביבת הנהג היא מיקרוסופט, שרכשה את ChatGPT ומחפשת להרחיב את מנעד היישומים שלו. בחודש יוני האחרון הכריזה החברה על שיתוף פעולה עם מרצדס, שבמסגרתו נפתחה תוכנית בטא לכ-900 אלף נהגי מרצדס בארה"ב לשימוש ב-ChatGPT במכונית באמצעות מערכת הסיוע הקולי של החברה "היי מרצדס". היישום הזה אמור להגדיר מחדש את גבולות השימוש בסיוע קולי במהלך נסיעה, כך שבמקום לצעוק פקודות בסיסיות על האוטו נהגים יוכלו לבקש בקשות מורכבות יותר, כולל שאלות המשך, בשפה טבעית ואנושית יותר.
הפיילוט הזה מצטרף להכרזה דומה של מיקרוסופט מוקדם יותר השנה בנוגע לשיתוף פעולה אסטרטגי עם ג'נרל מוטורס, שבמסגרתו פועלות החברות להטמעת ChatGPT ברכבי היצרנית, לצד שילוב טכנולוגיות נוספות. עוד מוקדם לנחש איך והאם הפיילוטים האלה יתגבשו לכדי מוצרים אמיתיים, ובאיזה אופן נהגים יעשו בהם שימוש, אבל זה היישום הראשון מסוגו שמכניס מודל שפה אל תוך סביבת הנהג ולכן עיני התעשייה נשואות לפיילוטים האלה.
ומה קורה מחוץ לתא הנוסעים? מודלי שפה משמשים כבר עכשיו את תעשיית הרכב בכיוונים שונים: בצד התעשייתי, הם משמשים ליצירת בוטים שמסייעים בפתרון תקלות על פסי הייצור ובתהליכי ההרכבה; הם גם משמשים לעיבוד ביקורות ופידבקים של צרכנים ונהגים; בוטים שיחתיים מסייעים בתהליכי שימור ושירות לקוחות של יצרניות רכבים; וכמובן בינה מלאכותית יוצרת מסייעת בתכנון ועיצוב של פיצ'רים חדשים ואלמנטים בעיצוב המכוניות. וכן, סביר מאוד להניח שגם בהיבט השיווקי נעזרים כבר עכשיו ב-AI גנרטיבי בכתיבת פרסומות וקמפיינים של יצרניות רכב.
וככל שמנעד השימושים רחב יותר - כך גובר גם החשש מהישענות על בינה מלאכותית, בייחוד בתעשייה שבה בטיחות היא רכיב מפתח. ההיסטריה סביב בינה מלאכותית יוצרת, הביאה איתה כמעט מיד גם גל משמעותי של התנגדות - כולל מתוך תעשיית הטכנולוגיה עצמה. הטענה המרכזית היא שצריך להציב חסמים רגולטוריים כבר עכשיו על התחום, כדי שלא נמצא את עצמנו עמוק בתוך האפוקליפסה.
יש, כמובן, היבטים של פאניקה שקצת קשה להתייחס אליהם ברצינות. החשש מפני השתלטות של AI והכחדת המין האנושי הוא, איך לומר בעדינות, לא מאוד מבוסס. רק בחודש שעבר נצפו מוניות אוטונומיות של חברת "קרוז" בסן פרנסיסקו כשהן עומדות באמצע הכביש ללא יכולת תנועה רק מפני שבאותו רגע קרסה התקשורת הסלולרית באזור והשביתה אותן. אם ככה נראית השתלטות עוינת - אפשר לנשום לרווחה.
ובכל זאת, דמויות מובילות בתעשייה - כולל מנכ"ל OpenAI סם אלטמן, ואילון מאסק, בשביל מי שעוד מסוגלים להתייחס ברצינות למה שיוצא לו מהפה - קוראים להשהות לאלתר פיתוחים בתחום עד שנבין כולנו קצת יותר טוב איך הטכנולוגיה הזאת מתנהגת, ומבקשים רגולציה ממשלתית. אחרים מנגד, בכירים לא פחות, טוענים שאי אפשר לעצור את השטף. שהטכנולוגיה כבר כאן, ושכעת מוטלת עלינו האחריות לבחון את הגבולות שלה ולתקן את הפגמים שלה.
לא כל החששות מתודלקים בידי ספרי מדע בדיוני הזויים. בינה מלאכותית גנרטיבית אכן צפויה לשנות את שוק העבודה ואולי אפילו לחסל לגמרי מקצועות מסוימים וליצור חדשים; בהיותה שואבת מטקסטים אנושיים קיימים היא אכן עמוסה בהטיות (Bias) - מגדריות, אתניות ואחרות; היא מגבירה את התלות שלנו בה; היא מועדת ל"הזיות" - יצירות מבוססות מידע כוזב ושקרי לחלוטין; מעוררת דילמות מהותיות סביב נושאים של קניין רוחני וזכויות יוצרים; ורובנו אפילו לא יודעים להגיד איך היא באמת פועלת.
איך כל אלה יבואו לידי ביטוי בסביבת הנהג המיידית? עדיין קשה לנבא, אבל בדיוק בשביל זה מנסים ובודקים. הרגולציה כבר תדביק את הקצב בעוד 30 שנה.
פורסם לראשונה ב- 13.09.23
למאמר זה התפרסמו 10 תגובות