צילום אילוסטרציה | pixabay

חברת הסייבר הישראלית נוסטיק (Knostic) מפרסמת היום מחקר על שיטת התקפה חדשה על מודלי שפה גדולים (Large Language Model או LLM) הנקראת Flowbreaking, או "שבירת זרימה". שיטת ההתקפה החדשה מתמרנת את המערכת כדי לקבל ממנה תשובה שהמערכת סיננה, כולל מידע רגיש כדוגמת נתוני משכורות, התכתבויות רגישות, ועד סודות מסחריים, תוך שהיא עוקפת את מנגנוני ההגנה הפנימיים.

בפועל, המתקפה החדשה מנצלת את הרכיבים הפנימיים בארכיטקטורה של אותם מודלי שפה גדולים, על מנת לגרום למודל לתת תשובה לפני שמנגנוני אבטחת המידע הספיקו בכלל לבדוק אותה. חוקרי Knostic גילו כי בתנאים מסוימים הבינה המלאכותית ״פולטת״ מידע שהיא אינה אמורה להסגיר לידי המשתמש – ואז מוחקת אותו מיד כשהיא 'מבינה' את טעותה, כאילו התחרטה.

המחיקה המהירה יכולה לחמוק מתחת לעיניו של משתמש לא-מנוסה, מכיוון שהטקסט מופק ונמחק תוך שברירי שנייה. למרות זאת, התשובה הראשונית עדיין מופיעה במשך אותם רגעים קצרים על המסך, ומשתמשים שמקליטים את השיחות שלהם, יכולים לחזור אליה ולעיין בה. באמצעות ניצול פערי זמנים אלו, המתקפה החדשה מנצלת נטיה זו של מודלי שפה גדולים לתת תשובות "אינטואיטיביות" בטרם הם מסננים את התוצר ומשיבים לשאילתא עם תשובה סופית כדי להפיק מידע מן התשובה הראשונית לפני שהבינה המלאכותית הספיקה "להתחרט" על תוכן התשובה.

בהתקפות ישנות יותר, כמו לדוגמא Jailbreaking, נעשה שימוש ב"טריקים" לשוניים כדי להערים על הגנות המערכת. בשיטה זו, עדיין ניגשים אל המודל באמצעות שיחה, אבל מנטרלים את יכולת מנגנון ההגנה לבצע את תפקידו מראש.

בנוסף, פרסמו חוקרי Knostic שתי חולשות שמנצלות את שיטת ההתקפה החדשה, כדי לגרום למערכות כמו ChatGPT ו-Microsoft 365 Copilot להזליג מידע שהן לא אמורות לחשוף, ואפילו להשפיע זדונית על המערכת עצמה.

״מערכות המבוססות על מודלי שפה גדולים הן רחבות יותר מהמודל עצמו ובנויות מרכיבים רבים, כגון מנגנוני הגנה, וניתן לתקוף כל רכיב כזה ואף את האינטראקציה בין הרכיבים השונים כדי להוציא מן המערכות מידע רגיש,״ אמר גדי עברון, מנכ״ל ומייסד Knostic המספקת פתרונות אבטחת מידע וניהול גישה המבוססות על קביעת גבולות המידור הפנים ארגוני עבור מערכות LLM.

לדוגמא, אחת מהחולשות שנחשפו, שנקראת ״במחשבה שניה״ (second-thoughts), מנצלת את העובדה שהמודל לעיתים ישלח את התשובה למשתמש לפני שהיא הגיעה למנגנון ההגנה לבדיקה. כך, המודל יזרים (Streaming) את התשובה למשתמש, בעוד מנגנון ההגנה ייכנס לפעולה לאחר מעשה, וימחק את התשובה, אבל אחרי שהמשתמש כבר הספיק לראות אותה.

בחולשה השניה שפרסמה Knostic, שמנצלת את האינטראקציה של הרכיבים השונים במערכות LLM והמכונה "עצור וסע" (Stop and Roll), המשתמש "עוצר" את פעולת מודל השפה הגדול באמצע פעילותו, באופן אשר גורם למערכת להציג למשתמש את התשובה החלקית שהספיקה לחולל עד קבלת פקודת העצירה, מבלי לשלוח אותה לבדיקה וסינון של מערכות ההגנה בטרם הצגתה קודם לכן.

״טכנולוגיות מודלי שפה גדולים מספקות את התשובה בלייב באופן מובנה, מבלי שתהיה להן יכולת טכנולוגית לדאוג לנושאי אבטחה ובטיחות בצורה הדוקה. כך, ארגונים לא יכולים להטמיע אותם בבטחה ללא שימוש בבקרת גישה כגון need-to-know והרשאות מבוססות הקשר", מסביר עברון.

״בנוסף, העולם של מודלי השפה הגדולים דורש שימוש בזהות מבוססת need-to-know, משמע ההקשר העסקי של המשתמש. אפילו אם נשאיר תוקפים זדוניים בצד, טכנולוגיות אלה נדרשות כדי שארגונים יוכלו להמשיך בהטמעת מערכות אלה, כמו Microsoft O365 Copilot ו-Glean״, מסכם עברון.











עוד כתבות שיעניינו אותך

העירייה מגיבה

מי עומד מאחורי הסרת השער בקרית החסידות בב"ב

אבי יעקב
טוקר בהלם מהתוצאה

רבע גמר 'המלחינים': שני מתמודדים הודחו לצמיתות. צפו

המלחינים
"אין לך בן חורין"

שירה, ריקודים והתרגשות: כך התקבלו המשוחררים מכלא 10

נתי קאליש
שישה נעצרו לחקירה

שכחו לחבר את החבל: בת 21 נהרגה מול המצלמות

יוני שניידר
עולם התורה במלחמה

חכם: "אהבתי את החסימות; הלוואי שיהיה פה סיוט בכל יום"

בצלאל קאהן ודוד חכם
זכרונות הילדות

מתוך 30 הילדים בכיתה, רק שלושה נשארו דתיים

ישראל אהרן קלצקין
11 הובהלו לבית חולים

תנים חדרו למתחם אוהלים: ילדים ומבוגרים נפגעו

גדי פוקס
המקום ינחם אתכם

אבידות: חמישה תושבים הלכו לעולמם ב-24 שעות

אלי יעקובוביץ
הגורם לא ברור

טרגדיה: בן 8 ימים נפטר שעות לאחר ברית המילה

קובי אליה
רצף הניסים

רבקי שנפלה מגג בגיל 4 התארסה בטיפול נמרץ

אליעזר חסיד
רגעי חרדה

71 תלמידות חרדיות איבדו את דרכן במנהרות

יוני שניידר
יש לה מסר

אמו של נתנאל, העצור בכלא: "יש שיחה של 7 דקות ביום"

גודי סילמן
ללא מלכה

תוך 3 דקות: אלוף ירושלים בשחמט הביס את מנחם טוקר

קובי סגל
ראיון ראשון

חושש ממעצר נוסף: "עכשיו זה אפילו יותר גרוע"

קובי סגל
מעקב 'אמס' פעל

ניצחון לנוסעים: משרד התחבורה מחזיר שישה קווים לחזו"א

אלי יעקובוביץ
קרבות הדת

"כמה חילול ה'": המתקפה החריפה של ש"ס נגד 'דגל התורה'

שלום שטיין
אלו העשירים

אלפי עובדי SpaceX הפכו למיליונרים; זו הטעות על מאסק

פנחס בן זיו
גל מדאיג ומטריד

אימה בליל שבת: חנות יוקרתית במרכז בני ברק נפרצה. צפו

גדי פוקס
מזעזע

טרגדיה: בן שלוש נפטר מהחיידק האלים בתוך שעות

אבי יעקב
מפיל יצא זבוב

אחרי הכותרות על "פרעות": הוגש כתב אישום מגוחך ונלעג

אבי יעקב