MY RTFM: מודלי שפה גדולים הם בעייתים

אין לי מילים, לא יאומן כמה אנשים בטוחים שמערכות מודלי שפה בטוחות ולא יעשו נזק בידיים הלא נכונות, מדובר בקפיצה טכנלוגית שאנו כבני אדם לא היינו מוכנים לזה מאז הסוואנה, יש פה גידול מעריכי ביכולות אבל כמות אנשים קופצת ורוצה לקבל את המערכות בידיים פתוחות. פעם היו תוכנות ומערכות שונות וכל אחת התקדמה לבד, עכשיו הכל הפך להיות כיוון פיתוח אחד והגידול ביכולות פשוט מדהים. אפילו ויקיפדיה הגדולה התחילה להשתמש בכלי כזה לאחרונה.

בפעם הקודמת שאנו האנשים הרגילים נפגשנו עם בינה מלאכותית הייתה אי שם בפריצת הרשתות החברתיות והלאגוריתמים לחיינו, והנה היום כל מארג החיים שלנו נפגע, התוכנות הללו מתחברות לצרכים הפרימיטיביים ביותר שלנו וגורמים לאנשים להתנהג כמו עכברים המקבלים סוכר בשביל לבצע פעולות חוזרות. אין לנו שום יכולות בכלל להבין אילו יכולות יש למערכות הללו כבר, ואנו מגלים זאת רק בדיעבד.

מערכות המשפט שלנו לא מוכנות ל AI שפתי גדולים (Large Language Modules) , נכון לעכשיו AI שפתי יכול לבצע אימות קריאת מחשבות של בני אדם, אומנם ע"י שימוש ב fMRI מסוגל לראות אילו תמונות אנו רואים, אבל המערכות החדשות, ואנחנו מדברים ביכולות שגדלות בתוך חודשים !. כבר היום זיוף קול ותמונה זה משהוא קיים, תגידו שלום יפה לכספים בחשבון שלכם עם אישרתם אימות לפי קול כי וואלה את הקול שלכם די קל לזייף ואם פעם היו צריכים להשיג המון הקלטות שלכם היום מספיק פחות מדקה של קול בשביל לייצר מודל בשבילכם. כבר היום קשה להאמין לתמונות או הקלטות בגלל deepfakes וכל מני תוכנות שמדברות ומשכנעות אנשים לבצע פעולות (קניית מוצרים, בחירה באנשים המתאימים לממשל, שימוש בשפה המתאימה).

לדוגמא כבר היום ניתן להשתמש בWiFi לזיהוי מיקום בני אדם בבניין (ואף ראיתי פרוייקט שביצע זיהוי בתנועה ) , כבר היום המערכות יודעות לתפעל אותנו בני האדם לביצוע פעולות שהמערכות רוצות שנבצע. עכשיו יגיע הפאן בוי התורן ויגיד שזה דורש התקנה מיוחדת והנתבים בבתים שלנו מוגנים, אז הרשו לי לגכח לכם , כי וואלה מרבית הנתבים המגיעים מ ISP לא מקבלים עידכוני אבטחה כמו שהייתי מצפה להם, ומראש לא מאובטחים, גם בתחום הקוד הפתוח המצב לא מזהיר פרק ל pfsense והתקנות מקצועיות ואני מדביר על דביאן שרץ על PC ועובד כנתב ולא איזה מכשיר mips מצו'קמק שכבר לא מקבל עידכונים מ openwrt כי הוא ישן מדי. אני מצפה שיהיו התקפות בקרוב כי מערכות המחוברות לאינטרנט יותקפו ואם הם לא מקבלים עידכוני אבטחה הם יהפכו לווקטור התקפה נוסף.

בגלל הבלאגן הזה, חלק מהמפתחים ואף חלק מהמדינות אסרו לפרסם את היכולת של מערכות ה AI (סין לדוגמא) , ופה לצערנו הרב נכנסה התוכנה החופשית לצרה, כי כאשר פורסמו מספר מודלים בקוד פתוח המערכות יצאו לאנשים "בטוחים" והגיעו לכל העולם ואישתו. גם בתוכנה חופשית אנו צריכים לחשוב איזה נזק ניתן לעשות עם הקוד שלנו.וכן המערכות שאנשים בונים מסוכנים מאוד ועדיין לא הכנסנו את חוקי אסימוב לתוכנה. נכון לעכשיו פרוייקט ויקמידיה התחיל להשתמש במודל כזה, וזה ממש מזכיר איך הסובייטים תרצו את ייצור ומחקר בנשק הביו-גימי שלהם כי יש על זה מחקרים וניתן להסיק לבד מהידע שפורסם במחקרים.

אני רואה שכבר היום חלק מהמערכות יודעות להחליף מתכנת צעיר, נתתי משימות שאני נותן לאדם מתחיל והמערכת ידעה לתת פתרון (לפעמים עקום כמו מתכנת חדש ולפעמים טוב יותר), מבחינת הtraining זה מחליף בוגר מדמ"ח, דיברתי עם עוד קולגה והוא אמר שהמצב ב JS עוד יותר מצחיק. השוותי יכולת של מערכות AI מסויימות, והאמת מחליפות ללא בעייה מתכנת צעיר וחדש (בשפות C ו C++) , אם יודעים לכוון ולבקש כמו שצריך מקבלים תוצאות סבירות, יש באגים אבל shit happens.

מערכות השפה מערערות את כל מה שאנחנו מכירים מבחינת החוק הכלכלה והפרטיות, אין לנו במערכות המשפט משהוא שיכול להתמודד עם mass servailance ו software persuasion , כן תוכנות היום לומדות לבצע persuasion כלפינו (המילה השפעה לא מספיק חזקה בעברית בגלל זה אני משתמש במילה האנגלית). אנו כאנשים לא יכולים להתמודד עם מה שייתקים עם ה AI.

נניח ואתם מצטרפים לחגיגה ומשתמשים בזה כרופאים בשביל לבדוק אבחנות, האם שאלתם את עצמכם מה קורה עם המידע הזה והאם אתם לא עושים נזק למטופל ע"י זה שאתם מעלים את המידע הזה לחברה אחרת שיבדוק זאת ? האם לקחתם בחשבון תופעות של הזיות של AI (כן זה מושג שקיים שAI הוזה דברים שלא קרו במציאות) מה שייכול שיגרום לכם לתת טיפול או המלצה לא נכונה ? הרי כל מתכנת מתחיל יכול לספר לך שאנחנו עושים קירובים (ולפעמים אפילו יש לנו כל הרבה בעיות שיש להם Digital Artifact). למעשה כבר היום אנו יודעים על משפחה שלמה של בעיות במכשרי CT, יש לנו משפחה שלמה של בעיות בסריקה במספר ספריות, בעוד רופא מבוגר יהיה מודע ויישקול שימוש (בדר"כ רופאים מבוגרים בטוחים פחות בכלים חדשים ) רופאים צעירים ייקבלו בשמחה וישתמשו בכלים וייאמינו לכלים (כי כל לאנשים לסמוך על משהוא אמפירי, כי הוא בטוח נבדק כמו שצריך). אחת הדוגמאות שאני אוהב להציג למתכנתים צעירים הוא מקרה Therac-25 והמקרה של מכון המחקר בפנמה סיטי מהניסיון שראיתי לוקח קרוב לשנתיים לזהות/לגלות באג במערכת קריטית שינשך אותך בתחת כל כך חזק שאתה תקלל את הרגע בו חשבת לעשות את מה שעשית. אתה עורך דין והשתמשת ואתה יכול לגלות שהAI הזה איזה שהוא תקדים או שהמציא חוק ? ומה לגבי שירות לקוחות ? אנחנו כבר ראינו שמודלי שפה נכשלו במקרים בהם הם נתנו מידע מטעה ואפילו אולי לא חוקי (קיימת טענה ש AI של חברה מסויימת הצליח לספק מפתחות תקינים לתוכנות סגורות). נניח ואתם משתמשים בה בשביל לפתח קוד, האם אתם מפירים זכויות יוצרים (כבר יש תביעה נגד מוצר AI בנושא הזה) או אולי אפילו פשוט מעתיקים קוד ממישהוא אחר בלי אפילו לדעת ? מערכת החוק והסביבה שלנו עדין לא מוכנה לטענות הללו. אם מתכנת צעיר העתיק קוד או פטנט מחברה כל שהיא, יש מה לתקן ומה לעשות, לגבי LLM אין לך שום דרך.

אני חושב שההשוואה הטובה ביותר לשימוש במודלים וקבלת מנועי שפה זה לקחת קובץ בינארי מIRC ולהפעיל אותו על המחשב שלך, מדובר במשהוא סגור שבשונה ממנועי חיפוש לא באמת מהווה כלי מקשר , הוא הופך לכלי מלמד וכלי סמכותי כל יכול. אין לנו כבני אדם יכולת לוודא כל פלט שייצא, אם מנוע חיפוש לפחות מקשר למקום המדוייק חלק ממערכות ה AI לא נותנות שום הקשר למידע, ובמקומות אחרים נותנים קישור לאתר קיים שאינו מכיל את מה שנטען על ידיו.

עשיתי מספר ניסונות עם מספר מערכות וגיליתי למשל שאני למשל דוקטור לאופתלמולוגיה שלפני כן עבד כמתמטיקאי שפרסם מאמרים, האנת אני אהיה מאוד שמח אילו זה היה המצב באמת, אצל אנשים אחרים הסיפור היה הרבה יותר נורא.

כל הנושא הזה מזכיר לי את הסרט אבולוציה , ואני לא בטוח שיהיה לנו מספיק שמפו בשביל להתגונן הפעם.

MY RTFM

יום שני, יולי 24, 2023

מודלי שפה גדולים הם בעייתים

אין תגובות: