השבוע דיברתי עם מכר לגבי שימוש ב LLM בקוד, והעלתי נקודה שגרמה למספר אנשים להרים גבה, אני טוען , כי אסור לפתח קוד שהוא קוד פתוח ולהשתמש ב LLM שלא אומן על החומר שלך בלבד, לדעתי האישית כל שימוש בLLM שאינו על החומר שלך הוא הפרת זכויות יוצרים, וכמו כן כל ייצור קוד שנעזר ב LLM בכל צורה (כולל בודק סטטי למשל) היא הפרת זכויות יוצרים.עכשיו ידידי העלה טענה חשובה, כי זה לא העתק של מילה במילה, זה העתק של רעיונות, העתק של שיטות , העתק של patterns, ובית המשפט עדין לא החליט על הנושא, אבל זה חלק גדול מהנקודה, העובדה שזה בבית המשפט רק מציגה את הבעייתיות בנושא, בקוד הפתוח פשוט צריך להתרחק מקן הצרעות הזה, כאשר כבר עכשיו אנחנו יודעים את הבעיות שקייימות שם, בג'נטו למשל החזיקו החלטה בגישה דומה (דיווח לפי לינוקסיוס). בpostmarket יש policy בנושא, ואף באג פתוח (219) המבקש לאסור את כל תרומות הקוד הפתוח בשימוש בAI.
נכון שזה מזכיר את מה שהיה פעם ב BSD, אבל האמת ,ואני חושב שאלי טעה טעות חמורה שם (בבאג), לדעתי אם קוראים קוד GPLי בשביל להבין איך קוד עובד (בשונה מreverse engineering ), לדעתי *אסור* לכתוב קוד דומה ומתחרה, באופן כללי לדעתי לא לחינם אנשים בכירים בחברות AI אמרו כי אילו יידרשו להשתמש בחומרים מותרים, הרי שלא יצליחו,הכתבה המדהימה "OpenAI declares AI race “over” if training on copyrighted works isn’t fair use " מארס מציגה זאת באופן משמעותי. לדעתי הרבה מה LLMים כנראה הפרו זכויות יוצרים, בין עם במהלך האימון , ובן אם במהל ייצירת הפלט, אפילו חברות ענק נתבעו על הנושא, ולכן לדעתי התוצר של LLMים הוא גם הפרת זכויות יוצרים.
עכשיו שיהיה ברור , אני מאוד בעד שימוש ב ctags , ושימוש בVS ו cmake שיבצעו בדיקות קומפילציה , אבל זאת כאשר משתמשים בפרופילים של הפרוייקט או פרופילים משותפים בין פרוייקטים. ב VS למשל אני משתמש ב rules file שזה אחד הדברים המאוד נוחים ביותר. מדובר בקובץ שמגדיר איך הקוד אמור להתנהג ומה מותר ומה אסור, אני כמעט בטוח שראיתי משהוא דומה גם תחת cmake (שניתן לטעון שורה שתגדיר רשימות אזהרות כשגיאה והתהנהגויות מסויימות, וזאת לא כפרטמטר בודד). באופן כללי אני משתמש יותר ב VS והאמת בגרסאות החדשות דברים עמו משתנה לא בשימוש, או משתנה שאמור להיות const ולא מוגדר const מוצא שיפורים בקוד, אני לא אומר שזה מושלם, לא פעם קיבלתי אזהרות שהן שגויות כמו למשל בביטוי constי בו יש פעולה אריתמטית והבודק מתריע כי יש אפשרות ל overflow, כל מקרה כזה אני בודק אישית ובעוד היו מקרים בהם הוא צדק , במרבית הפעמים האזהרה הזאת הייתה שגוייה.
בזמנו ניסיתי להעלות את זה בהרצאה של קלינגר לגבי רשיונות שימוש, אבל לא הספקתי לשאול אותו לגבי הטענה הזאת (כי נגמר הזמן).
לגבי קוד מסחרי? בדיוק אותו הדבר, זה אמור להיות סגור ואסור, כל סוג של שימוש כל דבר. יותר מזה, אני טוען ששימוש ב LLM שאומן בחברה, אבל על קוד של אנשים אחרים גם כן אסור ! אימון על החומר שלך עוד איכשהוא הוא לא הפרת זכויות יוצרים, של אחרים ? זה אסור.
עכשיו , זה נשמע קשוח, אבל בואו נחשוב לרגע , כאשר אנחנו חותמים בגיט על קומיט, אנחנו אומרים כי *אנחנו* עשינו זאת ואנחנו לוקחים את האחריות על זה, אבל אם היה LLM מעורב, הרי שאנחנו לא יכולים לקחת אחריות על הנושא הזה כלל.
והאמת ראיתי דבר דומה באחד מפרוייקטי הקוד הפתוח הגדולים, שם מסרו כי שימוש ב LLMים הוא אסור, ואני חייב להגיד להם כל הכבוד , אתם תותחים !
למרות שאני לא מסכים איתו , אהבתי את ההתייחסות של לינוס לנושא ב www.theregister.com/2026/01/08/linus_versus_llms_ai_slop_docs/ .
אינני עורך דין, ולא מבין שיט בחוק, אלו הם דעותי בלבד.
אינני עורך דין, ולא מבין שיט בחוק, אלו הם דעותי בלבד.