הגנה על אמנות מבינה מלאכותית היא חיונית, עכשיו ובעתיד
חלק 2 של הסדרה שלנו על AI גנרטיבי מתעמק בסוגיות סביב האופן שבו הוא מאומן כרגע
בינה מלאכותית גנרטיבית נמצאת בכל תעשיות הבידור כרגע, והמון אנשים במשחקים משמיעים קולות נרגשים לגבי מציאת דרכים חדשות לשלב אותו במוצרים שלהם, ממפתחי משחקים ומוציאים לאור כמו Ubisoft ו-Square Enix ועד למחזיקי פלטפורמות וחברות חומרה כגון כמו Epic ו-Nvidia. האובססיה החדשה בתעשייה עדיין מתגבשת, ויש עוד הרבה שאלות שצריך לענות עליהןכמה זה עשוי לעלות בעתיד, למי תהיה גישה אליו, ובמה זה באמת יעזור, שלא לדברפחדים מאובדן מקומות עבודהועוד נזקים. אבל יש שאלה גדולה יותר שמבעבעת מתחת לכל זה שמאיימת לפוצץ את בועת הבינה המלאכותית המתנודדת: האם כל הבום בנוי על עבודה גנובה?
בנייה והדרכה של מערכות למידת מכונה דורשת לעתים קרובות נתונים -הרבהשל נתונים. לפעמים יש לנו מזל, ואנחנו יכולים ליצור נתונים משלנו. כאשר OpenAIאימן בוט לשחק משחקי אמצע 1 נגד 1בדוטה 2, הם עשו זאת באמצעות תהליך שנקרא Reinforcement Learning, כשהבוט משחק נגד עצמו שוב ושוב, כשהמשוב היחיד הוא מי ניצח ומי הפסיד. משוב זה, הנקרא לפעמים 'פרס', עוזר למערכת למידת מכונה לשחק מעין משחק 'חם וקר', לשנות את החיווט הפנימי שלה כדי לנסות לקבל תגמול טוב יותר בפעם הבאה שהיא תבצע את המשימה. אם אתה מבוגר מספיק כדי לזכור את המשחקשחור ולבן(או חלילה,יצורים), אז המשחקים האלה עבדו על עיקרון דומה. אם החיה הקטנה שלך עשתה דבר טוב, אתה נותן לה פינוק, ואם הם פשוט השליכו כמה כפריים לאגם, אתה מגלה להם (או נותן להם פינוק, אם אתה בעניין).
לפעמים אנחנו לא יכולים ליצור נתונים משלנו. אם אנחנו רוצים לאמן בינה מלאכותית להיות אמן, אנחנו לא יכולים לעשות את זה רק לשרבט וללמוד מהתוצאות, כי אנחנו לא יכולים להגדיר בקלות מה המשוב צריך להיות. ב-1v1 Mid של DOTA 2, אם אתה מת אז המשחק נגמר, ויש מטרות דומות לשחמט, Go, Starcraft וכל כך הרבה משחקים אחרים ש-AI ניסתה לשחק. באמנות, הגדרת מנצחים ומפסידים היא הרבה יותר קשה. אז אנחנו צריכים למצוא כמה נתונים שכבר קיימים, מערך נתונים של אמנות שכבר נראה כמו סוג הדברים שהיינו רוצים שמערכת למידת המכונה שלנו תוכל לעשות. אבל איפה אנחנו מוצאים את זה? איפה אנחנו מוצאים את התשובה לכל בעיה בחיים: באתרים אקראיים.
רוב הסיכויים שאם שמעתם על מערכת למידת מכונה המייצרת אמנות -אמצע מסע,דיפוזיה יציבה, DALL-E - הוא אימן את עצמו על מיליוני או מיליארדי תמונות שנגרדו ישירות מהאינטרנט. רוב מערכי הנתונים הללו אינם מסוננים, נאספים מדפים הפזורים ברחבי האינטרנט, במיוחד אתרים שבהם תוכן נגיש בקלות כגון Flickr, Reddit או מסדי נתונים של תמונות. הם גם מסיביים, עם מערך נתונים פופולרי אחד, LAION-5b, המכיל יותר מחמישהמיליארדתמונות. התמונות הללו נאספות כולן באופן אוטומטי, עם ניסיונות מינימליים מאוד לסנן את התוכן. כתוצאה מכך, מערכי הנתונים המשמשים לאימון מודלים אלה של AI מלאים בתוכן המוגן בזכויות יוצרים, חומר לא חוקי ומידע אישי. וכל זה מוזן למוצרי AI למטרות רווח שחלק עצום מאיתנו משתמשים בהם מדי יום - כולל מפתחי משחקים, עיתונאים ושחקנים עצמם.
זו הסיבה העיקרית לכך שתראה כל כך הרבה אנשים מפרסמים על AI ש'גונבים' תוכן באינטרנט. אחת ההשפעות הידועות ביותר של מערכי הנתונים העכורים והמוטלים בספק משפטית היא שאתה יכול לבקש מבינה מלאכותית לחקות את הסגנון של אמן מסוים, כמוגרג רוטקובסקישאייר למשחקים כמו סדרת Anno, ומשחקי קלפים כמו Magic: The Gathering. עבודתו של רוטקובסקי אהובה, משותפת באופן נרחב באינטרנט ומסומנת בבירור בשמו, כל זה אומר שבינה מלאכותית עומדת לראות הרבה דוגמאות לעבודות שלו,כפי שגילה יום אחד. אבל יש עוד דוגמאות רבות שאולי לעולם לא תשמע עליהן, או שאולי לעולם לא יבואו לידי ביטוי. לְדוּגמָה,צינוק AI- שהשתמשה ב-GPT-2 של OpenAI כדי ליצור סיפורי RPG - לקחה והשתמשה באלפי סיפורי הרפתקאות בחר משלך מקהילה מקוונת ללא רשות, מה שהוביל להרבה אכזבהמהמחברים המקוריים(שימו לב שכמעט כל השרשורים בקישור הזה הם די איכס, אבל הוא כאן להקשר שלך בכל מקרה).
גניבה היא לפעמים פשוטה, ולפעמים מסובכת. כשאני נודד לתוך בוס נלחם פנימהולהייםשהחברים שלי בילו שעות בהכנות לקראתו ואני אוספת את כל השלל כמו רומבה רעב ופנטזיה, ברור שזה לא גניבה - זה רק חלוקת העושר. בעולם האמיתי, שבו בתי משפט ומערכות משפטיות מעורבים, הגניבה היא הרבה יותר אפורה. משחקים זוכים לביקורת לעתים קרובות על 'גניבת' דברים ממשחקים אחרים או ממדיה - בין אם זההופעות של יצורים ב-Palworld,רוקדים בפורטנייט, או משחקים שלמים, כפי שקרההדיג המגוחך של Vlambeerוהשלשות של אשר וולמר. אבל לא תמיד אנחנו מסכימים מהי גניבה, במיוחד באולמות בית המשפט. התביעות נגד Fortnite נדחו כולן, אבל במקרה של מפתחי אינדי קטנים שהעבודה שלהם שוכפלה, כמעט ולא היה להם סיוע משפטי כלל. ההחלטה על מהי גניבה היא למרבה הצער, לעתים קרובות יותר על כוח מאשר על צדק.
כרגע, ישמספר תביעות משפטיותרצים ברחבי העולם ומתמקדים במודלים שונים של בינה מלאכותית, חברות ומערכי נתונים על הפרת כל מיני חוקים ותקנות שונים. הוכח כי דגמים מסוימים משננים מידע אישי ומדליפים אותו מאוחר יותר, בעוד שאחרים עברו הכשרה לגבי תוכן מזיק או ישחזרו יצירות המוגנות בזכויות יוצרים. טיעונים משפטיים טכניים יותר נכנסים לעומק הפרטים של מערכות אלו - שעצם ההדרכה על חומר המוגן בזכויות יוצרים מהווה הפרה של זכויות יוצרים, למשל. לא ברור אילו מהטיעונים הללו, אם בכלל, יפרוץ דרך בבית המשפט. חברות טוענות שכל זה נופל תחת שימוש הוגן, שתוכן מזיק הוא פגם זמני של המערכת שניתן לתקן מאוחר יותר, ושהסכמי רישוי יסייעו לספק הפוגה לאמנים בעתיד.
אבל לעתים קרובות זה לא בהכרח על מה חוקיהַיוֹם, אלא על איך אנחנו רוצים שהעולם יעבוד בעתיד. ישנן הרבה מאוד דוגמאות לאורך המאה האחרונה שבהן אנחנו מסדירים את הטכנולוגיה לא בגלל שהיא מפרה חוקים קיימים, אלא בגלל שהיא מאפשרת לאנשים לעקוף את החוקים האלה בדרכים שאף אחד לא יכול היה לצפות. עם זאת, הטיעונים המגינים על ניצול גדול זה של עבודה יצירתית מפספסים את נקודת הבעיה. זו לא שאלה של חוקיות, אלא שאלה של אנושיות. הגיוני להגן על עבודה יצירתית ועל האנשים שעובדים קשה כדי לעשות אותה, כי היא ממלאת תפקיד חשוב מאוד בחברה.
זה הנזק ארוך הטווח הזה שהרבה אנשים יצירתיים וחוקרי בינה מלאכותית חוששים יותר מכל. בדיוק כמו הפיטורים של תעשיית המשחקים האחרונים, ההשפעות של שינויים גדולים בענף לוקחים זמן עד שהן מגיעות במלואן. כל המשחקים שהיו אמורים לצאת בשנה נתונה כנראה ייצאו, והרבה מהם יהיו מהנים, ואולי תתהו אם הפיטורים האלה באמת השפיעו על משהו? אבל ההשפעה של שיבוש כזה עשויה לקחת שנים עד ששמים לב אליה, ועשרות שנים כדי להחזיר אותה. הסיבה שמערכות בינה מלאכותיות אלו היו מסוגלות להיבנות היום היא משום שהיו להן עשרות שנים, מאות שנים של יצירתיות אנושית להסתכל עליהן באינטרנט. אם הם ממלאים תפקיד בהפחתת הערך או ערעור היציבות של העבודות שעזרו לאותם אנשים ליצור אמנות זו, איזו תרבות תהיה ללמוד ממנה בסוף המאה הזו? גם אם אתה תאוצה מושבע של AI, רבים מודאגים מכך שיש לנונדבק לצמיתות באינטרנטעם כל כך הרבה תוכן שנוצר על ידי בינה מלאכותית, ייתכן שיהיה בלתי אפשרי לאמן מערכת בינה מלאכותית על תוכן שנכתב על ידי אדם.
תעשיית המשחקים שלנו שברירית באופן מפתיע, למרות שבמובנים מסוימים זה מרגיש כאילו היא רק הפכה ליותר חזקה עם כל עשור שעובר. רבים מהרעיונות המבריקים ביותר מההיסטוריה שלה, רבים מהקריאייטיבים המפורסמים ביותר או המשחקים האהובים ביותר, עלו מהשוליים של התעשייה או מדיומים אחרים, לעתים קרובות מאנשים במצבים פגיעים כלכלית. לשינויים קטנים שנראים לא מזיקים באותו זמן יש לרוב השפעות נרחבות - ויש כבר הוכחותש-Generative AI השפיע על איכות וכמות העבודה היצירתית העצמאית. לא משנה אם אתה חושב שבינה מלאכותית גנרטיבית היא טובה או רעה, זה נראה חסר כבוד להתעלם מהחששות והתלונות של אנשים שעבדו כל כך קשה, תמורת מעט תגמול, כדי ליצור את הקהילה העשירה והיפה שממנה צמח התחביב שלנו. לא משנה מה יגידו בתי המשפט, איזו רגולציה שתבוא, איך שהחברות הללו ייראו כשהאבק שקע - יכול להיות שכבר נגרם נזק רב.
בחלק 3, Better Living, אנו מסתכלים עלכמה AI מחולל חייב להיות מרוכז סביב יוצריםאם אנחנו מתכוונים להשיג עתיד במקרה הטוב ביותר.
פספסתם את חלק 1? כאן, נסתכל מקרוב עלמה המשמעות של AI גנרטיבי, ומדוע הוא זקוק לשפה טובה יותר כדי לתאר כיצד אנו משתמשים בו.