היום בחדשות "מחשב מנצח את האדם בדבר שמחשבים לא יכלו לנצח בו בני אדם בעבר": Google Deepmind ניצחהStarCraft 2מקצוענים במשחק משלהם. "AlphaStar" נחשף בשידור חי אמש, בתוכנית שסובבת סביב משחקים נגד הטופStarCraftהמקצוענים Grzegorz "MaNa" Komincz ו-Dario "TLO" Wünsch. כל המשחקים ש-AlphaStar זכתה למעשה הוקלטו מראש, כי GOOGLE ARE COWARDS בוא להילחם בי.
יש לציין שה-AI שיחק את אותה גרסה של StarCraft שאתה או אני יכולנו לאתחל עכשיו - בניגוד לבוטים Dota של OpenAI, אשרלא הצליח לנצח את המקצוענים בדוטה 2בשנה שעברה בגרסה קיצונית של המשחק. זה 2-0 לגוגל, שגם היאניצח את אלוף העולם ב-GO ב-2016.
ובכל זאת, חשוב לזכור שכאשר אחד מהיתרונות העל-אנושיים של ה-AI הושבת, הוא הפסיד. המשחק האחרון והחי נערך נגד גרסה של AlphaStar שלא יכלה להתרחק, כשהיא צופה יותר מהמפה בבת אחת מאשר יריבתה האנושית.
הנה של DeepMindסקירה של AlphaStar, אם כי זכרו לקרוא כל טענה שם דרך גבות מקומטות. כנ"ל לגבי הזרם למטה.
קח את הטענה הזו, למשל:
"במשחקיה נגד TLO ו-MaNa, ל-AlphaStar היה ממוצע [פעולות לדקה] של כ-280, נמוך משמעותית מהשחקנים המקצועיים, אם כי ייתכן שהפעולות שלה יהיו מדויקות יותר. ה-APM הנמוך הזה נובע, בין השאר, בגלל ש-AlphaStar מתחילה את האימונים שלה. משתמש בשידורים חוזרים ובכך מחקה את האופן שבו בני אדם משחקים את המשחק בנוסף, AlphaStar מגיב עם עיכוב בין תצפית לפעולה של 350ms בממוצע.
זו הערה חיונית ומעט מרשימה - הבינה המלאכותית לא ניצחה באמצעות מינוף מהירות על אנושית. עם זאת, הצידה הקטנה שהפעולות שלו מדויקות יותר, נראה לי עניין גדול. מיקרו-משחק על-אנושי מערער את הרעיון ש-AlphaStar ניצחה באמצעות חוסר חשיבה על היריב האנושי שלהם.
פניתי גם לחוקרת הבינה המלאכותית ונסה וולץ, שהעלתה את הנקודה המאוד תקפה הזו: "במקרים מסוימים (כמו ייצור יתר של Stalker ו-Drone), AlphaStar שיחקה אסטרטגיה שלא הייתה מוכרת למקצוען, ולכן התקשה להגיב. לכן, לא ברור אם החלק הזה היה יוצא מהכלל או דווקא מפתיע את השחקן האנושי".
למרות שחשוב לזכור את המגבלות הללו, זה עדיין הישג מסודר. אני לא אכנס לכל הפרטים מאחורי האופן שבו הרשת העצבית עטפה את המעגלים שלה סביב המורכבות של StarCraft, אבל הנה סקירה כללית:
"ההתנהגות של אלפאסטאר נוצרת על ידי רשת עצבית עמוקה שמקבלת נתוני קלט מממשק המשחק הגולמי (רשימת יחידות ותכונותיהן), ומוציאה רצף של הוראות המהוות פעולה בתוך המשחק.
"AlphaStar משתמשת גם באלגוריתם חדשני של למידה מרובה סוכנים. הרשת העצבית אומנה בתחילה על ידי למידה מפוקחת ממשחקים אנונימיים של בני אדם ששוחררו על ידי Blizzard. זה איפשר ל-AlphaStar ללמוד, על ידי חיקוי, את אסטרטגיות המיקרו והמקרו הבסיסיות המשמשות שחקנים ב-Blizzard. סולם StarCraft."
מאוחר יותר הם קיבלו את AlphaStar לשחק במשחקים נגד גרסאות שונות של עצמו, כשהאסטרטגיות המתפתחות שלו משקפות את אלה של בני אדם, כאשר "רצועות גבינה" נכנעו לגישות שוות יותר.
האם יש לזה אפליקציות מחוץ למשחקי וידאו? גוגל בטוח חושב כך:
"הבעיה הבסיסית של ביצוע תחזיות מורכבות על פני רצפים ארוכים מאוד של נתונים מופיעה באתגרים רבים בעולם האמיתי, כגון חיזוי מזג אוויר, מודלים אקלימיים, הבנת שפות ועוד. אנו נרגשים מאוד מהפוטנציאל לעשות התקדמות משמעותית בתחומים אלה באמצעות למידה והתפתחויות מפרויקט AlphaStar."
מִתקָבֵּל עַל הַדַעַת. בהחלט סביר.