מעניין מה תהיה הכותרת האחרונה של "AI עושה דבר" אי פעם. הדבר ש-Google DeepMind מדמיינים, במסע שלהם ליצור אינטליגנציה כללית אמיתית, הוא משהו כמו "AI יכול לעשות הכל הרבה יותר טוב ממך, נו נו". לפי המידה שלהם, ה-AI שלהם AlphaStar טיפס שלב נוסף לעבר המטרה הזו על ידי הגעה לרמת גרנדמאסטר בStarCraft 2השרתים האירופיים של. זה אומר שהיא לא יכולה לנצח את הטובים ביותר, אבל היא "בתוך 0.15% העליון של 90,000 השחקנים של האזור".
זה מרשים, במיוחד בהתחשב במגבלות הגדולות יותר על הפרספקטיבה והפעולות לדקה מאז הפעם האחרונהDeepMind שלח אותו לעשות קרב. גרסה זו יכולה לשחק בכל שלושת הגזעים בכל מפה, והיא מוגבלת לפרספקטיבה של מצלמה באופן דומה לשחקן אנושי. זה הישג מסודר, אבל אני שמח שקיבלתי את ההזדמנות לדבר עם הצוות ולנקוט מהם אזהרה או שתיים.
עוד ביולי, שחקנים אירופאים ראו תיבת סימון שאפשרה להםהצטרפות להתמודדות פוטנציאלית מול הבוט של גוגל. גוגל פרסמה כעת את הישגי הבוטים שלה ב-Nature. המחקר בפועל הואמאחורי חומת תשלום, אבל גם טבע פרסםמאמר עם רוב הפרטים המרכזיים.
הם אימנו את הבינה המלאכותית שלהם בכך שגרמו לו לצפות בשחקנים אמיתיים, ולאחר מכן על ידי הצבתו מול "מנצלים". אלה היו סוכנים שתוכננו בכוונה לנעוץ חורים באסטרטגיות של AlphaStar. שחקן המקצוע Dario "TLO" Wünsch היה מעורב בפרויקט מאז לפני שגרסה קודמת, פחות מוגבלת, של AlphaStar הוציאה אותו בינואר.
הוא הראה לי משחק לדוגמה שבו אלפאסטאר סתמה פער מתוכנן בחומת הגנה של בניינים עם יחידה אחת. שאלתי אם ניתן לייחס את ההתנהגות הזו למנצלים, ומדען המחקר אוריול ויניאלס קפץ ואמר לי שזה תוצר של למידת חיזוק סטנדרטי אבל "במיוחד" המנצלים. אם החומה לא הייתה מושלמת, סביר שסוכן נצלן יחמוק.
המגבלות שהזכרתי הן קריטיות. Vinyals אמרו לי שהגרסה החדשה הזו של AlphaStar לעולם לא יכולה לבצע יותר מ-22 פעולות בטווח של חמש שניות, ויש חלונות זמן ארוכים יותר "רק כדי להבטיח שגם קצב הפעולה הממוצע סביר". חשוב לציין, זה "אף פעם לא עולה בשום דבר (הם) ראו כגבוה מדי סטטיסטית בהשוואה לשחקנים טובים". העיתון בפועל קובע כי שיא ה-APM נמוך מזה של שחקנים מקצועיים, אם כי ראוי לציין שזה לא שם לב לאופן שבו בני אדם נוטים יותר 'לבזבז' פעולות על ידי ספאם של אותה פקודה.
ההגבלה העיקרית הנוספת היא שגרסה זו של AlphaStar יכולה "לראות" רק את החלק של המשחק שהוא מחזיק את המצלמה שלו. DeepMind להוטים לתת את הרושם שהיא רואה את אותו משחק כמו האדם, אבל לטענה הזו יש ניואנסים שצריכים בדיקה מדוקדקת. ויניאלס שמחו לחייב: "הכוונה כאן היא שבשום שלב לא ניתן לאלפסטאר מידע שבאופן עקרוני לא יהיה זמין לפרספקטיבה של מצלמה אנושית. אלפאסטאר לא יכולה לעשות פעולות מחוץ לתצוגת המצלמה שלה. היא כנראה רואה דברים מסוימים. , אולי יותר מדויק-"
באותו שלב הוא עצר, אומר. "טוב אולי ליתר דיוק זו לא המילה הנכונה, אבל היא שונה. התפיסה היא דרך ממשק מחשב, הוא רואה מספרים, הופך מידע בינארי לנתונים".
דריו סידר את זה בצורה מועילה יותר לאופן שבו במצב קרוב עם, נניח, 32 יחידות מול 31 יחידות, ה-AI עשוי להבין שיש לזה את היתרון - אבל הוא הדגיש שאלו מקרים שוליים, ושבני אדם טובים באינטואיציה תוצאות. הוא גם העלה את כל הטעויות הרבות שראה את אלפאסטאר עושה, כמו לפוצץ יחידות משלה עם יכולת AOE. "בחלק מהיחידות הוא שולט טוב יותר, בחלק מהיחידות הוא שולט בצורה גרועה יותר", אמר. "מנקודת מבט זו זה מרגיש מאוד הוגן". Vinyals העריך את יכולתו ללחוץ במדויק על המפה, או האנלוגי של לחיצה, להיות "ככל הנראה בערך חצי יחידה בינונית".
הוגנות היא המפתח עבור גוגל. Vinyals אמר לי שהוא מאוד מעוניין לגרום ל-AI לקבל החלטות בזמן אמת, כמו היכן הוא צריך למקד את המצלמה שלו. הוא רוצה שזה 'יחשוב' דברים כמו "לא יכולתי לשלוט ביחידות האלה בצורה מושלמת, אז אולי אני פשוט מרחיק אותן ואחזור אליהן מאוחר יותר". לדבריו, "המיומנויות שפיתחה אלפאסטאר התאפשרו בגלל המגבלות שהטלנו".
דריו גיבה את זה ואמר לי ש"סגנון המשחק לפני המגבלות היה מעט מנוון. לעתים קרובות יחידה בודדת הייתה מועדפת, ומתקפה בודדת שבוצעה בצורה מושלמת תסיים את המשחק. מהר מאוד לאחר הצגת הגבלות ה-APM ראיתי אסטרטגיה מגוונת יותר, חקירה מעמיקה יותר של המשחק. זה ממש מגניב: ברגע שמשהו פחות מסוגל מבחינה מכנית, יותר אינטליגנציה עשויה להופיע."
יש מובן אחר שבו ההגינות חשובה. אם התחכום של AlphaStar היה תוצאה של DeepMind שהשליך כסף וכוח מחשוב על אלגוריתמים משופרים במעט, ההישג היה פחות מרשים. כמובן, הצוות היה להוט להרגיע אותי שזה לא המקרה. החוקר דיוויד סילבר אמר לי שהם עובדים על הפרויקט בערך שנתיים, והשוו את היקף הפרויקט לפרויקטים אחרים של גוגל כמוAlphaGoוAlphaZero.
ויניאלס אמרו לי שהם השתמשו באותם משאבי מחשוב שאנשים רבים במוסדות אקדמיים משתמשים בהם כדי "להכשיר מודלים של תמונה וכן הלאה", וסילבר טענה שמוסד אקדמי יכול כנראה לשקף את התוצאות שלהם "אם ישתמשו במשאבים שלהם ביעילות". הוא אמר לי שאני יכול לחשב את העלות הכספית הכוללת מהמידע בעיתון, אבל הוא לא חושב שזה יגיע ל"מספר מזעזע". ויניאלס העריכו שהם השתמשו בחומרה הזו כדי לאפשר ל-AlphaStar לשחק בערך 200 שנות אדם, נתון שהוא השווה לטובה לאלפי או מיליוני השנים שייתכנו מבחינה טכנית.
גם אני וגםאשף הבינה המלאכותית מייק קוק, שנתן לי באדיבות לבחור את המוח שלו למאמר זה, חושב שהרבה מהמשמעות של ההישג תלויה בכמה אפשר לייחס לכסף וכמה לתחכום. סילבר אמר לי שהשאלה שדיפ מיינד רודפים בסופו של דבר היא "האם אנחנו יכולים לרכוש את רמת האינטליגנציה ויכולות הלמידה הכלליות שיש לבני אדם", ושהם "רוצים להתחיל בהקשר של משחקים כדי להיות מסוגלים להדגים זאת".
יש את השפשוף. זוהי הדגמה מרשימה לאופן שבו ארגון בעל משאבים גדולים יכול ליצור AI שמנצח 99.85% מבני האדםStarCraft, באופן מכריע על ידי משחק בצורה דומה להם. עד כמה זה מהווה צעד לקראת אינטליגנציה כללית היא שאלה שהיא מעבר לתחום המאמר הזה. כל מה שאני אעשה בינתיים זה לשאול את זה.