בעוד קצת יותר מארבעה שבועות, חמישה בוטים של AI ישחקו בצוות של שחקנים מקצוענים ב-The International. הבוטים של OpenAI למדו לשחקדוטה 2כמעט מאפס, בניית הבנה של המשחק באמצעות אחת מטכניקות למידת החיזוק המתקדמות ביותר שחוקרי בינה מלאכותית עדיין המציאו.
זה הישג מרשים, בלי קשר לשאלה אם הבוטים מצליחים למחוץ את יריביהם בשר ודם. אבל אל תיסחף יותר מדי. בשבוע שעבר סיפרתי לך עלהפוסט בבלוג של מייק קוק, שם הדגיש גם את המגבלות הטכניות וגם הקונספטואליות סביב הבוטים של OpenAI. מייק ידוע בעיקר בזכותואנג'לינה, משחק הבינה המלאכותית שהוא התעסק איתו בשמונה השנים האחרונות - אבל שום בעיית בינה מלאכותית לא יכולה לחמוק ממבט המומחה שלו. אז התקשרתי אליו ושאלתי אם הוא יכול להסביר עוד.
RPS: קודם כל, מה השיג OpenAI עם הבוטים של Dota שלהם? מה מרשים בהם?
מייק קוק:כך ש-OpenAI כבר עשתה סנסציה גדולה בשנה שעברה בכך שהצליחה לאמן בוט לשחק 1v1 mid, שהוא מצב משחק מיוחד בתוך Dota. זה בערך כמו דו קרב הפנדלים לכדורגל, והם ניצחו לגמרי חבורה של שחקנים מקצועיים, לפחות על הבמה הגדולה. ואז עברה שנה והם אמרו שהם רוצים להסתכל על 5v5 Dota, כל כך קרוב יותר למשחק האמיתי שתשחק אם תפעיל את Dota. לפני כחודש הם הודיעו שהם פיתחו בוטים שיכולים לנצח בני אדם - בני אדם די טובים - בסוג מסוים של התאמה של 5v5.
הדברים המעניינים הם אילו מגבלות היו שם, ואיזו עזרה קיבלו הבוטים מ-OpenAI. אבל באופן כללי זה עדיין הישג די מרשים, כידוטה 2הוא משחק וידאו מורכב ביותר - כל סוג של התקדמות כאן היא די מרשימה גם אם יש אזהרות מצורפות.
RPS: אז זו השאלה הבאה - מהן ההזהרות האלה?
מִיקרוֹפוֹן:אז, ההכרזה המקורית כללה מגוון הגבלות, והכי חשוב הגבלת את הגיבורים שה-AI יכול לבחור ואת הפריטים שהם יכולים לבנות. הבינה המלאכותית הוגבלה לשילוב מראה של חמישה גיבורים, ולרשימה מוכנה של פריטים שהם ירכשו, אני מאמין רק ברצף ללא קשר למה שהתרחש במשחק. היו גם כמה מכניקות שבהן נאמר לבוטים לא להשתמש - שימוש במחלקות, שהן פריטים שמעניקים חזון באזור, או תקיפת רושן, מטרה אופציונלית שנותנת יתרון גדול לצוותים.
ההגבלות וההתאמות הללו הן עניין גדול. כדי לשים את בחירת הגיבור בפרספקטיבה, ישנם מיליארדי שילובים אפשריים של 115 הגיבורים במשחק 5 נגד 5. אם הייתם שואלים אותי בשבוע שעבר מה הסיכוי שהם יגדלו מהתאמה קבועה עם גיבורים פשוטים, הייתי אומר שזה עוד שנים. אבל עכשיו, השבוע, OpenAI הודיעו שהם מסירים חלק מההגבלות האלה - יש עכשיו 18 גיבורים מעורבים, ולמרות שלא ברור איך פועלת בחירת גיבורים, זו עדיין קפיצת מורכבות עצומה שהמערכת יכולה לעשות רק חודש. הם גם הוסיפו מכניקה מסוימת כמו שימוש במחלקה ו-Roshan, מה שאומר שהבוטים יצטרכו לקבל החלטות טקטיות עשירות יותר. שמירה היא משמעותית במיוחד מכיוון שנקודות מחלקות טובות הן פחות או יותר אוניברסליות, מה שאומר שלבוטים יש סיכוי לשנות את האופן שבו אפילו אני ואתה משחקים בדוטה 2, אם הם מוצאים מקום חדש לשים בו מחלקות שקשה לחזות אותו ומספק חזון שימושי .
RPS: היית בטוח שהבוטים ינצחו קודם. האם ההודעה האחרונה של OpenAI שינתה את זה?
מִיקרוֹפוֹן:אחד המייסדים המשותפים של OpenAI צייץ לעברי בטוויטר שההתקדמות שנעשתה בחודש האחרון לא הייתה משהו שהם היו בטוחים בו לחלוטין, הם פשוט היו להוטים לגרום לבוטים שלהם לשחק 'DOTA אמיתי' בהקדם האפשרי. אם זה נכון, זה באמת מרגש, כי זה אומר שהם לא באמת יודעים עד כמה הבוטים שלהם יסתגלו לבעיה החדשה והמאתגרת הזו. עדיין יש הרבה סימני שאלה לגבי הגדרת המשחק עבורי: האם השחקנים האנושיים מוגבלים לאותם פריטים כמו הבוטים, למשל? האם הם יזכו לנסח גיבורים בעצמם ואולי יבחרו נגד הבוטים? בסך הכל, הכסף שלי עדיין על הרובוטים. בפרט, אם מסתכלים על הגיבורים שנוספו למשחק, כמה בולטים במיוחד כגיבורים שהבוט באמת יכול לשלוט איתם. לאחד הגיבורים בבריכה, סלרק, יש יכולת שהופכת אותו לבלתי ניתן למטרה, ויכולת נוספת שמנקה כל השפעות כישוף שליליות המופעלות עליו. הגיבור הזה צריך סגנון משחק מאוד ספציפי וממוקד כדי לשלוט בו, ופורמט המשחק עשוי לגרום לכך שלשחקנים האנושיים חסרים הפריטים או הגיבורים שיתמודדו איתו. אני לא אתפלא אם נראה כמה משחקי סלרק דמויי אלוהים מה-AI.
RPS: אז ראיתי כותרות על שחקני מאסטר גו שמעריכים מחדש את ההנחות שלהם לגבי המשחק לאחר ש-AlphaGo, שהוא אחד מפרויקטי הבינה המלאכותית של גוגל, ניצחה את אלוף העולם יחסית לאחרונה. אז אתה מצפה לראות כותרות דומות יוצאות מהאינטרנציונל?
מִיקרוֹפוֹן:ייתכן - יש עדויות לכך שהבוטים של OpenAI עשו זאת בעבר! אז בשנה שעברה כשהם שיחקו 1 נגד 1, בגלל שמשחקי הקרב 1 נגד 1 הם כל כך אינטנסיביים וכל כך חוזרים על עצמם, ושיחקו עם אותם סוגים של קריטריונים מאוד ממוקדים על ידי אנשים מיומנים מאוד, הבוטים כבר היו מסוגלים לשחק בצורה ש סוג של זרק את השחקנים האנושיים - וכמה מהשחקנים המקצוענים אמרו שזה שינה את הגישה שלהם ל-1v1. עכשיו אני לא יודע באיזו מידה הם מגזימים את זה, כי המטא 1v1 משתנה באופן דרסטי. אז בשנה שעברה, האופן שבו הופעל ה-mid lane ב-Dota 2 כבר נעלם לחלוטין בהשוואה לאופן שבו הוא משוחק עכשיו, אז אם לבוטים 1v1 אכן הייתה השפעה אני לא יודע אם ההשפעה הזו נמשכה. אבל יש עדויות שלפחות שחקנים מקצוענים מרגישים שהם מרוויחים משהו על ידי תרגול נגד הבוטים האלה. גם אם היו להם הפגמים שלהם, היו דברים שהם חושפים.
עכשיו כבר צוינו כמה דברים יוצאי דופן לגבי האופן שבו הבוטים משחקים, שחלק מהאנליסטים ייחסו לרמה גבוהה מאוד של הבנת המשחק. אז בליץ, אני חושב ששמו ויליאם לי, מצוטט במאמרי OpenAI - הוא היה סוג של יועץ להם לדעתי - והוא העיר שהבוטים הראו מידה מסוימת של היגיון ברמה גבוהה. הם היו מתקבצים ונמנעים מחלקים במפה שהם לא הצליחו להשיג בהם יתרון, והם היו עוברים לצד הנגדי של המפה ומנסים לדחוף שם יתרון. ברור שלא ראיתי את הבוטים משחקים ואני לא כל כך טוב בניתוח דוטה 2 כמו בליץ, אבל יש היבטים של זה שגורמים לי לחשוב שמדובר באדם שמפרש את מה שהבוטים עושים ולא את הבוטים בפועל. לאחר שהבין משהו בסיסי בדוטה. זה מבוסס על ההנחה שבליץ צפה רק בכמה משחקים, אז כרגע זה מרגיש קצת מוקדם. קשה לדעת אם מדובר בסוג של תקלה במערכת, כי ראינו תקלות עם הבוט 1v1 שלהם בשנה שעברה, או שהם פתחו משהו עמוק במעיים של Dota 2.
RPS: אז חוץ מהביצועים שלהם, האם יש דרך למדוד את המידה שבה הבוטים מבינים את המשחק?
מִיקרוֹפוֹן:זו שאלה מצוינת! זה באמת קשה, כי בדרך כלל אנחנו סומכים על אנליסטים ושחקנים מקצוענים שיגידו לנו מה אנשים אחרים עושים. אז כשאני צופה באינטרנציונל, אני סומך על המומחים האלה שמאחורי השולחן יעריכו את ההחלטות היפות האלה שמתקבלות והן כל כך מפורטות שאולי אפילו לא אוכל לדעת שהן קיימות.
עכשיו עם הבוטים, זה ממש קשה. אם הם ינצחו את הצוות האנושי בחודש הבא, זה יהיה עניין גדול. והם יכולים לנצח אותם בצורה הכי מגוחכת שאפשר, כל סוג של ניצחון יהיה בסדר. במובן מסוים זה ממש לא משנה איך הם ישחקו, העובדה שהם ינצחו תספיק - זה יספיק לקהל, זה יספיק ל-OpenAI. עם זאת, אחד הדברים שקרו בשנה שעברה עם הבוט 1v1 היה ברגע שאנשים הורשו ניסיונות חוזרים ונשנים, מכיוון שחלק מהשחקנים המקצוענים הצליחו לשחק מספר פעמים נגד הבוט, הם התחילו להבין שהידע של הבוט היה מאוד שביר. אז למרות שנראה שהוא טוב מאוד בדבר הספציפי הזה שהוא התאמן עליו, ברגע שהוא נתקל במשהו לא צפוי או נאלץ לשחק בצורה יוצאת דופן, הידע הזה קצת התקלקל. אז שם אני מניח שהשאלה האם הם באמת מבינים את המשחק היא הרבה יותר קשה - הם מבינים חלקים מסוימים במשחק טוב יותר מאחרים. אתה יכול לדמיין את זה קצת כמו נהר, אני מניח. החלק העמוק ביותר של הנהר הוא כמו הערוץ שהנהר חצב לאורך זמן, וזה החלק שבו הבוטים מרגישים הכי בנוח. וכשתתקרבו לשולי הנהר, החלק הזה עלול רק להיחצב. מדי פעם כאשר מבול או משהו כזה, אלו אזורים שבהם הבוטים חקרו פחות. וככל שהם יידחקו יותר לאזורים האלה הם יהיו פחות מרשימים.
אבל זה ממש קשה, הייתי טוען שהם כבר הפגינו הרבה הבנה של דוטה. למשל הבנה שחסימת זחילה היא יתרון. חסימת זחילה היא לא כלל או מושג במשחק, זה היה באג במוד המקורי של Warcraft 3 בגלל הדרך שבה NPCs מוצאים דרך רמה, ואנשים הבינו שאם הם יבלבלו את חיפוש הנתיבים הם ימצאו את עצמם ב- מצב נוח יותר. אז זהו מושג שהומצא על ידי אנוש שצמח מתוך חלק בלתי צפוי של המשחק, וכדי שה-AI ימציא את זה מחדש ותגלה מחדש שזה כדאי, זה כבר מראה שהוא מבין כמה היבטים של המשחק - וזה ממש מגניב! אבל אנחנו צריכים להיות זהירים, כי בערך כמו הדוגמה שלי עם בליץ, רק בגלל שהם נטענים לצד חלק אחד של המפה ומתעלמים מהצד השני הזה של המפה, יכולות להיות לכך מיליארדי סיבות. אז יש דברים שאנחנו יכולים להרגיש בטוחים לגביהם ולהגיד שכן, הם הבינו משהו כאן, הם השיגו משהו וזה חשוב. חלקים אחרים אולי נצטרך עוד מאה או אלף משחקים עם הרבה יותר משתנים כדי באמת להעריך אם הם יודעים מה הם עושים או לא.
RPS: אז זו אולי שאלה שקשה לענות עליה, אבל כמה זמן אתה חושב שיעבור עד שהם יוכלו להתחרות בליכֹּלהגבלות?
מִיקרוֹפוֹן:זה ממש קשה. אני יכול לומר בכנות, ההתקדמות שנעשתה בחודש האחרון היא לא משהו שאי פעם ציפיתי, ואני קצת המום מזה. עדיין נותרה גבעה גדולה לטפס, ואני מצפה לקרוא פרטים טכניים נוספים על מה הם עשו בשבועות האחרונים כדי להתקדם, אבל אולי אנחנו במרחק של רק כמה שנים מ-Dota 2. משהו שבינה מלאכותית יכולה לנצח בני אדם באופן טריוויאלי. קל לחשוב על מדע, ובינה מלאכותית ספציפית, כעל שיפוע חלק של התקדמות מתמשכת, אבל המציאות היא מהמורות יותר - לפעמים אתה נתקל במחסום ולוקח שנים להתגבר, אבל אז יש חודשים שבהם הכל משתנה והתקדמות ענקית עָשׂוּי. אני חושב שבטוח לומר ל-OpenAI היה רק אחד מהחודשים האלה. אם העתיד ימשיך כך, קשה לומר, אבל הצוות נראה בטוח בעצמו. תחזיות זה כיף, אני אקרא לזה: הבינלאומי 2022 ינצח על ידי בוטים.
RPS: ראה שזה מעלה שאלה מעניינת, כי אני יודע שאמרת בפוסט בבלוג שלך שיש לך חששות עם "AI כמחזה". באיזו מידה זה מחזה ועד כמה זה מנגנון שימושי למחקר בינה מלאכותית?
מִיקרוֹפוֹן:אז זה גם משהו שאנחנו רואים באקדמיה, שם נראה מישהו מפרסם מאמר על נושא שבו יש שאלות פתוחות ברורות שהוא יכול היה לענות עליהן, אבל לענות על השאלות האלה זה לא חדש מספיק כדי לייצר יותר פרסומים או לקבל יותר מימון, ולכן השאלות האלה לא נענות. אז אני לא רוצה לגרום לזה להישמע כאילו הביקורת הזו ייחודית למחקרים שאינם ממומנים על ידי הציבור, אבל יש בעיה של צורך לתפוס כותרות.
יש קו דק בין תקשורת מדעית לבין, כפי שאמרת, בינה מלאכותית כמחזה, כך שברגע שמעודדים אותנו לעשות את זה נעשה קשה יותר להיות חרוץ וישר ולוודא שהכל מונח בגלוי ושאנחנו עושים זאת. אל תנסה להסיח את דעתו או להטעות אנשים.
אני לא בהכרח אומר שזה נעשה בכוונה או בזדון, זה יכול לקרות במקרה, זה יכול לקרות בגלל התלהבות יתר. זה יכול לקרות אם אתה נרגש מדי מהתחומים שבהם התקדמת כדי לרצות לדבר על התחומים שבהם נאבקת. כאילו, זה לא מעניין לדבר על המאבקים שלך, אתה מדבר על הדברים שאתה בועט עליהם! אבל אני חושב שזה באמת בעייתי, במיוחד עם נושא כמו AI שהייתי אומר שהוא לא מובן כרגע. ויש הרבה מידע שגוי בחוץ, שעליך להיות סופר זהיר בעת תקשורת. אני חושב שהתקשורת שלהם השתפרה במהלך 12 החודשים האחרונים, אבל בסך הכל זה עדיין מרגיש כמו... כאילו הם מודעים לכך שכשהם ינצחו בני אדם בחודש הבא, הם יקבלו המון כותרות שאומרות שהם פתרו את דוטה 2. הם יודעים שזה הולך לקרות, ואני לא חושב שזה אכפת להם במיוחד. אני לא בהכרח אומר שהם מכוונים לזה, אבל אני חושב שהם בסדר עם זה שקורה. הם לא הולכים לצאת ולכתוב לאנשים אימייל ולהגיד להם לא לעשות את זה.
עם זאת, שאלת אם זו דרך טובה לעשות מחקר בינה מלאכותית. זו בעיית בינה מלאכותית קשה מאוד, הם השתמשו בתדמית הציבורית שלהם כדי לקבל מינוף עם Valve, כדי לקבל גישה לדבר הזה שלא הרבה אנשים אחרים יכלו לעשות. גם מעבדות אקדמיות לא יכלו להרשות לעצמן את סוג הטכנולוגיה שיש להן, אז הן נמצאות במצב ייחודי והן משתמשות במצב הייחודי הזה כדי לעשות משהו מרשים. אבל תחושת הבטן שלי היא שהדברים האלה עושים יותר נזק מתועלת בטווח הארוך, ואני אומר את זה בתור מישהו שמצפה ביסודיות למשחקים האלה. אני לא יכול לחכות לראות את הבוטים רצים על כל בני האדם האלה! אבל מנקודת מבט של תקשורת מדעית זה קצת מדאיג אותי, כן.
RPS: אז בפוסט שלך בבלוג כשדיברת על בחינה מחדש של הרעיון של בני אדם שמשחקים נגד מחשבים ומה כתוב בזה, אני מתאר לעצמי שזה מה שהיה לך בראש... אבל האם יש אבני דרך שימושיות יותר, וכאלה שיכולות להיות ביעילות באותה מידה מועבר לציבור?
מִיקרוֹפוֹן:אז אני חושב... שהדבר שאני עומד לומר שאני מתאר לעצמי שדי קשה ל-OpenAI לעשות, אני מתאר לעצמי שיש הגבלות על איך הם יכולים להשתמש ב-API שלהם או איך הם יכולים להפיץ את הבוטים שלהם ואת הטכנולוגיה שלהם. אבל החלטה חשובה שעשיתי בתחילת הדוקטורט שלי הייתה לוודא שכל מה שהפקתי אנשים יוכלו להוריד ולתקשר איתו. זה מאוד חשוב שאנשים יוכלו לגעת בדבר שעשית. זה גורם לאנשים להבין את זה טוב יותר, כי הם יכולים לבצע בדיקות משלהם. הם לא צריכים להיות מדענים, אבל הם עדיין יכולים לקבל מושג לגבי מה יקרה ואז לנסות את זה - בדיוק כמו שכל מי שהתעסק עם ה-AI במשחק וידאו יידע שזה כיף שיש סוג של השערה. לבדוק את זה.
הדבר השני הוא שזה בונה אמון. אז כרגע יש לנו הרבה שאלות ללא מענה לגבי איך הבוטים של OpenAI עובדים. אם הייתי יכול לשבת ולשחק משחק נגדם עכשיו, זה עשוי להגביר את הביטחון שלי בהיבטים מסוימים של הבוט אם הייתי יכול לראות ש'אוי, הוא מגיב לדבר הזה בצורה הזו'. או שיש רק עובדות שאני לא יודע, כמו שאני לא יודע אם בני האדם היו מוגבלים לאותם פריטים שהבוטים היו. אין לי מושג, אני מניח שהם היו אבל זה לא אומר. אז העובדה שאנשים יכולים לנסות את הדבר בעצמם בונה אמון בדרך זו וביטחון עצמי. אז זה היה שינוי שהייתי עושה.
מבחינת שינוי הפרויקט כולו, אני חושב שבניית בינה מלאכותית שצריכה להתמודד עם בני אדם בצורה לא תחרותית הייתה מעניינת. אז למשל בוט OpenAI שמאמן ומלמד אנשים היה מעניין הרבה יותר, אני חושב, מאשר בוט תחרותי. אם אתה מנצח בני אדם במשחק של דוטה 2 זה הכל - אנשים מתמקדים בניצחון. איפה כאילו אתה יכול לבצע מעין תרחיש של Dota 2 'My Fair Lady' של לקחת צוות של גיימרים אנושיים 2K [רמת מיומנות נמוכה] ולגרום להם להיכנס למוקדמות הבינלאומיות ולהעפיל, זו עסקה ענקית. וללא ספק זה עדיף לדוטה 2! אז אחד הדברים שניסיתי להדגיש לאנשים הוא ש-OpenAI מרגש, אבל זה לא ישפר במיוחד את הבוטים שאתה משחק מולם במשחק. בעוד לגרום לבינה מלאכותית לעשות אימון והדרכה - זה באמת מעניין אותי, וזה משהו שיותר אנשים יכולים לעסוק בו. זה מאלץ עיתונאים ואנשי תקשורת אחרים בינה מלאכותית לחשוב טוב יותר על האופן שבו הם מעריכים זאת.
שוב, זו לא חפירה בעיתונאים כי זה לא על העיתונאים לתקן את הבעיה הזו - זה עלינו כחוקרים ואנשי אקדמיה. אז זו אחת מהזוויות שדיברתי עליהן, אני חושב שסוג אחר של בעיה יכולה לעזור. אחד עם סוג פחות אובייקטיבי של מצב מטרה. אבל זו תמיד הייתה הבעיה במחקר בינה מלאכותית; נטינו לבחור בעיות שיש להן מטרות שחור-לבן אובייקטיביות וברורות מכיוון שקל יותר לבנות להן מערכות, קל יותר להעריך אם הגעת ליעד או לא. כאילו, ל-OpenAI יהיה מדור תוצאות ברור מאוד לעיתון שלהם בחודש הבא אם הם ינצחו קבוצה בשידור חי על הבמה. בעוד שהניסיון לומר אם שיפרת אלף אנשים או לא בדוטה 2 הוא ממש עדין, זה מאוד מורכב. אבל אני חושב שאנחנו צריכים להיות נועזים יותר, וללא ספק לתאגידים וחברות שיש להם הרבה מימון יש את הפריבילגיה הגדולה ביותר להיות נועזים יותר בסוגי הבעיות שאנו מסתכלים עליהם.
אבל זה לא יקרה, כנראה, כי בעיות מסוג זה מושכות מאוד, ולטענתם חוקרי בינה מלאכותית מאמינים בדרך כלל שהן יובילו להתקדמות בינה מלאכותית בעולם האמיתי. אם הם ירצו או לא זו שאלה פתוחה, אבל הם מאמינים שזה די טוב לבינה מלאכותית כללית לשחק ולנצח במשחקים האלה. ואתה יודע, זה משעשע. אני באמת לא יכול להדגיש את זה מספיק: אני מאוד נרגש לראות את הבוטים משחקים! אבל כן, אני חושב שבעיות שונות, דרכים שונות להעריך ולתת לאנשים לגעת בהן... אלה שני הדברים. תן לאנשים לגעת בדברים שאתה בונה, ושיהיו לך יעדים יותר ניואנסים שגורמים לך לחשוב על הערכתם.
RPS: רק רציתי לגעת בדבר אחד נוסף, שאכן מוביל אותנו בחזרה לעבר תחרות. אבל עוד גבול שהעלית, משהו שצריך לזכור שהופך את ההישגים שלהם לפחות מרשימים, הוא שבינה מלאכותית קוראת את המפה במרווחים קצרים בהרבה ממה שאדם היה מסוגל לעשות. אז תהיתי... כמה פרקטי זה יהיה לעצב AI עם מגבלות של אדם?
מִיקרוֹפוֹן:אז כן, זה באמת מעניין. ישנן שתי דרכים שאנו חושבים לעשות זאת. דרך אחת היא שאנחנו חושבים לתת להם הגבלות שמרגישות לנו אנושיות. אז ברור מאליו יהיה לגלות מהן מהירויות התגובה של אנשי המקצוע המובילים של Dota 2, ולהגביל את יכולת התוכנה להגיב למגבלה זו. אבל כמובן שאפילו זה לא פותר את הבעיה, כי כרגע הם מקבלים מדידות מדויקות ביותר של העולם, אז הם יודעים שנותרו 1.36 שניות עד שהדמות הזו תוכל לזוז שוב כשהם מטילים כישוף או משהו כזה. והם מקבלים את העדכונים האלה כל 0.8 של שניה, או פחות מזה. אז גם אם נתת להם סוג של מגבלות מלאכותיות שלא בהכרח יפתרו את הבעיה.
גישה נוספת ש-DeepMind נוקטת במשחקי Atari שלהם, וראינו לאחרונה גם עם Doom אני חושב, היא בעצם לגרום להם לקרוא פיקסלים מהמסך. כעת OpenAI מזכיר זאת במפורש בפוסט בבלוג שלהם, והם אומרים שבעצם זה יהיה עומס חישובי גבוה מדי בשביל לקרוא את מסך הדוטה 2, ואני די מסכים איתם לגבי כמה דברים. אז למשל, קריאת המסך קרובה יותר למה שבני אדם עושים, אתה בעצם מסתכל על אותו ממשק משתמש שיש לבני אדם ואתה משתמש במיני המפה, אבל יש כמה דברים שבני אדם מקבלים בחינם . אז קריאת פיקסלים מהמסך היא אחת הגישה שעשויה לגרום לנו להרגיש שהיא קרובה יותר לאדם, אבל זו תהיה משימה כל כך ענקית שאני לא בטוח שהם בכלל יגיעו לשלב שהם כאן מבלי להגדיל באופן אקספוננציאלי את כמות החישוב הזמינה. אבל בדרך כלל, זו הגישה שאנחנו הולכים אליה כשאנחנו רוצים ליצור משהו קרוב יותר לחוויות האנושיות, היא לגרום להם לקרוא מידע מהמסך, להסתכל על משחקי הארקייד באותו אופן שבו אדם יעשה זאת. כך למדו מערכות למידת מכונה לשחק את כל המשחקים האלה של Atari ו-Doom לאחרונה, הוא בעצם קריאת פיקסלים מהמסך.
אז זה יכול לעבוד כאן, ואתה יכול לטעון שבוטים שמשחקים Go או Chess, הם רואים ייצוגים של הלוח שקרובים הרבה יותר לאופן שבו בני אדם רואים ייצוגים של הלוח. אז כשאני מסתכל על לוח שחמט אני יודע בדיוק איפה המלך נמצא. אין אי בהירות, אין מדידה שצריכה להתקיים. הבעיה היא שגם כשקוראים פיקסלים ממסך, מערכת תמיד תוכל לקבל מבט מעודן יותר על העולם ממני. כך, למשל, הוא תמיד יוכל לפקוח עין על המיני-מפה בפינה התחתונה, הוא לעולם לא יוסיח על ידי משהו שקורה במקום אחר על המסך אם הוא יהיה ממש טוב בקריאת מסך. אז אפילו קריאת פיקסלים ממסך לא בהכרח פותרת את הבעיה, כי יש רק הבדל מהותי. יש עומס מידע מתרחש, בעוד בשחמט המידע על מצב המשחק נמוך מאוד, מה שחשוב הוא המחשבות שלך לגבי ההחלטה הבאה.
אני חושב שכשאנשים חושבים על בינה מלאכותית במשחק דוטה, הדבר שמעניין אותם הוא הקטע הזה, הם לא מעוניינים להסתכל על לוח השחמט וללמוד איך כל הכלים נראים, הם מתעניינים איפה אתה מחליט איך לעשות את הצעד הבא. אני לא חושב שהם אפילו מעוניינים להשתמש בלחש בצורה מושלמת או בקריפ פגיעה אחרונה, כמו כל אלה הם כישורים שבהם זה לא מפתיע שבינה מלאכותית יכולה ללמוד אותם. אני חושב שמה שאנשים מחפשים זה המשחק המפתיע והיצירתי, שאולי מקבלים רק שניים או שלושה מהם במשחק שלם. אבל הם הדברים שאנשים מדברים עליהם אחר כך, הדברים שאנשים מצלמים ומדגישים ומעלים ביוטיוב ובטוויץ'. לא באמת אכפת להם אם הם מנצחים את בני האדם או מפסידים להם, הם רק רוצים את הרגע הזה שבו הם יכולים לצלם ולשתף איפה קורה משהו יוצא דופן, משהו יוצא דופן לחלוטין.
RPS: אבל אתה מצפה שנראה את זה באינטרנציונל?
מִיקרוֹפוֹן:אני מצפה שיהיו לפחות חצי תריסר פעמים שבהם השחקן האנושי בטוח לחלוטין שיש לו הרג על בוט, אז הם רודפים אחריו מתחת למגדלים והבוט מוביל אותם למרדף עליז שמוביל לשחקן האנושי להיהרג. אני חושב שזה יקרה שש או שבע פעמים במשחק, וזה יהיה מצחיק יותר ככל שזה יקרה יותר. ראינו את זה ב-1v1, זה סוג של גורם לזה להיראות כאילו השחקנים האנושיים הם אידיוטים, או שהם מזלזלים בבוטים, והם סוג של מזלזלים בהם, אני מניח... אבל אחד היתרונות שיש ל-match ups האלה , ואחת הסיבות שזה לא תמיד הערכה נהדרת של הבוט שלך, פשוט להעמיד אותם מול בן אדם ולראות אם הם מנצחים או לא, היא שאנשים מתחילים לשחק נגד בוט עם כל אלה דעות קדומות לגבי איך בוט יכול לעבוד.
אז כרגע Beyond The Summit, שהם אולפן esports, מריצים משהו שנקרא Bot TI. ואיך שזה עבד, זה גביע נוקאאוט שהם עשו וכל סיבוב הוא חמישה גיבורים נשלטי בינה מלאכותית מול חמישה גיבורים נשלטי בינה מלאכותית. הם לא משחקים משחק של דוטה 2, הם פשוט רצים אחד על השני ואז נלחמים ומי שנשאר עומד מנצח. וזה מאוד מאוד מצחיק ומטופש, זה חושף הרבה סלפסטיק על האופן שבו בוטים מקודדים בדוטה כרגע, אבל מה שמעניין אותי לראות בו זה להאזין לאנליסטים שמנבאים איך הבוט יעבוד. כי בחמישים אחוז מהזמן יש להם הבנה ממש טובה, ואז בחמישים האחוזים האחרים מהזמן יש להם רק דעות קדומות מעורפלות לגבי איך קוד צריך לעבוד או איך הלוגיקה של הבוטים צריכה לעבוד, ואלה הם אותו סוג של דעות קדומות שאתה רואה כאשר שחקנים נתקלים בדברים כמו הרובוטים של OpenAI בפעם הראשונה.
זה ממש כיף. זה לא בהכרח אומר לך כמה הבוטים טובים, אבל זה באמת מצחיק, זה תמיד מאוד טיפשי, ואני חושב שזה אחד ההישגים הגדולים של הפרויקט [של OpenAI]. זה היה הישג גדול מזה בשנה שעברה, וזה יהיה גם השנה. ובגלל זה Valve רוצה את זה על הבמה. בין אם זה משנה את הבינה המלאכותית לנצח או אפילו את דוטה לנצח או לא, זה בהחלט יהיה דבר מאוד מאוד מצחיק לצפייה.
RPS: תודה על ה-t-
מִיקרוֹפוֹן:היה דבר אחרון שרציתי להזכיר! ההיסטוריה של דוטה 2 היא בעצם סדרה של אנשים שמגלים דברים יוצאי דופן על המוד הזה שהפך כעת למשחק נפרד. יש מכניקה שקיימת רק בגלל שמישהו החליט לנסות משהו לפני שנה ועכשיו זה הפך להיות משהו שכולם עושים, והדברים האלה מגיעים בטרנדים ובגלים ואנשים מוצאים סודות חדשים. בכל פעם שהמשחק יתוקן זה יגרום לאיזושהי התנגשות מוזרה בין שני חוקים שצצים באיזושהי ניצול או משהו כזה. זו אחת ההנאות של דוטה 2, ואחד הדברים שחשבתי עליהם לאחרונה הוא שאם OpenAI באמת יפתור את דוטה 2 או יהפוך לטוב מספיק כדי לשחק בו בצורה מושלמת, יש נקודה כזו בעתיד שבה אולי יהיה לך כל סוד המשחק הזה מונח לפניך לעיני כולם. והיום הזה הוא יום ממש מרגש לחשוב עליו, אבל הוא גם עצוב ביותר.
בגלל שחקני גו הגיבו בשמחה רבה לכך ש-AlphaGo ניצחה את לי סה-דול, אבל אחרים די ראו בזה את המוות של גו במובנים מסוימים. לא בכך שלא נותרו סודות ב-Go, אלא שמשהו מהותי די נפצח מהדבר הזה שקרה - וחשבתי למה אנחנו בכלל רוצים שבוטים יעשו את זה. אז אני מצפה לאינטרנציונל הזה, אבל אולי בעוד חמש שנים אני קצת אפחד מזה!
RPS: תודה על הזמן שהקדשת.