Искусственный интеллект обыграл полупрофессиональные команды в Dota 2
28.06.18
Игра в Dota 2 требует расчета большего количества действий, чем игра в шахматы или го. Партия в шахматы заканчивается в среднем за 40 ходов, в го игроки делают до 150 ходов. В Dota 2 нужно принять в среднем 20 тысяч решений до завершения матча, и OpenAI анализирует каждый четвертый фрейм в нем.
Алгоритм различает 170 тысяч действий для каждого героя, а в течение одного наикратчайшего маневра он оценивает около 1000 возможных будущих решений.
Сейчас компьютер все еще не может победить профессиональных киберспортсменов — игроков в мультиплеерные игры особого жанра — multiplayer online battle arena (MOBA). Одной из них является Dota 2, и здесь пока еще чувствуется превосходство человека над машиной (при условии, что оба поставлены в равные условия). Но компьютер уже наступает на пятки человеку — полупрофессиональные игроки уже начинают уступать искусственному интеллекту (слабой его форме).
Для каждого бота используется раздельная LSTM-сеть с долгой краткосрочной памятью, которая анализирует окружающую среду и помогает боту избегать и обходить препятствия. Всю систему тренировали с помощью расширенной версии обучающего алгоритма Proximal Policy Optimization. Она работает на 256 графических картах и 128 тысячах процессоров.
Каждый день алгоритм проживает 180 лет игрового времени. Подобным массивом данных не обладает ни один из профессиональных игроков на планете. Каждый «агент» проводит 80 % игр против своей нынешней версии и 20 % против прошлой. Так разработчики стараются избегать проблем со стратегиями команды.
Боты учились медленнее, когда наградой была победа или поражение, а не убийство крипов, как в соревнованиях один на один.
Пока OpenAI Five умеет играть только ограниченным количеством героев, в ее арсенале есть Necrophos, Sniper, Viper, Crystal Maiden и Lich. Система не научилась вардить, не знает о Рошане, не пользуется невидимостью или сканом. Ей запрещено покупать Divine Rapier, Bottle, Quelling Blade, Boots of Travel, Tome of Knowledge и Infused Raindrop.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Обзор смартфона Oppo A6 Pro: амбициозный
Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.
Игровой руль Logitech G29: спорткар на столе
Расскажем про игровой руль Logitech G29 для ПК и PlayStation, а также дополнение в виде 6-ступенчатого переключателя передач Driving Force Shifter.
Исследование: люди начали копировать фразы чат ботов с ИИ искусственный интеллект исследования
После появления ChatGPT авторы видеороликов на YouTube стали заметно чаще употреблять слова, характерные для языка крупных языковых моделей
Операционной системе Windows исполнилось 40 лет Windows история
История Windows началась в конце семидесятых, когда Microsoft решила создать графическую оболочку для своего DOS


