AlphaZero самостоятельно учится играть в игры на высочайшем уровне

Preview_post_c52309d4-0761-4ffa-9868-f5c804953947

Новая система под названием AlphaZero представляет собой систему обучения с подкреплением, то есть обучается, многократно играя в игру и учась на своем опыте. Это, разумеется, очень похоже на процесс обучения людей. Задается базовый набор правил и компьютер играет в игру — сам с собой. Ему даже партнеры не нужны. Он играет сам с собой много раз, отмечая хорошие и победные ходы. Со временем он становится все лучше и лучше, превосходит не только людей, но и другие системы ИИ, разработанные для настольных игр. Данная система также использовала метод поиска «древа поиска Монте-Карло». Совмещение двух технологий позволило системе научиться совершенствованию в игре. Ученые опробовали силы программы, обеспечив ее большой мощностью — 5000 тензорных процессоров, работающих в паре с большим суперкомпьютером.

На текущий момент AlphaZero освоил шахматы, сёги и го. Следующим шагом станут популярные видеоигры. Что касается производительности ИИ, то в го, например, AlphaZero обыграл легендарного AlphaGo уже через 30 часов.

Рейтинг 0

Комментарии

Комментариев пока нет.

Добавление комментария