Как правило, когда речь идёт об играх и искусственном интеллекте, подразумевается, что игры используется для того, чтобы имитировать интеллект в персонажах, которые появляются в видеоиграх – т.е. вид искусственного интеллекта, создающий иллюзию интеллекта в поведении неигровых персонажей (NPCs).
Игры, созданные для развлечения, моделирования или обучения, предоставляют большие возможности для машинного обучения. Разнообразие возможных виртуальных миров и последующих проблем, связанных с ML (Meta Language – семейство строгих языков функционального программирования с развитой параметрически полиморфной системой типов и параметризуемыми модулями), которые возникают перед агентами в этих мирах, ограничено только воображением. Кроме того, игровая индустрия не только велика и развивается (превзойдя по доходам киноиндустрию несколько лет назад), но и сталкивается с огромным спросом на новинки, которые она изо всех сил пытается обеспечить. На этом фоне успехи, обусловленные машинным обучением, привлекли бы к этой области повышенное внимание. Однако, чем более коммерционализированной становится игра, тем меньшее влияние оказывает обучение.
Сегодня интуиция и гипотезы аналитиков утратили свою значимость. Аналитики создают регрессионные модели на основе гипотез о том, что именно (и с какими характеристиками) имеет значение, – для машинного обучения все это не нужно.
Модели машинного обучения особенно хороши для вычленения полезных переменных из множества и определения, что не имеет значения, а что, как ни удивительно, наоборот [1].
Ярким примером машинного обучения является Google. Изменения в программе
Google-переводчик иллюстрируют, как машинное обучение (один из его подразделов
– глубокое обучение) снижает цену на качественные прогнозы. За ту же цену в единицах вычислительной мощности Google предоставляет перевод более высокого качества. Цена прогнозов аналогичного качества значительно снизилась [1].
В то время как контролируемое обучение используется в играх, оно все еще опирается на большие наборы данных о поведении игроков и в большинстве случаев требуют дальнейшего обучения с использованием таких методов, как RL, т.е. Reinforcement Learning (обучение с подкреплением).
Человек обычно обучается в процессе взаимодействия с окружающим миром. Обучение с подкреплением – это обучение, при котором интеллектуальный агент, работая с компьютерной средой, получает от неё отклик. Процесс обучения предполагает активную деятельность агента и интерпретацию обратной связи, полученной в ответ на его действия… В процессе обучения с подкреплением вырабатывается алгоритм перехода от ситуации к действиям, которые минимизируют вознаграждение. Агенту не сообщается напрямую, как поступить или какое действие предпринять. Он на основе своего опыта узнает, какие действия приводят к наибольшему вознаграждению. Действия ученика определяются не только сиюминутным результатом, но и последующими действиями, и случайными вознаграждениями [4].
Что характерно, многие обучающие программы построены непосредственно на игровых технологиях, зарекомендовавших себя как одни из наиболее эффективных методов.
Проблематики, имеющие особое значение для успешных игровых приложений, включают в себя такие педагогические цели, как: обучение играть в конкретную игру, обучение об игроках, понимание поведения игроков, интерпретация моделей и, конечно же, производительность. Эти потребности могут быть интерпретированы как призыв к новым практическим и теоретическим инструментам, чтобы помочь [7]:
Do'stlaringiz bilan baham: |