7 отношения: Полезность, Обучение с подкреплением, Функция полезности, Марковский процесс принятия решений, Многоагентная система, Искусственный интеллект, Интеллектуальный агент.
Полезность
Поле́зность блага или товара — его способность удовлетворять какую-либо человеческую потребность.
Новый!!: Q-обучение и Полезность · Узнать больше »
Обучение с подкреплением
Обучение с подкреплением (reinforcement learning) — один из способов машинного обучения, в ходе которого испытуемая система (агент) обучается, взаимодействуя с некоторой средой.
Новый!!: Q-обучение и Обучение с подкреплением · Узнать больше »
Функция полезности
Функция полезности Фу́нкция поле́зности — функция, с помощью которой можно представить предпочтения на некотором множестве альтернатив.
Новый!!: Q-обучение и Функция полезности · Узнать больше »
Марковский процесс принятия решений
Марковский процесс принятия решений (Markov decision process (MDP)) — спецификация задачи последовательного принятия решений для полностью наблюдаемой среды с марковской моделью перехода и дополнительными вознаграждениями.
Новый!!: Q-обучение и Марковский процесс принятия решений · Узнать больше »
Многоагентная система
Обычный агент Обучающийся агент Многоагентная система (МАС, Multi-agent system) — это система, образованная несколькими взаимодействующими интеллектуальными агентами.
Новый!!: Q-обучение и Многоагентная система · Узнать больше »
Искусственный интеллект
Иску́сственный интелле́кт (ИИ; artificial intelligence, AI).
Новый!!: Q-обучение и Искусственный интеллект · Узнать больше »
Интеллектуальный агент
Обычный агент Обучающийся агент Термины «агент» и «интеллектуальный агент» (ИА) имеют два значения, и из-за этого иногда возникает путаница.
Новый!!: Q-обучение и Интеллектуальный агент · Узнать больше »