Съдържание:
Определение - Какво означава Q-обучение?
Q-обучение е термин за структура на алгоритми, представляваща безпроблемно моделиране на обучение. Чрез оценка на политиката и използване на стохастично моделиране, Q-обучението намира най-добрия път напред в процеса на решение на Марков.
Техопедия обяснява Q-обучение
Техническият състав на алгоритъма за Q-обучение включва агент, набор от състояния и набор от действия на държава.
Функцията Q използва тежести за различни стъпки във връзка с коефициент на отстъпка, за да оцени наградите.
Въпреки че може да изглежда проста идея, Q-обучението е от първостепенно значение при много видове модели за укрепване на обучението и задълбоченото обучение. Един от най-добрите примери е, когато дълбокото Q-обучение се използва за подпомагане на програми за машинно обучение за усвояване на стратегии за игра в различни видове видеоигри, например в Atari игри от 80-те години. Тук конволюционната невронна мрежа взема проби от игра, за да изработи стохастичен модел, който ще помогне на компютъра да знае как да играе играта по-добре във времето.
Q-обучението има богат потенциал за подпомагане на развитието на изкуствения интелект и машинното обучение.
