Съдържание:
Определение - Какво означава кръстосана валидация?
Кръстосаното валидиране е техника, която се използва за оценка на това как резултатите от статистическия анализ се обобщават до независим набор от данни. Кръстосаното валидиране се използва до голяма степен в настройки, където целта е прогнозиране и е необходимо да се оцени точността на изпълнението на предсказуем модел. Основната причина за използването на кръстосано валидиране, а не конвенционалното валидиране е, че няма достатъчно данни за тяхното разпределение в отделни групи за обучение и тестове (както при конвенционалното валидиране). Това води до загуба на способността за тестване и моделиране.
Кръстосаното валидиране е известно още като оценка на въртене.
Техопедия обяснява кръстосаното валидиране
За проблем с прогнозирането модел обикновено се предоставя с набор от данни с известни данни, наречени набор от данни за тренировки, и набор от неизвестни данни, срещу които се тества моделът, известен като набор от данни за изпитване. Целта е да има набор от данни за тестване на модела във фазата на обучение и след това да се даде представа как конкретният модел се адаптира към независим набор от данни. Кръг кръстосана валидиране включва разпределението на данните на допълнителни подмножества, след което извършване на анализ на едно подмножество. След това анализът е валидиран за други подмножества (тестови групи). За да се намали променливостта, се извършват много кръгове на кръстосано валидиране, като се използват много различни дялове и след това се вземат средна стойност от резултатите. Кръстосаното валидиране е мощна техника при оценката на техниката на изпълнение на модела.
