Съдържание:
Определение - Какво означава тестов набор?
Тестовият набор в машинното обучение е вторичен (или третичен) набор от данни, който се използва за тестване на програма за машинно обучение, след като е бил обучен на първоначален набор от данни за обучение. Идеята е, че прогнозните модели винаги имат някакъв неизвестен капацитет, който трябва да бъде тестван, за разлика от анализиран от гледна точка на програмирането.
Тестовият набор е известен също като набор от тестови данни или тестови данни.
Techopedia обяснява тестовия комплект
Много експерти биха казали, че най-добрата практика е да има набор от тестови данни, който се „секвестрира“ или съхранява до края на процеса. Инженерите търсят прекомерност на модела и други проблеми в процеса на обучение. В идеалния случай има трети набор, набор от данни за валидиране, който тества параметрите на класификатора. Тогава, и едва тогава, тестовият набор може да бъде изведен, за да се види колко добре е била обучена програмата и дали нейният предсказуем модел е точен за нови данни. Въпреки че някои модели могат да избегнат създаването на разделен набор от тестове, това често се разглежда като късоглед, тъй като липсата на практически тестове може да остави програма, предразположена към неточност.