Q:
Защо матрицата за объркване е полезна в ML?
A:Има няколко начина да се говори защо матрицата на объркване е ценна при машинното обучение (ML) - но един от най-простите начини е да се обясни, че матрицата на объркване е ресурс за визуализация на данни.
Матрицата за объркване позволява на зрителите да видят с един поглед резултатите от използването на класификатор или друг алгоритъм. Използвайки обикновена таблица за показване на аналитични резултати, матрицата на объркване по същество сваля вашите резултати в по-смилаем изглед.
Матрицата за объркване използва специфична терминология за подреждане на резултатите. Има истински позитиви и истински отрицания, както и фалшиви положителни и лъжливи отрицания. За по-сложна матрица на объркване или такава, базирана на сравнителна класификация, тези стойности могат да бъдат показани като действителни и прогнозирани класове за два отделни обекта.
Независимо от семантичната терминология, резултатите се групират в квадратна (или правоъгълна) таблица.
Този изглед улеснява анализаторите да видят колко точен е алгоритъмът при класифицирането на резултатите. (Прочетете нови генератори, които поставят съвременните алгоритми да работят върху ASCII чл.)
Полезността на матрицата за объркване е свързана със сложността на ML проектите, а също и с начина, по който информацията се форматира и предоставя на потребителите. Представете си низ от линейни резултати, включително фалшиви положителни, лъжливи отрицания, истински позитиви и истински отрицания. (Прочетете машинно обучение 101.)
Потребителят трябва да таблицира всички тези линейни резултати в графика, за да разбере как работи алгоритъмът и колко точно е той. С матрицата на объркване тази информация е просто представена в мощен визуален модел.
Да предположим, например, че на машината се иска да класифицира 20 изображения, от които пет са плодове и пет - зеленчуци. Ако матрицата за объркване съдържа следното съдържание (горе вляво по посока на часовниковата стрелка): 7, 5, 3, 5, тогава матрицата показва, че седем са правилно идентифицирани като зеленчуци, докато три са правилно класифицирани като плодове.
Останалите 10, както е представено, са резултати, при които програмата не е успяла да идентифицира правилно изображението.
Матрицата за объркване ще бъде полезна при всички видове ML анализи. Наблюдавайки този ресурс, потребителите могат да измислят как да се справят с проблеми като размерност и надстройка и други начини за оптимизиране на алгоритъм.