У дома тенденции Защо анотацията на данни е важна в някои проекти за машинно обучение?

Защо анотацията на данни е важна в някои проекти за машинно обучение?

Anonim

Q:

Защо анотацията на данни е важна в някои проекти за машинно обучение?

A:

Анотацията на данни е важна при машинното обучение, тъй като в много случаи това прави работата на програмата за машинно обучение много по-лесна.

Това е свързано с разликата между контролираното и не контролираното машинно обучение. При контролираното машинно обучение данните за обучението вече са етикетирани, така че машината да може да разбере повече за желаните резултати. Например, ако целта на програмата е да идентифицира котки в изображения, системата вече има голям брой снимки, маркирани като котки или не. След това използва тези примери, за да контрастира с нови данни, за да направи своите резултати.

Безплатно изтегляне: Машинното обучение и защо има значение

При безконтролно машинно обучение няма етикети и затова системата трябва да използва атрибути и други техники за идентифициране на котките. Инженерите могат да обучават програмата за разпознаване на визуални характеристики на котки като мустаци или опашки, но процесът едва ли е толкова лесен, колкото би бил при контролираното машинно обучение, където тези етикети играят много важна роля.

Анотация на данни е процесът на поставяне на етикети към наборите от данни за обучение. Те могат да се прилагат по много различни начини - по-горе говорихме за анотация на двоични данни - котки или не котки, но също така са важни и други видове анотация на данни. Например в медицинската област анотацията на данни може да включва маркиране на специфични биологични изображения с етикети, идентифициращи патология или маркери на болести за други медицински свойства.

Анотацията на данни отнема работа - и често се прави от екипи от хора - но тя е основна част от това, което прави много проекти за машинно обучение да функционират точно. Той предвижда, че първоначалната настройка за преподаване на програма какво трябва да научи и как да дискриминира различни входни данни, за да излезе с точни резултати.

Защо анотацията на данни е важна в някои проекти за машинно обучение?