Q:
Защо машинното пристрастие е проблем при машинното обучение?
A:На този въпрос може да се отговори по два различни начина. Първо, защо проблемът с машинното пристрастие е, както в, защо съществува в процесите на машинно обучение?
Машинното обучение, макар и сложно и сложно, е до известна степен ограничено въз основа на наборите от данни, които използва. Изграждането на наборите от данни включва присъщи пристрастия. Точно както в медиите, където пропуските и преднамерените избори за включване могат да покажат определена пристрастност, при машинното обучение наборите от данни, които се използват, трябва да бъдат изследвани, за да се определи какъв вид пристрастия съществува.
Безплатно изтегляне: Машинното обучение и защо има значение |
Например, често срещан проблем технологичните тестове и процесите на проектиране показват предпочитание на един тип потребители пред друг. Един голям пример е различието между половете в света на технологиите.
Защо това има значение и защо се прилага за машинното обучение?
Тъй като липсата на съществуващи жени в тестова среда може да доведе до произведена технология, която е по-малко удобна за потребителя за женската аудитория. Начинът, по който някои експерти описват това, е, че без съществуващи тестове за жени, крайният продукт може да не разпознае приноса на жените-потребители - може да не разполага с инструменти за разпознаване на женската идентичност или адекватно справяне с приноса на жените.
Същото важи за различни етноси, хора от различни религии или всеки друг тип демографски. Без точните данни алгоритмите за машинно обучение няма да работят правилно за даден потребителски набор, така че данните от включването трябва да бъдат нарочно добавени в технологията. Вместо само да вземат първични набори от данни и да засилят присъщите пристрастия, хората, които работят с хора, трябва наистина да разгледат проблема.
Друг пример е машинно машинно обучение, което приема информация за работа и заплата и изплюва резултати. Ако този присъщ набор от данни не се анализира, машината ще засили пристрастията. Ако възприеме, че мъжете притежават огромното мнозинство от изпълнителни задачи и процесът на машинно обучение включва филтриране през суровия набор от данни и връщане на съответните резултати, ще върне резултати, които показват пристрастие на мъжете.
Втората част на въпроса включва защо това пристрастие е толкова вредно. Без адекватен надзор и тестване новите технологии могат да навредят, а не да помогнат на чувството ни за включване и равенство. Ако се въведе нов технологичен продукт, който разпознава лица с по-светла кожа, но не и с по-тъмна кожа, това може да доведе до ескалиращо етническо напрежение и усещането, че въпросната компания не е чувствителна към многообразието. Ако алгоритъмът за машинно обучение възпроизвежда и засилва пристрастията в наборите от данни, този изкуствен интелект ще добави своя глас към човешките гласове и човешките тенденции, които вече съществуват в социалната система, които предпочитат една група хора пред друга.
Най-добрият начин да се справите с това е да разгледате внимателно основните масиви от данни, да използвате подбор на функции, да добавите променлив вход и сами да манипулирате суровите набори от данни и да увеличите реалната сила на машинното обучение с нарочно изработване на данни от човека, за да получите резултат, който дава голяма аналитична сила, но също така и някои от онези човешки прозрения, които компютрите все още не могат да реплицират.