Q:
Защо е важно учените с данни да търсят прозрачност?
A:Прозрачността по същество е важна за проектите за научни данни и програмите за машинно обучение, отчасти поради сложността и сложността, която ги задвижва - защото тези програми „учат“ (генерират вероятни резултати), а не следват предварително зададени линейни инструкции за програмиране и защото в резултат на това, може да е трудно да се разбере как технологията достига до заключения. Проблемът с „черната кутия“ на алгоритмите за машинно обучение, които не са напълно обясними за хората, вземащи решения, е голям в тази област.
Имайки това предвид, възможността да овладеят обяснимо машинно обучение или „обясним ИИ“ вероятно ще бъде основен акцент в начина, по който компаниите преследват придобиването на таланти за учен с данни. Вече DARPA, институцията, която ни донесе интернет, финансира многомилионно проучване в обяснителен ИИ, опитвайки се да насърчи уменията и ресурсите, необходими за създаване на технологии за машинно обучение и изкуствен интелект, прозрачни за хората.
Един от начините да се мисли за това е, че често има „етап на грамотност“ за развитие на таланти и „етап на хиперлитература“. За научен работник с данни, традиционният етап на грамотност би бил знанието за това как да съставят програми за машинно обучение и как да изграждат алгоритми с езици като Python; как да изградим невронни мрежи и да работим с тях. Етапът на хиперграмотност би бил способността да се овладее обясним ИИ, да се осигури прозрачност при използването на алгоритми за машинно обучение и да се запази прозрачността, тъй като тези програми работят за своите цели и целите на техните мениджъри.
Друг начин да се обясни значението на прозрачността в науката за данните е, че използваните набори от данни продължават да стават все по-сложни и следователно по-потенциално навлизащи в живота на хората. Друг основен двигател на обяснимото машинно обучение и науката за данните е Европейският общ регламент за защита на данните, който наскоро беше приложен, за да се опита да ограничи неетичното използване на личните данни. Използвайки GDPR като тестов случай, експертите могат да видят как необходимостта от обяснение на проекти за научни данни се вписва в опасенията за поверителност и сигурност, както и в бизнес етиката.