Съдържание:
Определение - Какво означава JobTracker?
JobTracker е демон, който работи на двигателя MapReduce на Apache Hadoop. JobTracker е основна услуга, която обработва всички задачи на MapReduce към различните възли в клъстера, в идеалния случай към онези възли, които вече съдържат данните, или най-малкото са разположени в един и същ шкаф като възлите, съдържащи данните.
Техопедия обяснява JobTracker
JobTracker е услугата в Hadoop, която отговаря за приемането на клиентски заявки. Приписва ги на TaskTrackers на DataNodes, където необходимите данни са локално налични. Ако това не е възможно, JobTracker се опитва да възложи задачите на TaskTrackers в същия шкаф, където данните са локално налични. Ако по някаква причина това също се провали, JobTracker възлага задачата на TaskTracker, където има реплика на данните. В Hadoop блоковете данни се репликират през DataNodes, за да се гарантира излишността, така че ако един възел в клъстера не успее, задачата също не се провали.
Процес на JobTracker:
- Заявките за работа от клиентски приложения се получават от JobTracker,
- JobTracker се консултира с NameNode, за да определи местоположението на необходимите данни.
- JobTracker открива TaskTracker възли, които съдържат данните или поне са в близост до данните.
- Заданието се изпраща на избрания TaskTracker.
- TaskTracker изпълнява задачите си, като се следи отблизо от JobTracker. Ако задачата се провали, JobTracker просто предава задачата на друг TaskTracker. Въпреки това, JobTracker сам по себе си е единична точка на провал, което означава, че ако не успее цялата система пада.
- JobTracker актуализира състоянието си, когато работата приключи.
- Клиентът рикуестър вече може да анкетира информация от JobTracker.