Съдържание:
Определение - Какво означава Apache Lucene?
Apache Lucene е проект с отворен код за високоефективна и пълнофункционална библиотека за текстови търсачки, който е написан изцяло с помощта на Java.
Той може да търси пълнотекстово търсене в документите, така че е технология, която е подходяща за всяко приложение, което изисква тази функция, особено ако е кросплатформена.
За първи път той е разработен от Дъг Кътнинг през 1999 г. и официално става част от фамилията Джакарта на фондация Apache с проекти с отворен код на Java през септември 2001 г. Той е надстроен до проект Apache от най-високо ниво през февруари 2005 г.
Техопедия обяснява Apache Lucene
Apache Lucene е високоефективна търсачка с концепцията за "документ, съдържащ текстови полета" в основната си логическа архитектура. Това предлага голяма гъвкавост и позволява Lucene API да стане независим от всеки формат на файла.
Всеки текст от формати като MS Word, HTML, XML, PDF и OpenDocument може да бъде индексиран, стига текстовата информация да бъде извлечена, което означава, че не може да направи нищо с изображения.
Lucene е подходящ за всяко приложение, което се нуждае от пълно индексиране на текста и възможност за търсене, но е широко признато като чудесна помощна програма за внедряване на интернет търсачки и за локално търсене в един сайт.
Функциите включват:
- Мащабируемо и високопроизводително индексиране - то може да обработва над 150 Gb на час на съвременен хардуер и изисква само 1 Mb на куп изисквания за памет.
- Мощни, точни и ефективни алгоритми за търсене - той предлага много видове мощни заявки, като заявки за фраза, заместител, близост и обхват. Той също така е провел търсене и сортиране по всяко поле.
- Cross платформа - чиста реализация на Java и също достъпна в други езици за програмиране.
