Lucene(루씬)
검색 엔진의 가장 중요한 부분을 담당하는 "색인" 과 "검색" 을 위한 자바로 개발된 라이브러리 이다.
아파치 재단에서 만들어진 프로젝트 이고, 다양한 플랫폼을 지원한다.
Solr(솔라)
솔라는 파일을 인덱스하는 검색엔진으로 XML 요청을 HTTP를 통해 보내는 웹 서비스 API가 있는 검색 서버이다.
그러므로 솔라 검색서버 URL을 사용하여 인터넷을 통해 (HTTP) 파일을 질의하여 인덱스하는 어느 곳에서나 접근할 수 있다.
또한 다른 솔라 검색 서버로 캐싱과 복사가 가능한 최적화된 검색 서버다.
Nutch(넛츠)
오픈소스 웹 검색 소프트웨어로 웹 크롤러의 기능을 제공하고, 수집된 정보들은 루씬을 통하여 검색이 이루어 진다.
정리하자면
루씬은 검색을 위한 API,
솔라는 검색서버,
넛츠는 자료/정보를 수집하는 크롤러
인 셈이다.
'IT-기타(미분류)' 카테고리의 다른 글
10가지 소프트웨어 아키텍처 패턴 요약 (0) | 2020.01.28 |
---|---|
딥러닝, 머신러닝의 차이점? (0) | 2018.10.30 |
Solr vs ElasticSearch 비교 (0) | 2018.10.30 |