Hadoop là gì

Hadoop là một Apache framework mã nguồn mở được viết bằng java, cho phép xử lý phân tán (distributed processing) các tập dữ liệu lớn trên các cụm máy tính (clusters of computers) thông qua mô hình lập trình đơn giản. Hadoop được thiết kế để mở rộng quy mô từ một máy chủ đơn sang hàng ngàn máy tính khác có tính toán và lưu trữ cục bộ (local computation and storage).

Apache Solr (search engine) là gì?

Solr là một nền tảng search chuyên nghiệp mã nguồn mở, được viết bằng Java, từ dự án Apache Lucene. Những tính năng chính bao gồm full-text search (tìm kiếm toàn văn bản), hit highlighting (đánh dấu), faceted search (tìm kiếm sắc cạnh), real-time index (đánh chỉ mục thời gian thực), dynamic clustering (phân nhóm linh động), database integration (tích hợp cơ sở dữ liệu), NoSQL và xử lý văn bản phong phú