Khi làm việc với HBase, người quản lý thường xuyên phải xử lý các yêu cầu liên quan tới backup những dữ liệu cần thiết. Bài viết dưới đây sẽ giới thiệu các phương pháp xử lý và chi tiết cách thức thực hiện backup bằng snapshot. Tổng quan các phương pháp backup dữ liệu HBase Có rất nhiều cách thức để tiến hành công việc này: Snapshots Replication Export CopyTable API Manual - Performance Impact Data Footprint Downtime Incremental Backups Ease of Implementation Mean Time To Recovery (MTTR) Snapshots Minimal Tiny Brief (Only on Restore) No Easy Seconds Replication ... »

Ở bài blog trước, chúng ta đã tìm hiểu các khái niệm cơ bản về Bloom Filter (Giới thiệu về Bloom Filter), ở bài blog lần này, ta sẽ sử dụng Scala để lập trình 1 Bloom Filter đơn giản sử dụng 2 hàm hash là MurmurHash và hàm hashCode của mỗi object của Scala. Trước tiên là khung của class BloomFilter và companion object cho class này class BloomFilter[A](val length: Int, val numHash: Int) { def this(length: Int) = this(length, 3) private val bitArr = new util.BitSet(length) } object BloomFilter { def apply[A](length: Int, numHash: Int) ... »