Hbase là gì

HBase là 1 hệ cơ sở dữ liệu mã nguồn msinh hoạt được chế tạo dựa trênBigTable được biểu thị vào nghiên cứu: “BigTable: A Distributed Storage Systemystem for Structure Data”. HBase cung ứng năng lực lưu trữ tài liệu bự lên tới mức sản phẩm tỷ dòng, hàng triệu cột không giống nhau tương tự như sản phẩm petabytes dung lượng. HBase là một NoSquốc lộ nổi bật vì thế những tables của HBase không có một schemas thắt chặt và cố định với không tồn tại các quan hệ nam nữ giữa những bảng, ko hỗ trợ phnghiền join giữa các bảng. Hadoop có chức năng không ngừng mở rộng giỏi cùng có phong cách thiết kế nhằm không ngừng mở rộng theo chiều ngang (Scale horizontally).

Bạn đang xem: Hbase là gì


Trong thời điểm này HBase sẽ là một trong những trong số top-level project của tổ chức Apađậy Software Foundation cùng được cung ứng bên dưới giấy phép: Apađậy Lisence 2.0.
HBase được xây cất dựa trên xây cất của Google BigTable cho nên nó cũng có nhiều điểm kiểu như với BigTable.Dữ liệu được lưu trong một table của HBase được khẳng định vì các khóa: “Table, Rowkey, Column Families, Column, Timestamp”.
*


Mỗi table bao gồm tương đối nhiều row, rất có thể lên đến mức hàng tỷ rows trong 1 table của HBase, các row được khẳng định cùng nhau bởi vì 1 khóa độc nhất vô nhị “rowkey”, rowkeyvào HBase có tính năng giống như với Primary key trong các hệ cửa hàng dữ liệu thường thì.Các row trong thuộc 1 talbe luôn luôn được sắp xếp theo vật dụng từ từ bỏ điển theorowkey.Hình sau cho thấy thêm giải pháp mà lại HBase thu xếp dữ liệu Khi ta thêm những row với những rowkey khác nhau:

Trong Lúc trong phân tích cội BigTable chỉ mô tả về single index, tuy vậy vào HBase còn cung cấp Secondary IndexIndexes.

Xem thêm: Triển Khai Phần Mềm Gokids, Triển Khai Phần Mềm Crm Cho Gokids


Mỗi row lại bao gồm các columns khác nhau, các column này lại được gộp thành “column families”.Chúng giúp ta team các tài liệu bao gồm cùng điểm phổ biến lại cùng nhau, phân đội những loại dữ liệu cùng triển khai các chính sách vận dụng lên từng nhóm, ví dụ: nén… Tất cả các columns ở trong cùng 1 column families gần như được tàng trữ với mọi người trong nhà sinh sống trong storage file được call làHFile. Các column families này cần phải được knhì báo Lúc ta chế tạo mới tables phía bên trong HBase với trong một table HBase không nên có rất nhiều column families, hiện thời HBase vẫn không hoạt động tốt với những table có không ít rộng 2 tuyệt 3 columns families.
Không y như các hệ đại lý tài liệu quan hệ giới tính, column vào HBase không quan trọng phải tạo lập từ bỏ Lúc khởi tạo nên bảng nhưng mà ta rất có thể sinh sản bắt đầu column ngay trong quá trình vận động. Trong 1 table hoàn toàn có thể có số lượng column lên đến mức hàng ngàn hoặc nhiều hơn thế nữa. 1 column của Hbase được knhị báo bên dưới dạng:”families: qualifier”, trong các số ấy familieslà tên gọi của columnsfamiliesmà colums được nhóm vào trong số ấy,qualifierđể khẳng định column.

Gía trị của mỗi columns được Hotline là cell, mỗi cells đựng nhiều cặp “version(timestamp, value)”.

Xem thêm: Sửa Lỗi Link Trong Excel - Cách Xóa Link Trong Excel

Trong đó timestamp là giá trị được ra đời vị khối hệ thống hoăc được khẳng định vì chưng người dùng. Các version không giống nhau được rành mạch cùng nhau bởitimestamp, trong một cells hoàn toàn có thể lưu trữ những version của data ứng cùng với thời gian được gửi vào hệ thống không giống nhau. Các version này được thu xếp theo lắp thêm tự từ bắt đầu mang đến cũ. do vậy ta đã đọc các version bắt đầu của data trước kế tiếp đọc mang đến các version cũ hơn của nó…Hình sau diễn tả 1 cách logic giải pháp các version được bố trí trong mỗi rows:

Một điểm khác biệt nữa của HBase đối với những hệ cửa hàng dữ liệu thường thì không giống là những quý giá “null” sẽ không được tàng trữ trong cửa hàng tài liệu HBase. Hình sau mô tả sự không giống nhau trong bí quyết tàng trữ giữa 2 các loại đại lý dữ liệu:
Đơn vị tàng trữ cơ bạn dạng của HBase là region, Việc phân loại tables thành những region bảo đảm an toàn khả năng phân tán với cân nặng bảng download của HBase. Mỗi region đựng 1 dải các row xếp ngay thức thì nhau với chúng sẽ tiến hành auto chia làm 2 ví như tài liệu trong nó trsinh sống lên quá lớn.
Mỗi region ở trong một RegionServer độc nhất, tuy nhiên từng RegionServer lại có thể đựng thuộc 1 thời điểm các region không giống nhau nlỗi hình sau:

Chuyên mục: Hỏi Đáp