Chào tất cả mọi người, đợt dịch Covid mình có tham gia khóa học về Hive trên Udemy để phục vụ cho dự án. Trong khóa học này, mình sẽ review lại các kiến thức cơ bản và quan trọng khi làm việc với Hive.

Một số kiến thức cơ bản mình sẽ chia sẻ với mọi người trong slide là

  1. Hive là gì ?
  2. Partition và Bucketing trong Hive
  3. Join optimize performace trong Hive
  4. UDF's (User defined function in Hive)
  5. Variables trong Hive

Ngoài ra còn một vài kiến thức cơ bản khác như : Các hàm hay sử dụng, sorting, load XML data vào Hive...Mình sẽ cố gắng tạo các ví dụ demo của khóa học này để mọi người cùng theo dõi.

Dưới đây là slide mình review lại, nếu bạn nào có comment câu hỏi vui lòng comment trong blog này nhé. Mình sẽ trả lời trong sự hiểu biết của mình.

Slide sẽ upload sau khi trình bày kết quả với công ty.