Báo cáo nghiên cứu quý là hoạt động định kỳ hàng quý tại GMO Z.com Việt Nam Lab Center. Với một đội ngũ kỹ sư luôn ham học hỏi để trau dồi trình độ kỹ thuật hiện tại cũng như nắm bắt các công nghệ mới, các kỹ sư của GMO Z.com Việt Nam Lab Center luôn tận dụng khoảng thời gian 2 tuần nghiên cứu mỗi quý để tập trung trau dồi trình độ kỹ thuật hiện tại nhằm giải quyết các vấn đề đang gặp phải hoặc nắm bắt các công nghệ mới mà mình đang quan tâm.
Trong buổi báo cáo nghiên cứu quý 1/2019 diễn ra vào ngày 22/3 vừa qua, các kỹ sư của GMO Z.com Việt Nam Lab Center đã trình bày các kết quả đạt được của 2 đề tài là Xử lý ảnh tự nhận diện khách hàng đến nhà hàng và Nghiên cứu về Web Crawler.
1. Đề tài Xử lý ảnh tự nhận diện khách hàng đến nhà hàng
Bài toán nhận diện khuôn mặt đã được nhiều người nghiên cứu và phát triển. Tuy nhiên, vẫn còn nhiều vấn đề như tốc độ xử lý, độ chính xác, xử lý nhiễu,... đặc biệt khi xử lý ảnh real time từ camera. Trong nghiên cứu này, đã thực hiện các phương pháp như sử dụng API và thư viện khác nhau ngoài xử lý các phương pháp tăng tốc độ và xử lý nhiễu vô cùng hiệu quả.
Các công nghệ sử dụng:
- Deep learning
- Face detection
- Face recognition
- Object tracking
Nếu đầu tư triển khai đề tài này, có thể tạo ra robot phục vụ trong các nhà hàng có khả năng tự nhận diện khách hàng và tự động đưa ra lời chào, tự động đề xuất những thực đơn yêu thích cho khách dựa trên lịch sử khách đã đến nhà hàng trước đây.
Quá trình nhận diện khuôn mặt khách hàng
2. Đề tài Nghiên cứu về Web Crawler
Bài báo cáo đã giới thiệu về Web Crawler, các lợi ích mà Web Crawler mang lại cũng như luồng xử lý Web Crawler.
Web Crawler là 1 loại bot. Nó sẽ vào các địa chỉ URL gốc lọc thông tin rồi tìm ra các địa chỉ URL khác, thêm chúng vào danh sách các địa chỉ đã duyệt qua gọi là crawl frontier. Nó lặp đi lặp lại quá trình đó duyệt qua những URL mới. Cứ thế, nó lần qua rất nhiều địa chỉ website và thu thập rất nhiều nội dung khác nhau giúp ta dễ dàng tìm kiếm thông tin mình cần.
Luồng xử lý Web Crawler
Các công nghệ sử dụng:
- Ngôn ngữ Java
- Crawler4j: Thư viện mã nguồn mở crawl dữ liệu
- Jsoup: Java HTML Parser sử dụng để phân tích tài liệu HTML
- Mecab: Tách từ trong tiếng Nhật (word segment)
- MySQL: Cơ sở dữ liệu