Nếu là coder chắc hẵn đa số đều biết qua regex (viết tắt của Regular Expression, tên thuần Việt là biểu thức chính quy). Nó thường được sử dụng để validate chuỗi ký tự như email, ip address hay tìm kiếm/thay thế chuỗi... Regex khá hữu ích không chỉ trong code mà còn cách lĩnh vực khác. Trong bài viết này mình sẽ tổng hợp lại cách dùng cũng như những kinh nghiệm cá nhân trong khi sử dụng regex. 1. Giới thiệu Trước khi đi vào chi tiết thì mình sẽ nhắc lại regex là gì? Regular expression ... »
BERT là mô hình ngôn ngữ (language model) đầu tiên được huấn luyện không giám sát (unsupervised) và được học sâu 2 chiều (deeply bidirectional) và thể hiện được kết quả vượt trội hơn hẳn các mô hình trước đó trong các bài toán xử lý ngôn ngữ tự nhiên (NLP). Tuy nhiên, BERT cũng có những điểm bất lợi của riêng mình: chi phí huấn luyện (training) mô ... »