Bạn muốn biết cách nào giảm RAM khi chạy model LLM trên máy tính. Bài viết này sẽ hướng dẫn cách giảm RAM 4 lần với quantization. ... »
Giới thiệu Bài viết sẽ đề cập về các khái niệm cơ bản liên quan đến toán thống kê: Định lý giới hạn trung tâm Phân phối mẫu của trung bình mẫu. Công thức trung bình và độ lệch chuẩn. Kiến thức về phân phối chuẩn là cần thiết. Các bạn có thể xem ở bài viết sau: phân phối và tính chất Các bạn có thể tham khảo trước bài phân phối mẫu của tỷ lệ mẫu để làm quen dễ hơn với khái niệm đề cập ở đây: phân phối của tỷ lệ mẫu Định lý giới hạn ... »
Trong phần 2 về exponential smoothing, chúng ta sẽ dự đoán dẽ liệu thời gian có xu hướng (trend) băng model Double Exponential Smoothing. Chúng ta sẽ tự động tìm parameter của model này bằng bayes search. ... »
Tiếp nối phần trước về implement Linear Regression sử dụng Pytorch. Bài viết này chúng ta sẽ tạo model CNN bằng Pytorch để phân loại chữ cổ của Nhật. ... »
Tutorial cơ bản, tạo model Linear Regression bằng pytorch ... »
Phân phối Poisson là gì? Nếu lấy định nghĩa về phân phối Poisson từ wiki, sẽ thấy khó hiểu: Phân phối Poisson (phân phối Poa-dông) là một phân phối xác suất rời rạc. Nó khác với các phân phối xác suất rời rạc khác ở chỗ thông tin cho biết không phải là xác suất để một sự kiện (event) xảy ra (thành công) trong một lần thử như trong phân phối Bernoulli, hay là số lần mà sự kiện đó xảy ra trong n lần thử như trong phân phối nhị thức, mà chính là trung bình số lần ... »
Bình thường mới học sử dụng Tensorflow, nhiều bài hướng dẫn sẽ yêu cầu ta download dataset về, và load toàn bộ dataset trên local RAM để sử dụng. Tuy nhiên nếu dữ liệu đến hàng triệu, tỉ dòng dữ liệu trên máy thì sẽ rất nặng. Trong bài viết này, chúng ta sẽ sử dụng TFRecord và tf.data.Dataset để lưu và xử lý dữ liệu hiệu quả hơn. TFRecord là gì TFRecord là định dạng văn bản để lưu trữ một chuỗi các bản ghi nhị phân. Chuyển đổi sang TFRecord có một số lợi thế sau: ... »
Tìm hiểu về phương pháp đánh giá trung bình khi có 2 nhóm dữ liệu mẫu trở lên ... »