Tác giả: L.M.L

Phân phối Poisson - toán thống kê (Phần 5)

Phân phối Poisson - toán thống kê (Phần 5)

Phân phối Poisson là gì? Nếu lấy định nghĩa về phân phối Poisson từ wiki, sẽ thấy khó hiểu: Phân phối Poisson (phân phối Poa-dông) là một phân phối xác suất rời rạc. Nó khác với các phân phối xác suất rời rạc khác ở chỗ thông tin cho biết không phải là xác suất để một sự kiện (event) xảy ra (thành công) trong một lần thử như trong phân phối Bernoulli, hay là số lần mà sự kiện đó xảy ra trong n lần thử như trong phân phối nhị thức, mà chính là trung bình số lần ... »

Save, load data bằng TFRecord và tf.data.Dataset

Save, load data bằng TFRecord và tf.data.Dataset

Bình thường mới học sử dụng Tensorflow, nhiều bài hướng dẫn sẽ yêu cầu ta download dataset về, và load toàn bộ dataset trên local RAM để sử dụng. Tuy nhiên nếu dữ liệu đến hàng triệu, tỉ dòng dữ liệu trên máy thì sẽ rất nặng. Trong bài viết này, chúng ta sẽ sử dụng TFRecord và tf.data.Dataset để lưu và xử lý dữ liệu hiệu quả hơn. TFRecord là gì TFRecord là định dạng văn bản để lưu trữ một chuỗi các bản ghi nhị phân. Chuyển đổi sang TFRecord có một số lợi thế sau: ... »

Giới thiệu về Focal Loss

Giới thiệu về Focal Loss

1. Focal loss là gì? Loss là loss function trong machine learning. Focal có nghĩa là trọng tâm. Focal Loss là một loại loss trong machine learning. Focal loss dùng để giảm độ quan trọng cho những dữ liệu thuật toán đã học tốt rồi, và tập trung học những dữ liệu khó học hơn. Paper ban đầu sử dụng focal loss cho object classification. Tuy nhiên, focal loss có thể áp dụng vào những bài toán có class imbalance cao. Ví dụ, xác xuất người bị ung thư trên thế giới là 198/100,000 người. Nếu chúng ta ... »

Exponential Smoothing (Phần 1)

Exponential Smoothing (Phần 1)

Định Nghĩa Simple exponential smoothing (SES) là một phương pháp dự đoán dữ liệu theo thời gian. Nó sử dụng tổng có trọng lượng của dữ liệu trước trong dãy dữ liệu theo thời gian để đoán các dữ liệu trong tương lai. Có thể hiểu đơn giản SES là phương pháp, sử dụng khái niệm:"Dữ liệu mới quan trọng hơn dữ liệu cũ". Ví dụ đơn giản: Giả sử từ đầu tháng 4, nhiệt độ tuần 1 là 20 độ Nhiệt độ tuần 2 là 23 độ Nhiệt độ tuần 3 là 25 độ Từ nhiệt ... »

Phân phối mẫu của tỷ lệ mẫu

Phân phối mẫu của tỷ lệ mẫu

Mở đầu Bài viết sẽ đề cập đến các khái niệm và tính chất về phân phối mẫu của tỷ lệ mẫu. Trước khi tiếp tục đọc, các bạn nên nắm rõ về tính chất và công thức của phân phối nhị thức và phân phối chuẩn. Nếu muốn, các bạn có thể đọc bài viết trước về khái niệm này: Bài viết sẽ sử dụng ngôn ngữ lập trình Python để các bạn có thể tính toán theo, tuy nhiên những bạn không biết lập trình có thể bỏ qua các phần này và tiếp tục đọc . Phân phối ... »

Khoảng tin cậy cho trung bình (Toán thống kê phần 4)

Khoảng tin cậy cho trung bình (Toán thống kê phần 4)

Mở đầu Bài blog này sẽ giải thích cách tính khoảng tin cậy (confidence interval) cho trung bình. Bài đề cập đến các khái niệm phân phối chuẩn và khoảng tin cậy cho tỷ lệ trong hai bài blog trước. Các bạn có thể đọc ở đây: Phân phối chuẩn và các giá trị thống kê https://blog.vietnamlab.vn/2019/12/20/cac-loai-phan-phoi-va-tinh-chat/ Khoảng tin cậy cho tỉ lệ https://blog.vietnamlab.vn/2020/06/23/toan-thong-ke-2/ Công thức Công thức tính khoảng tin cậy cho trung bình sử dụng độ lệch chuẩn của tổ hợp Công thức tính ... »