Tác giả: L.M.L

Giới thiệu về Focal Loss

Giới thiệu về Focal Loss

1. Focal loss là gì? Loss là loss function trong machine learning. Focal có nghĩa là trọng tâm. Focal Loss là một loại loss trong machine learning. Focal loss dùng để giảm độ quan trọng cho những dữ liệu thuật toán đã học tốt rồi, và tập trung học những dữ liệu khó học hơn. Paper ban đầu sử dụng focal loss cho object classification. Tuy nhiên, focal loss có thể áp dụng vào những bài toán có class imbalance cao. Ví dụ, xác xuất người bị ung thư trên thế giới là 198/100,000 người. Nếu chúng ta ... »

Exponential Smoothing (Phần 1)

Exponential Smoothing (Phần 1)

Định Nghĩa Simple exponential smoothing (SES) là một phương pháp dự đoán dữ liệu theo thời gian. Nó sử dụng tổng có trọng lượng của dữ liệu trước trong dãy dữ liệu theo thời gian để đoán các dữ liệu trong tương lai. Có thể hiểu đơn giản SES là phương pháp, sử dụng khái niệm:"Dữ liệu mới quan trọng hơn dữ liệu cũ". Ví dụ đơn giản: Giả sử từ đầu tháng 4, nhiệt độ tuần 1 là 20 độ Nhiệt độ tuần 2 là 23 độ Nhiệt độ tuần 3 là 25 độ Từ nhiệt ... »

Phân phối mẫu của tỷ lệ mẫu

Phân phối mẫu của tỷ lệ mẫu

Mở đầu Bài viết sẽ đề cập đến các khái niệm và tính chất về phân phối mẫu của tỷ lệ mẫu. Trước khi tiếp tục đọc, các bạn nên nắm rõ về tính chất và công thức của phân phối nhị thức và phân phối chuẩn. Nếu muốn, các bạn có thể đọc bài viết trước về khái niệm này: Bài viết sẽ sử dụng ngôn ngữ lập trình Python để các bạn có thể tính toán theo, tuy nhiên những bạn không biết lập trình có thể bỏ qua các phần này và tiếp tục đọc . Phân phối ... »

Khoảng tin cậy cho trung bình (Toán thống kê phần 4)

Khoảng tin cậy cho trung bình (Toán thống kê phần 4)

Mở đầu Bài blog này sẽ giải thích cách tính khoảng tin cậy (confidence interval) cho trung bình. Bài đề cập đến các khái niệm phân phối chuẩn và khoảng tin cậy cho tỷ lệ trong hai bài blog trước. Các bạn có thể đọc ở đây: Phân phối chuẩn và các giá trị thống kê https://blog.vietnamlab.vn/2019/12/20/cac-loai-phan-phoi-va-tinh-chat/ Khoảng tin cậy cho tỉ lệ https://blog.vietnamlab.vn/2020/06/23/toan-thong-ke-2/ Công thức Công thức tính khoảng tin cậy cho trung bình sử dụng độ lệch chuẩn của tổ hợp Công thức tính ... »

Confidence Interval - Khoảng tin cậy (Toán Thống Kê: Phần 3)

Confidence Interval - Khoảng tin cậy (Toán Thống Kê: Phần 3)

Mở đầu Bài viết này sẽ giải thích về các khái niệm khi tính toản khoảng tin cậy và cách tính khoảng tin cậy (sử dụng python). Các bạn nên đọc trước bài viết về phân phối chuẩn và các tính chất trong phân phối chuẩn https://blog.vietnamlab.vn/2019/12/20/cac-loai-phan-phoi-va-tinh-chat/ Bài toán thống kê Giả sử có một máy bán kẹo có kẹo màu xanh lá cây và các màu khác (xanh, đỏ, vàng, trắng...). Trong máy bán kẹo có 10,000 viên kẹo. Ta muốn bến phần trăm viên kẹo có màu xanh lá cây ... »

Test Driven Development bằng Python

Test Driven Development bằng Python

Mở đầu Trong các dự án, nhất là gần đến deadline, chúng ta hay tăng tốc độ programming, sửa đổi nhiều chỗ để chương trình hoạt động. Ngược lại, điều đấy khiến chúng ta bỏ qua một số lỗi lập trình, gây ảnh hưởng đến kết quả và thời gian dự án. Bài viết này là về phương thức TDD, một phương pháp lập trình nhấn mạnh vào việc testing code ngay từ đầu. Bài viết sẽ tập trung vào Unit Test và một chút Integration Testing. TDD đảm bảo là code chúng ta tạo xử lý nhiều trường hợp ... »

Các loại phân phối và tính chất

Các loại phân phối và tính chất

Mở đầu Bài viết dưới sẽ đề cập đến w loại phân phối: Phân phối nhị thức Phân phối chuẩn (Gaussian) Phân phối là gì Một phân phối xác xuất là một hàm số cho biết xác xuất của các kết quả khác nhau trong mộ thí nghiệm. Với tất cả phân phối có 3 khái niệm quan trọng: Trung bình Độ biến thiên Độ lệch chuẩn Phân phối nhị thức Chúng ta sẽ bắt đầu bằng phân phối nhị thức vì nó là phân phối dễ hiểu nhất. Các điều kiện để phân phối là nhị thức (biến ngẫu ... »

Kiểm định giả thuyết thống kê (Toán Thống kê Phần 2)

Kiểm định giả thuyết thống kê (Toán Thống kê Phần 2)

Mở đầu Kiểm định giả thuyết thống kê là một trong những phương pháp quan trọng nhằm đưa ra kết luận về tập hợp dữ liệu, dựa vào một mẫu dữ liệu nhỏ hơn lấy từ tập hợp đó. Bài viết dưới đây sẽ đề cập đến 3 vấn đề chính: Giới thiệu bài toán kiểm định giả thuyết thống kê, cộng với phương hướng giải. Ví dụ bài toán, cách giải và code về kiểm định giả thuyết thống kê về tỷ lệ Ví dụ bài toán, cách giải và code về kiểm định giả thuyết thống kê về ... »