Key words:collation

Hiểu đúng charset để không còn “mojibake”: UTF-8, EUC-JP, eucjpms & MySQL trong hệ thống Nhật

Hiểu đúng charset để không còn “mojibake”: UTF-8, EUC-JP, eucjpms & MySQL trong hệ thống Nhật

Trong các hệ thống Nhật (đặc biệt là hệ thống cũ), chuyện lỗi font, chữ “髙橋” biến thành ký tự lạ, hay dữ liệu khó migrate không phải chuyện hiếm. Điểm chung: đa phần không bắt đầu từ bug code phức tạp, mà từ một thứ nghe rất nhàm chán: Charset & encoding. Bài này dành cho dev fresher/junior đến mid, đang làm với API, Golang, PHP, MySQL trong môi trường Nhật. Mục tiêu sau khi đọc: Hiểu vì sao lỗi font (mojibake) xảy ra. Đọc được luồng dữ liệu: từ client → API → MySQL → API khác → browser. Nhận ra ... »