LangChain, LangGraph, LangSmith: Hiểu qua ví dụ build AI tool hỗ trợ HR

LangChain, LangGraph, LangSmith: Hiểu qua ví dụ build AI tool hỗ trợ HR

LangChain, LangGraph, LangSmith: Hiểu qua ví dụ build AI tool hỗ trợ HR Bài viết này giải thích LangChain, LangGraph và LangSmith theo cách gần gũi, dễ hình dung, nhưng vẫn đủ sâu cho developer muốn build AI agent thật. Ví dụ xuyên suốt là một tool tên HR Copilot — trợ lý AI giúp team HR tìm ứng viên, chấm điểm CV, soạn email và theo dõi quy trình tuyển dụng. Mở đầu: Vì sao chỉ gọi LLM là chưa đủ? Giả sử bạn muốn build một tool AI cho team HR. HR nhập vào một câu rất tự nhiên: ... »

Khắc phục lỗi gián đoạn hội thoại AI khi triển khai phiên bản mới

Khắc phục lỗi gián đoạn hội thoại AI khi triển khai phiên bản mới

Lưu ý: Bài viết này không có mã nguồn minh họa. Giải pháp được đề cập vẫn đang trong quá trình review nội bộ nên mình chưa thể chia sẻ phần triển khai cụ thể. Đây là bản tóm tắt những gì mình tìm hiểu được trong tuần qua: hệ thống hiện tại hoạt động như thế nào, tại sao nó gặp lỗi, và một giải pháp phù hợp có thể trông ra sao. Mình đang làm việc trên một ứng dụng chat AI sử dụng Next.js ở frontend, NestJS ở backend và GraphQL để giao tiếp giữa hai ... »

N+1 Query và vấn đề của backend

N+1 Query và vấn đề của backend

Khi backend "chạy được" nhưng không thể scaleTrong rất nhiều hệ thống backend hiện đại, đặc biệt là dùng GraphQL hay các thư viện như Prisma / TypeORM / Sequelize / Hibernate — có một vấn đề gần như mọi team đều từng gặp và xảy ra thường xuyên: N+1 Query ProblemĐiều nguy hiểm là N+1 thường không làm hệ thống chết ngay. Mà nó âm thầm, lặng lẽ làm: Tăng latencyTăng CPU databaseĂn connection poolLàm API chậm dần theo thời gianCho đến khi production traffic tăng đủ lớn. Lúc đó: dashboard load tính bằng giâygraphQL timeoutRDS CPU 100%Redis cũng không ... »

Bring Your Own Key (BYOK): Kiến trúc hệ thống cho việc tích hợp API Key LLM của người dùng

Bring Your Own Key (BYOK): Kiến trúc hệ thống cho việc tích hợp API Key LLM của người dùng

Mở đầu: Vì sao BYOK đang trở thành tiêu chuẩn ngầmNếu bạn đang xây một sản phẩm có tích hợp LLM — chatbot, agent, tool gọi OpenAI/Anthropic — sớm hay muộn bạn sẽ gặp câu hỏi này từ khách hàng enterprise: "Tôi có thể dùng API key của chính mình không?" Lý do họ hỏi không phải vì tiết kiệm vài đô. Đó là: Compliance & data residency: một số tổ chức bị ràng buộc hợp đồng hoặc quy định pháp lý, không được để traffic AI đi qua billing account của bên thứ ba.Rate limit & quota riêng: họ ... »

Hành trình đưa Claude Code vào team qua Amazon Bedrock

Hành trình đưa Claude Code vào team qua Amazon Bedrock

Chuyện bắt đầu từ một buổi sáng thứ Hai. Sếp nhắn trên Slack: "Setup AI coding assistant cho team đi, dùng Claude Code, nhưng phải đi qua Bedrock nhé — security team không cho dùng API key cá nhân." Nghe thì đơn giản. Nhưng khi mình bắt tay vào, mới thấy có kha khá thứ cần hiểu — từ cách Bedrock route requests, cơ chế cache tiết kiệm 90% chi phí, đến chuyện tại sao 1 session dài lại rẻ hơn nhiều session ngắn. Bài này mình kể lại hành trình 5 ngày đó, đi sâu vào phần kỹ thuật để các ... »

Superpowers: Biến AI Coding Agent Thành Senior Developer Có Kỷ Luật

Superpowers: Biến AI Coding Agent Thành Senior Developer Có Kỷ Luật

Superpowers là một methodology + skills framework cho AI coding agents với 228k stars trên GitHub. Nó không làm AI "thông minh hơn" — nó làm AI có kỷ luật hơn: bắt buộc hỏi trước khi code, viết spec, lập plan, TDD, review, rồi mới merge. AI có thể chạy autonomous 1-2 tiếng mà không đi lệch kế hoạch. 1. Vấn đề thực tế mà Superpowers giải quyếtAi dùng Claude Code / Cursor / Codex đều gặp tình huống này: Insight quan trọng: AI không thiếu intelligence. Nó thiếu discipline. Superpowers bổ sung đúng thứ đó. 2. Superpowers là gì?Về bản chất, Superpowers ... »

Reverse Engineering tính năng Memory của ChatGPT: Cơ chế bên trong và cách tự thiết kế tính năng Memorize cho Agent của bạn

Reverse Engineering tính năng Memory của ChatGPT: Cơ chế bên trong và cách tự thiết kế tính năng Memorize cho Agent của bạn

ChatGPT Memory hoạt động như thế nào — và cách tự build Memory System cho AI Agent của bạnTổng quanChắc anh em nào cũng đã gặp cảnh này rồi: Mở ChatGPT lên, chat một hồi, hỏi đủ thứ về dự án. Rồi đóng trình duyệt. Hôm sau mở lại — con bot nhìn mình như người lạ. "Bạn là ai? Bạn đang làm gì vậy?" (sad) Xong tự hỏi: Sao nó không nhớ gì cả? Rồi OpenAI tung ra tính năng Memory — ChatGPT giờ nhớ bạn thích viết TypeScript, nhớ bạn đang build SaaS, nhớ bạn đang dùng Next.js App Router… ... »