OpenClaw: Khi trợ lý AI không chỉ "trả lời" mà còn biết "hành động"

Hãy tưởng tượng một ngày làm việc điển hình: bạn đang code dở thì khách hàng nhắn qua Zalo hỏi tiến độ dự án, đồng nghiệp ping trên Slack về bug cần fix gấp, lịch họp trên Google Calendar bị đổi mà không ai báo, và bạn vẫn chưa trả lời email quan trọng từ sáng. Bạn mở ChatGPT hỏi "giúp tôi quản lý mấy việc này" — và nó trả lời bằng một danh sách gạch đầu dòng rất đẹp. Nhưng thực tế? Bạn vẫn phải tự tay làm từng thứ một.

Đây chính là bài toán mà rất nhiều developer đang gặp: các trợ lý AI hiện tại rất giỏi "nói" nhưng không biết "làm". Chúng stateless — quên sạch sau mỗi phiên. Chúng thụ động — chỉ phản hồi khi được hỏi. Và chúng bị nhốt trong trình duyệt — không chạm được vào terminal, email, hay tin nhắn Zalo của bạn.

Nếu bạn cũng từng ước "giá mà có con AI nào nó tự chạy lệnh, tự gửi tin nhắn, tự nhắc việc cho mình" — thì OpenClaw chính là thứ bạn đang tìm. Và trong bài viết này, mình sẽ mổ xẻ cách nó hoạt động bên dưới, rồi cùng nhau cài đặt và chạy thử trên macOS luôn.


OpenClaw là gì? Tại sao 250k+ developers đang dùng nó?

Nói ngắn gọn, OpenClaw là một nền tảng trợ lý AI cá nhân mã nguồn mở, tự host trên chính máy của bạn. Khác với ChatGPT hay Claude hoạt động trên cloud, OpenClaw chạy local — dữ liệu hoàn toàn thuộc về bạn, và quan trọng nhất: nó chủ động hành động — chạy lệnh shell, điều khiển trình duyệt, quản lý lịch, gửi email, tự động theo dõi và nhắc việc.

Dự án được tạo bởi Peter Steinberger (nhà sáng lập PSPDFKit) vào tháng 11/2025. Ban đầu mang tên "Clawdbot", sau đó đổi thành "Moltbot", rồi chính thức là "OpenClaw" từ ngày 29/01/2026. Chỉ sau vài tháng, dự án đã vượt mốc 250.000 GitHub stars — trở thành một trong những open-source repo tăng trưởng nhanh nhất lịch sử GitHub. Steinberger đã gia nhập OpenAI vào tháng 2/2026, và OpenClaw được chuyển giao cho một quỹ mã nguồn mở độc lập với sự tài trợ từ OpenAI, Vercel, Blacksmith, và Convex.

Vậy cụ thể OpenClaw giải quyết ba "nỗi đau" lớn nhất của AI truyền thống như thế nào?

Persistent memory — không còn "quên sạch mỗi phiên". OpenClaw duy trì bộ nhớ dài hạn qua hệ thống file SOUL.md (tính cách agent), MEMORY.md (bộ nhớ persistent), và workspace files. Agent nhớ mọi thứ bạn đã trao đổi — xuyên suốt các phiên, các ngày, thậm chí các tuần.

Proactive actions — không ngồi chờ bạn ra lệnh. Hỗ trợ cron jobs, reminders, webhooks, và background tasks. Agent có thể tự kiểm tra email mỗi 30 phút, nhắc bạn uống nước, theo dõi giá cổ phiếu, hay gửi daily report tự động mỗi tối.

Đa nền tảng — không bị nhốt trong trình duyệt. Tích hợp hơn 20 kênh nhắn tin cùng lúc: WhatsApp, Telegram, Slack, Discord, Signal, iMessage, Microsoft Teams, Google Chat, Matrix, IRC — và đặc biệt là Zalo cùng Zalo Personal. Riêng điểm này đã làm OpenClaw cực kỳ thiết thực cho anh em developer Việt Nam.

Dự án theo giấy phép MIT — hoàn toàn miễn phí. Bạn chỉ cần tự cung cấp API key cho LLM provider là xong.


Kiến trúc kỹ thuật: Hub-and-Spoke với Gateway làm trung tâm

Phần này mình sẽ đi sâu vào cách OpenClaw vận hành bên dưới — phần mà dân kỹ thuật chúng ta quan tâm nhất.

OpenClaw sử dụng kiến trúc hub-and-spoke với một tiến trình Gateway duy nhất làm control plane. Toàn bộ hệ thống được xây dựng bằng TypeScript trên Node.js ≥ 22, tổ chức dưới dạng monorepo với pnpm workspaces. Dưới đây là cái nhìn tổng quan:

WhatsApp / Telegram / Slack / Discord / Zalo / iMessage / Teams / WebChat / ...
     │
     ▼
┌───────────────────────────────┐
│         Gateway               │
│     (control plane)           │
│   ws://127.0.0.1:18789       │
└──────────────┬────────────────┘
               │
               ├─ Pi Agent Runtime (RPC)
               ├─ CLI (openclaw …)
               ├─ WebChat UI / Dashboard
               ├─ macOS menu bar app
               └─ iOS / Android nodes

Gateway — "bộ não" điều phối mọi thứ

Gateway là một WebSocket server (mặc định port 18789) đóng vai trò trung tâm: kết nối các kênh nhắn tin, điều phối tin nhắn đến Agent Runtime, quản lý sessions, tools, và events. Nó chạy dưới dạng background service qua launchd (macOS) hoặc systemd (Linux), nghĩa là bạn tắt terminal vẫn chạy bình thường.

Agent Runtime — vòng lặp "suy nghĩ và hành động"

Agent Runtime dựa trên Pi SDK (được phát triển bởi Mario Zechner), được nhúng trực tiếp qua createAgentSession() chứ không phải subprocess. Runtime thực hiện vòng lặp 6 bước mỗi khi nhận tin nhắn:

  1. Channel Adapter → chuẩn hóa tin nhắn từ WhatsApp/Telegram/Slack/... thành format chung
  2. Gateway Server → nhận và phân phối tin nhắn
  3. Lane Queue → đảm bảo serial execution (không bị race condition)
  4. Agent Runner → chọn model, lắp ráp prompt, gắn context từ SOUL.md và MEMORY.md
  5. Agentic Loop → model đề xuất tool call → hệ thống thực thi → kết quả trả về → lặp lại cho đến khi hoàn thành
  6. Persist → lưu hội thoại và cập nhật memory

Channel Adapters — "phiên dịch viên" đa ngôn ngữ

Mỗi nền tảng nhắn tin có một adapter riêng: Baileys cho WhatsApp, grammY cho Telegram, discord.js cho Discord, Bolt cho Slack, signal-cli cho Signal. Adapter chuyển đổi tin nhắn gốc thành format chung để Gateway xử lý thống nhất — bạn gửi từ Zalo hay Telegram đều được xử lý như nhau.

AI Models — không bị khóa vendor

OpenClaw hỗ trợ hơn 20 nhà cung cấp LLM: Anthropic Claude (mặc định), OpenAI GPT-4/GPT-5, Google Gemini, xAI Grok, DeepSeek, Mistral, cùng các giải pháp local như Ollama và LM Studio cho chi phí bằng không. Hệ thống còn hỗ trợ model failover — khi một provider lỗi, tự chuyển sang provider khác.

Wire Protocol

Giao tiếp giữa các thành phần dùng WebSocket với JSON payloads. Frame đầu tiên phải là connect, xác thực qua OPENCLAW_GATEWAY_TOKEN. Schemas được định nghĩa bằng TypeBox, tự động chuyển đổi thành JSON Schema cho validation.


Demo: Cài đặt và chạy OpenClaw trên macOS

Đủ lý thuyết rồi — giờ mình cùng thực hành nhé. Dưới đây là hướng dẫn cài đặt step-by-step trên macOS.

Yêu cầu hệ thống

  • macOS 12 (Monterey) trở lên
  • Apple Silicon (M1/M2/M3/M4) hoặc Intel
  • Ít nhất 8 GB RAM
  • Node.js 22+

Bước 1: Cài đặt OpenClaw

Bạn có 3 cách, chọn cách nào tiện nhất:

bash

# Cách 1: Script chính thức (khuyên dùng — tự cài Homebrew và Node.js nếu thiếu)
curl -fsSL https://openclaw.ai/install.sh | bash

# Cách 2: Qua npm
npm install -g openclaw@latest

# Cách 3: Qua pnpm
pnpm add -g openclaw@latest
Tip: Nếu sau khi cài xong mà gõ openclaw báo "command not found", chạy thêm:bash
export PATH="$(npm prefix -g)/bin:$PATH"
source ~/.zshrc

Bước 2: Chạy Onboarding Wizard

bash

openclaw onboard --install-daemon

Wizard này sẽ dẫn bạn qua từng bước: cấu hình API key cho LLM provider (Claude, GPT-4, Gemini...), chọn kênh nhắn tin muốn kết nối, và cài launchd daemon để Gateway tự khởi động cùng macOS.

Bước 3: Kiểm tra và khởi động

bash

# Kiểm tra mọi thứ đã ổn chưa
openclaw doctor

# Xem trạng thái Gateway
openclaw gateway status

# Mở Dashboard trên trình duyệt
openclaw dashboard
# → Tự mở http://127.0.0.1:18789/

Bước 4: Gửi tin nhắn đầu tiên

bash

# Gửi tin nhắn test qua CLI
openclaw message send --target +84912345678 --message "Xin chào từ OpenClaw!"

# Hoặc đơn giản hơn — chat trực tiếp qua Dashboard web UI

Bước 5: Cài thêm Skills từ ClawHub

ClawHub (https://clawhub.ai) là "npm dành cho AI agents" — registry với hơn 13.700+ skills do cộng đồng xây dựng. Ví dụ:

bash

# Tìm skill quản lý GitHub
clawhub search "github automation"

# Cài skill
clawhub install github-pr-reviewer

# Cập nhật tất cả skills đã cài
clawhub update --all

Skills phủ rộng mọi lĩnh vực: Obsidian, Notion, Gmail, GitHub, Home Assistant, Spotify, và rất nhiều nữa.

macOS Companion App (Menu Bar)

Ngoài CLI, OpenClaw còn có một ứng dụng Swift chạy trên menu bar macOS với các tính năng macOS-only: Canvas visual workspace, Camera, Screen Recording, Voice Wake (tương tác bằng giọng nói hands-free), và tích hợp iMessage. Khá tiện nếu bạn muốn "hỏi nhanh" mà không cần mở terminal.

Bonus: Chạy 24/7 trên Mac Mini

Nhiều anh em trong cộng đồng dùng Mac Mini M4 làm "dedicated server" cho OpenClaw. Setup cũng không phức tạp: bật "Wake for network access", tắt SSH password auth, cài Tailscale cho truy cập từ xa an toàn, dùng Amphetamine để máy không tự ngủ. Tổng thời gian setup khoảng 2 giờ là xong.


Những thứ hay ho khác: Tools, cấu hình, và hệ sinh thái

25+ Built-in Tools

OpenClaw tích hợp sẵn bộ tools khá "xịn", cấu hình qua ~/.openclaw/openclaw.json:

ToolLàm gì?
execChạy lệnh shell trong workspace
browserĐiều khiển Chrome/Chromium (screenshot, navigate, click)
web_searchTìm kiếm web qua Brave Search API
web_fetchFetch và trích xuất nội dung từ URL
cronLên lịch tác vụ tự động
messageNhắn tin cross-channel (gửi, react, pin, tìm kiếm)
read/write/editThao tác file
memory_searchTìm kiếm bộ nhớ persistent
canvasVisual workspace
imagePhân tích hình ảnh

Tools được nhóm thành profiles: minimal, coding, messaging, và full. Hệ thống exec approval ba mức (ask/record/ignore) đảm bảo bạn kiểm soát được những gì agent được phép chạy.

Cấu trúc thư mục workspace

~/.openclaw/
├── openclaw.json          # Config chính (agents, channels, models, tools)
├── openclaw.db            # SQLite database (memory, sessions)
├── workspace/
│   ├── SOUL.md            # Tính cách agent — bạn customize ở đây
│   ├── MEMORY.md          # Bộ nhớ dài hạn
│   ├── AGENTS.md          # Cấu hình multi-agent
│   ├── USER.md            # Thông tin về bạn (để agent hiểu context)
│   ├── memory/            # Log bộ nhớ hàng ngày
│   └── skills/            # Skills workspace-specific

Cảnh báo bảo mật — đọc trước khi deploy production

Sức mạnh đi kèm rủi ro. Và với OpenClaw, bảo mật là thứ bạn bắt buộc phải quan tâm:

  • CVE-2026-25253 — một lỗ hổng RCE nghiêm trọng đã được phát hiện và vá. Luôn cập nhật phiên bản mới nhất.
  • Cisco phát hiện 341+ skills độc hại trên ClawHub, bao gồm cả skill xếp hạng #1 thực hiện data exfiltration. Hơn 40.000 instances bị phát hiện exposed trên internet công cộng.
  • Luôn bind Gateway vào 127.0.0.1không bao giờ 0.0.0.0
  • Bật exec_approval cho các tools nguy hiểm
  • Dùng Tailscale cho truy cập từ xa thay vì port forwarding
  • Chạy openclaw security audit định kỳ (50+ checks, 12 danh mục)
  • Xem xét kỹ mọi third-party skill trước khi cài

Lời kết

OpenClaw là một bước tiến lớn trong thế giới personal AI agents. Lần đầu tiên, một dự án mã nguồn mở cho phép bất kỳ developer nào tự host một trợ lý AI toàn diện — kết nối mọi kênh nhắn tin, có persistent memory, và tự động hóa thực sự. Kiến trúc hub-and-spoke gọn gàng, hệ thống plugin extensible, và hỗ trợ 20+ LLM providers tạo nên một nền tảng linh hoạt đáng kinh ngạc.

Tuy nhiên, bảo mật vẫn là thách thức lớn nhất. Mô hình "chạy mọi thứ trên máy cá nhân" tạo bề mặt tấn công rộng, skills độc hại vẫn tồn tại trên ClawHub, và prompt injection chưa có giải pháp triệt để. Với sự hỗ trợ từ OpenAI và Vercel cùng cộng đồng 250k+ developers, OpenClaw có tiềm năng trở thành tiêu chuẩn cho personal AI agents — nhưng hãy chắc chắn bạn hiểu rõ rủi ro và áp dụng các biện pháp bảo mật nghiêm ngặt trước khi đưa vào sử dụng thực tế.

Tài liệu tham khảo: