Giới thiệu về Claude Opus 4.5

1. Claude Opus 4.5 là gì?

Claude Opus 4.5 là phiên bản nâng cấp của dòng mô hình Opus do Anthropic phát hành vào ngày 27/11/2025. Đây là mô hình được thiết kế dành cho môi trường làm việc chuyên nghiệp, là phiên bản nâng cấp toàn diện của Opus 4.1.

Opus 4.5 hướng đến độ chính xác, ổn định và khả năng lập luận sâu, nên phù hợp cho các ứng dụng đòi hỏi độ tin cậy cao như coding assistants, agent tự động, hệ thống RAG thông minh, phân tích dữ liệu chuyên sâu…

2. Claude Opus 4.5 có gì mới?

a. Kết quả benchmark SWE-bench

Kết quả bài test SWE-bench Verified (n=500) cho thấy độ chính xác khi mô hình tự sửa lỗi hoặc triển khai patch code. Opus 4.5 dẫn đầu tuyệt đối về accuracy với 80.9%, vượt Sonnet 4.5 (77.2%) và GPT-5.1 Codex-Max (77.9%).

So với phiên bản Opus 4.1, accuracy tăng +6.4% — mức tăng rất lớn trong benchmark SWE-bench.

Điều này cho thấy Opus 4.5 có khả năng:

Hiểu ngữ cảnh code sâu hơn
Sửa lỗi ít hallucination hơn
Reasoning dài hơi tốt hơn

Nếu bạn xây hệ thống coding agent, Opus 4.5 hiện là lựa chọn tốt nhất.

b. Các cải tiến nổi bật khác

Tham số effort mới: kiểm soát trực tiếp độ sâu của reasoning (0 → 2)

Opus 4.5 giới thiệu tham số effort, cho phép lập trình viên điều chỉnh mức độ nỗ lực suy nghĩ của mô hình theo 3 cấp:

effort = 0 → Phản hồi nhanh, ngắn gọn, dùng cho yêu cầu nhẹ.

effort = 1 → Cân bằng giữa tốc độ, chi phí và chất lượng.

effort = 2 → Lập luận sâu, nhiều bước, độ chính xác cao nhất.

Đây là lần đầu tiên Anthropic cho phép developer điều khiển trực tiếp độ sâu reasoning thay vì để mô hình tự ước lượng.
Hiệu quả rõ nhất khi phân tích lỗi trong codebase lớn, thiết kế kiến trúc hệ thống (system design), lập kế hoạch nhiều bước (multi-step reasoning), giải thuật phức tạp hoặc tối ưu hóa logic

effort = 2 giúp mô hình mở rộng số lượng “internal thought steps” (mà người dùng không thấy), từ đó tăng đáng kể tỉ lệ chính xác tương tự việc “suy nghĩ kỹ hơn” trước khi trả lời.

Extended Thinking: mô hình có khả năng suy luận dài hơn, mạch lạc hơn

Opus 4.5 được trang bị khả năng extended thinking, giúp mô hình:

mở rộng chuỗi reasoning
giữ nhịp lập luận ổn định trong các tác vụ dài
không bị “mất ý” giữa chừng
theo sát mục tiêu ban đầu trong suốt cuộc hội thoại

Ở các tác vụ phức tạp (như phân tích performance, viết test scenario, đọc hiểu tài liệu dài…), extended thinking giúp Opus 4.5 đưa ra câu trả lời chi tiết hơn, logic mạch lạc hơn, ít bị lỗi nhảy ý hoặc giải thích sai

So với Opus đời trước, extended thinking của 4.5 cho cảm giác “bám bài toán” tốt hơn nhiều, đặc biệt khi cần output chất lượng cao.

Computer-use / Tool-use được tinh chỉnh để phù hợp cho agent vận hành tự động

Opus 4.5 cải thiện mạnh khả năng sử dụng công cụ, đặc biệt hữu ích khi xây dựng agent chạy tự động:

hiểu hành vi của tool chính xác hơn
giảm lỗi khi tương tác file (đọc / ghi / sửa)
nhận diện đúng yêu cầu trước khi gọi tool
tránh gọi tool thừa hoặc sai
tự duy trì state làm việc ổn định hơn trong các tác vụ dài

Nhờ những cải thiện này, Opus 4.5 phù hợp cho:

AI agent chạy trên repo (code editing, bug fixing, review PR
agent đọc log và sửa lỗi CI/CD
workflow tự động tải dữ liệu, phân tích và xuất báo cáo
pipeline phân tích hệ thống hoặc backend

Tổng thể, việc tinh chỉnh này làm agent hoạt động trơn tru, ổn định và ít sự cố hơn so với các phiên bản trước.

Tối ưu token → giảm chi phí cho cùng một tác vụ

So với Opus đời trước, phiên bản 4.5 có các cải thiện về hiệu quả tính toán:

mô hình tiêu thụ ít token hơn cho cùng lượng nội dung.
Hợp lý hóa cấu trúc reasoning bên trong → giảm token “thừa”
tốc độ phản hồi nhanh hơn → giảm độ trễ trong production
tỉ lệ lỗi reasoning thấp hơn → ít phải yêu cầu mô hình “giải lại”

Điều này dẫn đến chi phí tổng giảm 10–25% tùy tác vụ, đặc biệt trong sinh văn bản dài, phân tích file lớn, workflow nhiều bước, agent sử dụng tool nhiều lần

Nhờ tối ưu token, Opus 4.5 trở thành lựa chọn kinh tế hơn và thực tiễn hơn cho production-level AI.

3. Cost và Efficiency

Model	Giá (input / output per 1M tokens)	Ghi chú
Opus 4.5	$5 / $25 (Anthropic)	Model “flagship”, hiệu năng & reasoning cao
Claude Sonnet 4.5	$3 / $15 (Claude)	Cân bằng giữa giá & hiệu năng
Claude Haiku 4.5	$1 / $5 (Claude)	Rẻ nhất, phù hợp tác vụ nhẹ, simple
(Trước) Claude Opus 4.1 / Opus 4	$15 / $75 (Claude Docs)	Đắt hơn — chi phí cao hơn nhiều
(Tham khảo thị trường) Gemini 3 Pro / GPT-5.1	Thông tin biến động — thường rẻ hơn Opus 4.5 (H2S Media)	Giá thấp hơn nhưng hiệu năng & tool-use có thể khác biệt

Opus 4.5 hiện có mức giá rẻ hơn đáng kể so với Opus 4 / 4.1 trước đây — giảm từ $15/$75 xuống $5/$25, tức khoảng ⅓ giá cũ.

So với các model giá rẻ hơn như Sonnet 4.5 hoặc Haiku 4.5 — Opus 4.5 đắt hơn. Nhưng bù lại, nó được thiết kế cho tác vụ nặng, coding, agent, reasoning phức tạp — nơi mà Sonnet/Haiku có thể không đủ mạnh.

Vì vậy, nếu bạn cần hiệu năng cao + reasoning & tool-use mạnh + output chất lượng cao, Opus 4.5 có thể là “đắt xắt ra miếng”. Nếu bạn chỉ cần xử lý đơn giản — Sonnet hoặc Haiku có thể tiết kiệm hơn.

4. Ví dụ

a. Lấy API Key

Truy cập: https://console.anthropic.com

Đăng ký / đăng nhập tài khoản.

Mở tab API Keys → Create Key.

Copy API Key này và lưu lại dưới dạng biến môi trường:

macOS / Linux

export ANTHROPIC_API_KEY="YOUR_KEY_HERE"

Windows PowerShell

setx ANTHROPIC_API_KEY "YOUR_KEY_HERE"

b. Cài SDK (Node.js)

Yêu cầu Node.js ≥ 18.

npm install @anthropic-ai/sdk

Tạo file index.js để test.

c. Gửi Request đơn giản

import Anthropic from "@anthropic-ai/sdk";

const client = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY
});

(async () => {
  const res = await client.messages.create({
    model: "claude-3-opus-4.5",
    max_tokens: 200,
    messages: [
      { role: "user", content: "Hello, explain what you can do" }
    ],
  });

  console.log(res);
})();

d. Ví dụ Weather Tool có sử dụng tham số effort

Định nghĩa tool Weather

const tools = [
  {
    name: "get_weather",
    description: "Lấy thông tin thời tiết theo thành phố.",
    input_schema: {
      type: "object",
      properties: {
        city: { type: "string", description: "Tên thành phố" }
      },
      required: ["city"]
    }
  }
];

Gửi request sử dụng Tool + effort

effort (0 → 2) cho phép kiểm soát độ sâu reasoning:

effort: 0 → phản hồi nhanh, reasoning thấp

effort: 1 → cân bằng tốc độ & chất lượng

effort: 2 → reasoning sâu nhất, phân tích kỹ hơn (tốn token hơn nhưng thông minh hơn)

Ví dụ dưới đây dùng effort = 2 để nhấn mạnh việc mô hình sẽ phân tích kỹ hơn trước khi quyết định gọi tool:

import Anthropic from "@anthropic-ai/sdk";

const client = new Anthropic({
  apiKey: process.env.ANTHROPIC_API_KEY
});

(async () => {
  const response = await client.messages.create({
    model: "claude-3-opus-4.5",
    max_tokens: 300,
    effort: 2, // ⭐ Reasoning sâu và kỹ hơn
    tools,
    messages: [
      {
        role: "user",
        content: "Thời tiết hôm nay ở Tokyo thế nào?"
      }
    ]
  });

  console.log(JSON.stringify(response, null, 2));
})();

Sau khi Claude trả về tool_call:

{
  "type": "tool_call",
  "name": "get_weather",
  "input": { "city": "Tokyo" }
}

Bạn sẽ thực thi tool đó (backend của bạn viết), rồi gửi kết quả ngược lại qua messages.create() lần 2 để Claude hoàn thiện câu trả lời.

Phân tích nhanh cách hoạt động của API

Claude nhận message:

Bạn gửi messages.create() với:

prompt người dùng
danh sách tools
tham số effort (độ sâu reasoning)

Claude quyết định hành động:

Dựa trên reasoning (được nâng mạnh ở Opus 4.5), Claude có thể trả lời ngay, hoặc yêu cầu gọi tool (tool_call) hoặc phân tích thêm (nhất là khi effort = 2)

Backend xử lý tool:

Khi có tool_call, backend của bạn sẽ xử lý gọi API thời tiết thật hoặc trả về dữ liệu mock

Gửi tool result lại cho Claude:

Claude nhận tool result và tổng hợp thành câu trả lời mượt hơn.

5. Khi nào nên sử dụng Claude Opus 4.5?

Bạn nên chọn Opus 4.5 khi:

Cần độ chính xác rất cao trong coding, debugging, patching
Làm việc với agent tự động, cần tool-use mượt
Cần reasoning sâu cho: phân tích dữ liệu, logic nhiều bước, lập trình thuật toán
Làm hệ thống RAG chất lượng cao (chống hallucination tốt)
Viết tài liệu kĩ thuật, phân tích codebase lớn
Cần mô hình mạnh nhưng vẫn muốn tối ưu chi phí hơn GPT-5.x

Không nên dùng nếu bạn chỉ làm tác vụ đơn giản như tóm tắt, viết ngắn – khi đó Sonnet 4.5 hoặc GPT-mini là đủ.

6. Kết luận

Claude Opus 4.5 là phiên bản nâng cấp mạnh mẽ nhất của dòng Opus tính đến hiện tại, tập trung vào ba yếu tố: khả năng reasoning sâu, tự động hóa bằng tool/computer-use, và tối ưu chi phí vận hành thực tế. Với tham số effort mới, extended thinking, cùng độ ổn định cao trong các tác vụ dài hạn, Opus 4.5 trở thành lựa chọn phù hợp cho lập trình viên, doanh nghiệp xây hệ thống agent, và các quy trình có độ phức tạp lớn.