Người dùng Anthropic Claude Opus 4.7, phiên bản AI mới nhất và mạnh mẽ nhất của Anthropic, đang đối mặt với một thực tế bất ngờ: chi phí sử dụng thực tế tăng vọt, mặc dù công ty tuyên bố giữ nguyên giá mỗi token so với phiên bản tiền nhiệm 4.6. Theo các phân tích dữ liệu ban đầu từ các nhà phát triển vào cuối tháng 5/2024, nguyên nhân chính nằm ở bộ mã hóa (tokenizer) mới, khiến mỗi yêu cầu tiêu thụ nhiều token hơn đáng kể, đặc biệt với nội dung code, gây ra gánh nặng tài chính lớn hơn cho các nhà phát triển và doanh nghiệp sử dụng AI.

Vì sao chi phí Claude Opus 4.7 lại tăng dù giá token giữ nguyên?

Anthropic, nhà phát triển đứng sau dòng mô hình ngôn ngữ lớn Claude, đã giới thiệu Opus 4.7 với nhiều cải tiến về hiệu suất. Tuy nhiên, điều mà nhiều người dùng không ngờ tới là sự thay đổi trong cách mô hình "đếm" từ ngữ. Mặc dù giá niêm yết cho mỗi token của Opus 4.7 vẫn giống như Opus 4.6, nhưng theo các nhà phát triển như Abhishek Ray từ Claude Code Camp, phiên bản mới này lại "đốt" token nhanh hơn đáng kể cho cùng một lượng nội dung.

Vấn đề nằm ở bộ mã hóa (tokenizer) mới. Tokenizer là công cụ chia văn bản thành các "token" – đơn vị nhỏ nhất mà mô hình AI có thể xử lý. Với bộ mã hóa mới của Opus 4.7, cùng một đoạn văn bản hoặc mã nguồn có thể được chia thành nhiều token hơn so với phiên bản trước. Điều này có nghĩa là, dù giá mỗi token không đổi, tổng số token tiêu thụ cho một tác vụ sẽ cao hơn, kéo theo tổng chi phí cũng tăng lên.

Nhận định quan trọng: Mặc dù Anthropic giữ nguyên giá mỗi token cho Claude Opus 4.7, nhưng việc thay đổi bộ mã hóa (tokenizer) đã khiến mỗi yêu cầu tiêu thụ nhiều token hơn đáng kể, dẫn đến chi phí thực tế tăng vọt cho người dùng.

Phân tích dữ liệu ban đầu: Mức độ tăng token thực tế

Các phát hiện của Abhishek Ray không phải là duy nhất. Hướng dẫn di chuyển của chính Anthropic cũng đã đề cập đến mức tăng từ 1.0 đến 1.35 lần về số lượng token. Tuy nhiên, các số liệu thực tế từ cộng đồng cho thấy mức tăng này có thể còn cao hơn, đặc biệt đối với một số loại nội dung nhất định.

Theo Ray, đối với nội dung mã nguồn thực tế trên Claude Code, số lượng token trung bình tăng 1.325 lần. Với các tệp CLAUDE.md, mức tăng là 1.445 lần, và đối với tài liệu kỹ thuật, con số này lên tới 1.47 lần. Một đánh giá cộng đồng khác trên tokens.billchambers.me, tổng hợp từ 483 lượt gửi, thậm chí còn chỉ ra mức tăng 37.4% về số lượng token và chi phí cho mỗi yêu cầu.

1.325xTăng token cho mã nguồn Claude
1.47xTăng token cho tài liệu kỹ thuật
37.4%Tăng token trung bình (cộng đồng)

Nội dung nào bị ảnh hưởng nhiều nhất bởi bộ mã hóa mới?

Phân tích của Ray cũng chỉ ra rằng không phải mọi loại nội dung đều bị ảnh hưởng như nhau. Mã nguồn (code) là loại nội dung chịu ảnh hưởng nặng nề nhất từ sự thay đổi của bộ mã hóa. Điều này có thể do mã nguồn thường chứa nhiều ký tự đặc biệt, cấu trúc định dạng phức tạp, và các từ khóa cụ thể mà bộ mã hóa mới có thể xử lý thành nhiều token hơn.

Ngược lại, văn xuôi (prose) chỉ chứng kiến mức tăng nhẹ hơn. Điều thú vị là các văn bản tiếng Trung và tiếng Nhật hầu như không bị ảnh hưởng. Điều này có thể liên quan đến cách các ngôn ngữ này được mã hóa và phân tách thành token ban đầu, vốn đã khác biệt so với các ngôn ngữ dựa trên bảng chữ cái Latinh.

Thông tin cần lưu ý: Các nhà phát triển sử dụng Claude Opus 4.7 để xử lý mã nguồn hoặc tài liệu kỹ thuật sẽ cảm nhận rõ rệt nhất sự tăng chi phí do số lượng token tiêu thụ tăng cao.

Tác động tài chính trực tiếp lên người dùng Claude Code

Để hình dung rõ hơn về tác động tài chính, Ray đã đưa ra một ví dụ cụ thể. Đối với một phiên làm việc mẫu gồm 80 lượt tương tác, ông ước tính chi phí sẽ tăng thêm từ 20 đến 30 phần trăm. Điều này có nghĩa là, một hóa đơn ban đầu khoảng 6.65 USD có thể tăng lên từ 7.86 USD đến 8.76 USD. Mức tăng này, dù có vẻ nhỏ lẻ trong một phiên, nhưng sẽ tích lũy nhanh chóng đối với các dự án lớn hoặc các doanh nghiệp có nhu cầu sử dụng AI thường xuyên.

$6.65 lên $8.76Chi phí ước tính tăng cho 80 lượt tương tác với Claude Opus 4.7

Đối với các startup và nhà phát triển cá nhân, việc tăng chi phí này có thể ảnh hưởng đáng kể đến ngân sách phát triển và khả năng thử nghiệm các ý tưởng mới. Các doanh nghiệp lớn hơn cũng cần đánh giá lại mô hình chi phí của mình khi tích hợp Claude Opus 4.7 vào quy trình làm việc.

Đổi lại, người dùng nhận được gì từ Claude Opus 4.7?

Mặc dù chi phí tăng, Anthropic cũng không ngừng cải thiện hiệu suất của mô hình. Đổi lại cho việc "đốt" nhiều token hơn, người dùng nhận được khả năng tuân thủ hướng dẫn (instruction following) tốt hơn một chút. Một thử nghiệm sử dụng chuẩn IFEval trên 20 lời nhắc (prompt) cho thấy Claude Opus 4.7 tuân thủ các hướng dẫn nghiêm ngặt đáng tin cậy hơn 5 điểm phần trăm so với phiên bản tiền nhiệm.

Đây là một cải tiến quan trọng, đặc biệt đối với các tác vụ yêu cầu độ chính xác cao và khả năng hiểu ngữ cảnh sâu sắc từ mô hình AI. Tuy nhiên, câu hỏi đặt ra là liệu mức cải thiện này có đủ để biện minh cho sự gia tăng đáng kể về chi phí hay không. Đối với nhiều người dùng, đặc biệt là những người có ngân sách hạn chế, chi phí có thể là yếu tố quyết định quan trọng hơn hiệu suất tăng nhẹ.

Ưu điểm của Claude Opus 4.7

  • Khả năng tuân thủ hướng dẫn tốt hơn (5% trên IFEval).
  • Hiệu suất tổng thể được cải thiện (mặc dù bài viết không đi sâu vào chi tiết).

Hạn chế của Claude Opus 4.7

  • Chi phí thực tế tăng đáng kể do bộ mã hóa mới.
  • Tiêu thụ nhiều token hơn cho cùng một nội dung, đặc biệt là code.

Anthropic sẽ giải quyết vấn đề tăng chi phí này như thế nào?

Vấn đề tăng chi phí do bộ mã hóa mới đặt ra một thách thức cho Anthropic. Để duy trì sự cạnh tranh và sự hài lòng của người dùng, công ty có thể cần phải xem xét các giải pháp. Một số khả năng bao gồm:

  • Tối ưu hóa bộ mã hóa: Phát triển một bộ mã hóa hiệu quả hơn, giảm số lượng token cần thiết cho cùng một nội dung mà không ảnh hưởng đến hiệu suất.
  • Cung cấp các phiên bản mô hình khác nhau: Giới thiệu các phiên bản Opus 4.7 được tối ưu hóa cho chi phí, có thể với hiệu suất thấp hơn một chút nhưng giá thành phải chăng hơn cho các tác vụ không quá khắt khe.
  • Chính sách giá linh hoạt: Đưa ra các gói cước hoặc chính sách giá ưu đãi cho người dùng có khối lượng lớn hoặc các loại nội dung cụ thể.
  • Tăng cường minh bạch: Cung cấp thông tin rõ ràng hơn về cách bộ mã hóa hoạt động và ước tính chi phí cho các loại nội dung khác nhau.
Cảnh báo: Người dùng cần theo dõi sát sao thông báo từ Anthropic về các chính sách giá và cập nhật mô hình trong tương lai để tránh những bất ngờ về chi phí.

Điều này có nghĩa gì với bạn?

Đối với các nhà phát triển và doanh nghiệp đang sử dụng hoặc dự định sử dụng Claude Opus 4.7, việc hiểu rõ về cơ chế tăng chi phí này là vô cùng quan trọng. Bạn cần chủ động theo dõi mức tiêu thụ token của mình, đặc biệt nếu bạn đang xử lý nhiều mã nguồn hoặc tài liệu kỹ thuật. Việc tối ưu hóa lời nhắc (prompts) để giảm thiểu số lượng token đầu vào và đầu ra cũng là một chiến lược hiệu quả.

Ngoài ra, hãy cân nhắc xem liệu mức tăng 5% về khả năng tuân thủ hướng dẫn có thực sự cần thiết cho các trường hợp sử dụng cụ thể của bạn hay không. Trong một số tình huống, việc sử dụng các phiên bản Claude cũ hơn hoặc thậm chí các mô hình AI khác có thể là lựa chọn kinh tế hơn mà vẫn đáp ứng được yêu cầu công việc. Việc đánh giá lại ngân sách AI và chiến lược sử dụng mô hình là điều cần thiết trong bối cảnh chi phí AI đang ngày càng phức tạp.

Câu hỏi thường gặp về chi phí Claude Opus 4.7

Bộ mã hóa (tokenizer) là gì và tại sao nó ảnh hưởng đến chi phí?

Bộ mã hóa là công cụ chia văn bản thành các đơn vị nhỏ hơn gọi là "token" để mô hình AI có thể xử lý. Khi bộ mã hóa mới của Claude Opus 4.7 chia cùng một nội dung thành nhiều token hơn, tổng số token tiêu thụ sẽ tăng lên, dẫn đến chi phí cao hơn dù giá mỗi token không đổi.

Làm sao để kiểm tra chi phí token của tôi khi dùng Claude Opus 4.7?

Bạn có thể theo dõi mức tiêu thụ token thông qua bảng điều khiển (dashboard) của Anthropic hoặc sử dụng các công cụ lập trình để đếm số token trước khi gửi yêu cầu đến API. Việc này giúp bạn ước tính và kiểm soát chi phí tốt hơn.

Có cách nào để giảm chi phí khi dùng Claude Opus 4.7 không?

Để giảm chi phí, bạn có thể tối ưu hóa lời nhắc (prompts) để chúng ngắn gọn và hiệu quả hơn, giảm thiểu lượng văn bản không cần thiết. Ngoài ra, hãy cân nhắc sử dụng các phiên bản Claude cũ hơn hoặc các mô hình AI khác cho các tác vụ không yêu cầu hiệu suất cao nhất của Opus 4.7.

Điểm Chính Cần Nhớ

  • Claude Opus 4.7 có chi phí thực tế cao hơn đáng kể so với 4.6 do bộ mã hóa mới tiêu thụ nhiều token hơn.
  • Mã nguồn và tài liệu kỹ thuật là các loại nội dung bị ảnh hưởng nặng nề nhất bởi sự tăng token.
  • Đổi lại, Opus 4.7 mang lại khả năng tuân thủ hướng dẫn tốt hơn 5% nhưng người dùng cần cân nhắc liệu lợi ích này có xứng đáng với chi phí tăng thêm hay không.