Đêm qua theo giờ Việt Nam, Anthropic chính thức ra mắt Claude Opus 4.8, phiên bản nâng cấp trực tiếp từ Opus 4.7 với mức giá không thay đổi. Điểm khác biệt lớn nhất của lần nâng cấp này không nằm ở điểm số benchmark hay tốc độ xử lý, mà nằm ở một thứ ít được các công ty AI nói thẳng: khả năng tự nhận ra khi mình chưa chắc chắn.
Một vấn đề phổ biến với các mô hình AI hiện nay là xu hướng báo cáo tiến độ lạc quan hơn thực tế. Khi được giao viết code hoặc hoàn thành một tác vụ phức tạp, mô hình đôi khi thông báo đã xong trong khi thực tế vẫn còn lỗi chưa được xử lý, hoặc tự tin đưa ra kết luận dù bằng chứng còn mỏng.
![]() |
Anthropic gọi đây là vấn đề về tính trung thực, và đây là trọng tâm cải tiến lớn nhất của Opus 4.8. Theo đánh giá nội bộ của công ty, Opus 4.8 ít bỏ qua lỗi trong code mà không báo cáo hơn khoảng 4 lần so với Opus 4.7. Thay vì tiếp tục chạy khi gặp điểm không chắc chắn, mô hình mới có xu hướng dừng lại và gắn cờ vấn đề để người dùng kiểm tra.
Cùng với cải tiến về tính trung thực, nhóm căn chỉnh của Anthropic cũng ghi nhận Opus 4.8 đạt mức cao mới trên các thước đo về hành vi hỗ trợ người dùng và tôn trọng quyền tự quyết. Tỉ lệ hành vi lệch lạc như lừa dối hoặc hợp tác với các yêu cầu lạm dụng giảm đáng kể so với Opus 4.7, đưa Opus 4.8 về mức tương đương Claude Mythos Preview, mô hình được Anthropic đánh giá là căn chỉnh tốt nhất hiện tại.
Về phía chi phí, thay đổi đáng chú ý nhất trong lần ra mắt này là Fast Mode. Đây là chế độ chạy cùng mô hình Opus 4.8 nhưng ở tốc độ gấp khoảng 2,5 lần so với mặc định, phù hợp với các tác vụ cần phản hồi nhanh hoặc các luồng xử lý bất đồng bộ chạy liên tục.
Điểm mới là mức giá Fast Mode cho Opus 4.8 giảm 3 lần so với Fast Mode của các phiên bản trước, xuống còn 10 USD cho mỗi triệu token đầu vào và 50 USD cho mỗi triệu token đầu ra. Giá sử dụng thông thường không thay đổi, vẫn ở mức 5 USD cho mỗi triệu token đầu vào và 25 USD cho mỗi triệu token đầu ra.
![]() |
Cùng ra mắt trong lần cập nhật này là tính năng Effort Control, cho phép người dùng tự điều chỉnh mức độ nỗ lực Claude bỏ ra cho mỗi phản hồi. Ở mức nỗ lực cao hơn, mô hình suy nghĩ sâu hơn và cho kết quả tốt hơn nhưng tiêu thụ nhiều token hơn và phản hồi chậm hơn.
Ở mức thấp hơn, phản hồi nhanh hơn và tiêu tốn ít hạn mức sử dụng hơn. Anthropic cho biết Opus 4.8 mặc định ở mức nỗ lực cao, và với các tác vụ lập trình thông thường, mức này tiêu thụ lượng token tương đương Opus 4.7 nhưng cho kết quả tốt hơn. Tính năng này có trên tất cả các gói dịch vụ của claude.ai.
Nhìn về phía trước, Anthropic cho biết đang hoàn thiện các biện pháp bảo vệ an toàn để sớm ra mắt rộng rãi Claude Mythos, thế hệ mô hình có khả năng vượt trội hơn toàn bộ dòng Opus hiện tại. Hiện tại một số tổ chức đang sử dụng Mythos Preview cho các tác vụ an ninh mạng trong khuôn khổ Project Glasswing. Anthropic cho biết dự kiến đưa Mythos đến tay toàn bộ khách hàng trong vài tuần tới.


















Anthropic không phát hành AI Mythos vì quá nguy hiểm, Cloudflare dùng thử trên 50 repo thật rồi đồng ý: cần khóa chặt hơn nữa
Apple mất 5 năm xây lớp bảo mật cho MacOS, AI nguy hiểm nhất của Anthropic xuyên thủng chỉ trong 5 ngày
Tuyên bố AI sẽ thay thế kỹ sư phần mềm, nhưng Anthropic trả tới 15 tỷ đồng để tuyển kỹ sư phần mềm: Phần ghi chú mới gây sốc
Giữ kẻ thù ở thật gần: Google rót 40 tỷ USD vào Anthropic, đối thủ đang khiến nhân viên Google rời bỏ Gemini
Cùng chuyên mục
CẬP NHẬT: Đề Văn thi vào lớp 10 2026 của Hà Nội sẽ như thế nào?
Nam ca sĩ đình đám giấu chuyện có con suốt 14 năm qua, nay đùng phát tung ảnh vợ con ai nấy đẹp như tiên giáng trần
Mỹ nhân Hoa ngữ "phim giả tình thật" 2 năm với nam thần Vbiz: Đẹp ngang ngửa Lưu Diệc Phi, từng làm nên lịch sử tại LHP Cánh Diều Vàng
Rùng mình trò “câu view” quái đản của TikToker, ăn gián để lên xu hướng
Cha đẻ Google Brain tố cáo: Nỗi sợ "AI cướp việc làm" đang làm giàu cho các công ty AI, càng nhiều người sợ càng kiếm được nhiều tiền
Họa sĩ Việt vẽ Hoàng Sa - Trường Sa trong Doraemon: Ranh giới giữa bối cảnh “rất Việt Nam” và minh hoạ về Việt Nam rất mong manh