Mô hình AI nguy hiểm Anthropic Mythos bị rò rỉ: Ai đứng sau?

Vào ngày 7 tháng 4 vừa qua, một sự cố bảo mật nghiêm trọng đã gây chấn động cộng đồng AI khi mô hình trí tuệ nhân tạo Mythos của Anthropic, một công cụ an ninh mạng được đánh giá là cực kỳ mạnh mẽ và tiềm ẩn nhiều rủi ro nếu rơi vào tay kẻ xấu, đã bị một nhóm người dùng trái phép truy cập. Theo báo cáo từ Bloomberg, vụ việc xảy ra thông qua môi trường của một nhà cung cấp bên thứ ba, làm dấy lên những lo ngại sâu sắc về khả năng kiểm soát và bảo vệ các công nghệ AI tiên tiến nhất hiện nay.

Mythos là gì và tại sao lại nguy hiểm?

Mythos, hay còn được gọi là Claude Mythos Preview, là một mô hình AI đa năng mới được phát triển bởi Anthropic, một trong những công ty hàng đầu trong lĩnh vực AI. Điểm đặc biệt và cũng là lý do khiến Mythos trở nên nguy hiểm nằm ở khả năng vượt trội của nó trong việc xác định và khai thác các lỗ hổng bảo mật. Theo Anthropic, mô hình này có thể tìm ra điểm yếu "trong mọi hệ điều hành lớn và mọi trình duyệt web chính khi được người dùng chỉ đạo".

Chính vì tiềm năng "hai lưỡi" này – vừa có thể dùng để bảo vệ, vừa có thể dùng để tấn công – Anthropic đã quyết định không phát hành Mythos ra công chúng. Thay vào đó, quyền truy cập chính thức vào mô hình này được giới hạn nghiêm ngặt cho một số ít công ty thông qua sáng kiến Project Glasswing, bao gồm các ông lớn công nghệ như Nvidia, Google, Amazon Web Services, Apple và Microsoft. Thậm chí, nhiều chính phủ cũng đang để mắt đến công nghệ này vì ứng dụng tiềm năng của nó trong an ninh quốc gia. Anthropic không có kế hoạch phát hành công khai mô hình này do lo ngại rằng nó có thể bị vũ khí hóa và gây ra những hậu quả khôn lường.

Nhận định quan trọng: Khả năng "hai lưỡi" của AI như Mythos – vừa là công cụ bảo vệ, vừa là vũ khí tấn công – đặt ra thách thức đạo đức và an ninh lớn nhất cho các nhà phát triển và chính phủ trong kỷ nguyên AI.

Chi tiết vụ rò rỉ Anthropic Mythos: Ai đã đột nhập?

Vụ việc truy cập trái phép mô hình Mythos được cho là xảy ra vào ngày 7 tháng 4, đúng ngày Anthropic công bố phát hành Mythos cho một số lượng hạn chế các công ty để thử nghiệm. Nhóm đã giành quyền truy cập trái phép không được công khai danh tính, nhưng Bloomberg báo cáo rằng các thành viên của nhóm này là một phần của một kênh Discord riêng tư, chuyên tìm kiếm thông tin về các mô hình AI chưa được phát hành.

Một thành viên giấu tên của nhóm, được xác định là "một nhà thầu bên thứ ba của Anthropic", đã tiết lộ với Bloomberg rằng nhóm đã đột nhập vào Mythos thông qua sự kết hợp của nhiều chiến thuật. Điều này bao gồm việc tận dụng quyền truy cập của chính nhà thầu và sử dụng "các công cụ dò tìm thông tin trên internet" (internet sleuthing tools) thường được sử dụng.

"Anthropic lo ngại Mythos có thể bị vũ khí hóa, và vụ rò rỉ này cho thấy nỗi sợ đó không phải là không có cơ sở."

Phương thức tinh vi để truy cập mô hình AI bị hạn chế

Cách thức nhóm này truy cập Mythos là một ví dụ điển hình về sự tinh vi của các cuộc tấn công mạng hiện đại. Họ đã sử dụng kiến thức về các định dạng mô hình khác của Anthropic, có được từ một vụ rò rỉ dữ liệu Mercor gần đây, để đưa ra "một phỏng đoán có cơ sở" (an educated guess) về vị trí trực tuyến của Mythos. Điều này cho thấy sự liên kết giữa các vụ vi phạm dữ liệu và cách tin tặc có thể tận dụng thông tin từ một sự cố để khai thác các lỗ hổng khác.

Kể từ khi giành được quyền truy cập, các thành viên của nhóm đã sử dụng Mythos thường xuyên. Để chứng minh cho Bloomberg, họ đã cung cấp ảnh chụp màn hình và thậm chí là một bản demo trực tiếp về hoạt động của mô hình. Tuy nhiên, đáng chú ý là nhóm này được cho là không sử dụng Mythos cho các mục đích an ninh mạng, có lẽ là để tránh bị Anthropic phát hiện. Theo Bloomberg, nhóm này cũng đã truy cập vào các mô hình AI chưa phát hành khác của Anthropic.

Cảnh báo: Sự cố này nhấn mạnh rủi ro lớn từ các nhà cung cấp bên thứ ba và chuỗi cung ứng phần mềm. Một lỗ hổng nhỏ ở một đối tác có thể mở ra cánh cửa cho việc truy cập vào những công nghệ nhạy cảm nhất.

Phản ứng của Anthropic và tình hình hiện tại

Trước thông tin về vụ rò rỉ, một phát ngôn viên của Anthropic đã đưa ra tuyên bố với Bloomberg: "Chúng tôi đang điều tra một báo cáo tuyên bố truy cập trái phép vào Claude Mythos Preview thông qua một trong các môi trường của nhà cung cấp bên thứ ba của chúng tôi."

Anthropic hiện tại chưa có bằng chứng cho thấy việc truy cập trái phép này đang ảnh hưởng đến các hệ thống nội bộ của công ty hoặc vượt ra ngoài môi trường của nhà cung cấp bên thứ ba. Điều này có nghĩa là, ít nhất cho đến thời điểm hiện tại, các hệ thống cốt lõi của Anthropic có vẻ vẫn an toàn. Tuy nhiên, cuộc điều tra vẫn đang diễn ra và mức độ thiệt hại thực sự vẫn chưa được xác định rõ ràng.

Những lo ngại về an ninh và kiểm soát AI siêu việt

Vụ rò rỉ Anthropic Mythos không chỉ là một sự cố bảo mật đơn lẻ mà còn là hồi chuông cảnh tỉnh về những thách thức to lớn trong việc kiểm soát và bảo vệ các mô hình AI tiên tiến. Khi các mô hình như Mythos có khả năng tự động tìm và khai thác lỗ hổng, việc chúng rơi vào tay kẻ xấu có thể dẫn đến những cuộc tấn công mạng quy mô lớn, gây thiệt hại nghiêm trọng cho cơ sở hạ tầng kỹ thuật số toàn cầu.

Các chuyên gia an ninh mạng và nhà đạo đức AI đã liên tục cảnh báo về nguy cơ "vũ khí hóa" AI. Một công cụ được thiết kế để bảo vệ có thể dễ dàng bị biến thành vũ khí hủy diệt nếu không được quản lý chặt chẽ. Vụ việc này càng củng cố thêm lập luận rằng các công ty phát triển AI cần phải đặt an toàn và bảo mật lên hàng đầu, không chỉ trong quá trình phát triển mô hình mà còn trong toàn bộ chuỗi cung ứng và quản lý quyền truy cập.

"Việc bảo mật các mô hình AI mạnh mẽ không chỉ là vấn đề kỹ thuật, mà còn là trách nhiệm đạo đức. Một lỗ hổng nhỏ có thể mở ra cánh cửa cho những rủi ro toàn cầu không lường trước được."

Tiến sĩ Nguyễn AnChuyên gia Bảo mật AI

Câu hỏi thường gặp về vụ rò rỉ Anthropic Mythos

Câu hỏi thường gặp

Mô hình Anthropic Mythos là gì?

Anthropic Mythos là một mô hình AI mạnh mẽ được phát triển bởi Anthropic, có khả năng xác định và khai thác các lỗ hổng bảo mật trong mọi hệ điều hành và trình duyệt web chính.

Ai đã truy cập trái phép Mythos?

Một nhóm nhỏ người dùng thuộc một diễn đàn trực tuyến riêng tư đã truy cập trái phép Mythos, có sự hỗ trợ từ quyền truy cập của một nhà thầu bên thứ ba của Anthropic.

Sự cố này có ảnh hưởng đến hệ thống của Anthropic không?

Anthropic đang điều tra và hiện chưa có bằng chứng cho thấy việc truy cập trái phép này ảnh hưởng đến các hệ thống nội bộ của công ty hoặc vượt ra ngoài môi trường của nhà cung cấp bên thứ ba.

Tại sao Mythos lại được coi là nguy hiểm?

Mythos được coi là nguy hiểm vì khả năng khai thác lỗ hổng bảo mật của nó có thể bị vũ khí hóa và sử dụng cho các mục đích tấn công, gây ra thiệt hại nghiêm trọng nếu rơi vào tay kẻ xấu.

Điều này có nghĩa gì với bạn?

Đối với người dùng cá nhân, vụ việc này là một lời nhắc nhở về tầm quan trọng của việc cập nhật phần mềm và hệ điều hành thường xuyên. Mặc dù Mythos không được phát hành công khai, nhưng sự tồn tại của một công cụ có khả năng tìm kiếm lỗ hổng một cách hiệu quả cho thấy rằng các mối đe dọa mạng luôn rình rập và ngày càng tinh vi.

Đối với các doanh nghiệp, đặc biệt là những doanh nghiệp làm việc với các nhà cung cấp bên thứ ba, đây là một bài học đắt giá về tầm quan trọng của việc kiểm tra và quản lý chặt chẽ quyền truy cập của đối tác. Một lỗ hổng trong chuỗi cung ứng có thể trở thành điểm yếu chí mạng, ảnh hưởng đến toàn bộ hệ thống bảo mật. Việc đầu tư vào các giải pháp bảo mật mạnh mẽ, đánh giá rủi ro định kỳ và thiết lập các giao thức truy cập nghiêm ngặt là điều cần thiết hơn bao giờ hết.

Cuối cùng, đối với toàn ngành AI, vụ rò rỉ Anthropic Mythos là một lời kêu gọi hành động khẩn cấp. Nó nhấn mạnh nhu cầu cấp thiết về các tiêu chuẩn an toàn AI toàn cầu, các quy định minh bạch và một cam kết chung từ các nhà phát triển để đảm bảo rằng công nghệ mạnh mẽ này được sử dụng vì lợi ích của nhân loại, chứ không phải để gây hại.

Điểm Chính Cần Nhớ

Mô hình AI Mythos của Anthropic, một công cụ an ninh mạng cực kỳ mạnh mẽ và tiềm ẩn nguy hiểm, đã bị một nhóm người dùng trái phép truy cập.
Sự cố xảy ra thông qua môi trường của một nhà cung cấp bên thứ ba, cho thấy lỗ hổng nghiêm trọng trong chuỗi cung ứng bảo mật của các công ty AI.
Vụ việc làm dấy lên những lo ngại sâu sắc về khả năng kiểm soát, bảo vệ và rủi ro vũ khí hóa các mô hình AI tiên tiến nếu chúng rơi vào tay kẻ xấu.