Tại sao AI sẽ không chậm lại: Cuộc cách mạng 'tính toán hiệu quả' đang tăng tốc
Nếu bạn nghĩ sự phát triển của trí tuệ nhân tạo (AI) sắp chạm ngưỡng giới hạn vật lý hoặc kinh tế, hãy nghĩ lại. Trong một thế giới vận hành theo đường thẳng, chúng ta dễ dự đoán tương lai: đi bộ hai giờ sẽ đi được quãng đường dài gấp đôi một giờ. Nhưng AI đang phát triển theo một quy luật hoàn toàn khác: quy luật hàm mũ. Mustafa Suleyman, đồng sáng lập DeepMind và là một trong những kiến trúc chính của kỷ nguyên AI hiện đại, vừa đưa ra một lập luận thuyết phục rằng bức tường giới hạn mà nhiều người lo sợ sẽ không xuất hiện trong tương lai gần. Lý do nằm ở một cuộc cách mạng thầm lặng nhưng vĩ đại đang diễn ra trong nền tảng của AI: cuộc cách mạng về 'tính toán hiệu quả'.
Bản năng tuyến tính của con người – nghĩ rằng mọi thứ tiến triển theo cộng dồn – đang thất bại thảm hại khi đối mặt với tốc độ tăng trưởng theo cấp số nhân của AI.
Ba trụ cột của cuộc cách mạng phần cứng
Suleyman sử dụng một phép ẩn dụ dễ hiểu: việc huấn luyện AI giống như một căn phòng đầy người với máy tính cầm tay. Trong nhiều năm, tăng sức mạnh chỉ đơn giản là thêm nhiều người và nhiều máy tính hơn vào căn phòng đó. Vấn đề cốt lõi là, những 'công nhân tính toán' này thường xuyên ngồi không, chờ đợi dữ liệu được chuyển đến để thực hiện phép tính tiếp theo. Mọi khoảng dừng đều là tiềm năng bị lãng phí. Sự lãng phí này giờ đây đang bị xóa bỏ bởi ba bước tiến đồng thời trong kiến trúc phần cứng.
1. Tốc độ xử lý thô tăng vọt: Những 'chiếc máy tính cầm tay' cơ bản đã trở nên cực kỳ nhanh. Hiệu năng thô của chip AI, tiêu biểu là từ Nvidia, đã tăng gấp 8 lần chỉ trong 6 năm, từ 312 teraflops vào năm 2020 lên 2,500 teraflops ngày nay.
2. Dữ liệu được 'nuôi' không ngừng nghỉ: Tốc độ không chỉ nằm ở bộ xử lý, mà còn ở việc cung cấp dữ liệu cho nó. Công nghệ bộ nhớ băng thông cao (HBM) xếp chồng các chip nhớ theo chiều dọc như những tòa nhà chọc trời thu nhỏ, giúp tăng tốc độ truyền dữ liệu khổng lồ. Thế hệ HBM3 mới nhất có băng thông gấp ba lần thế hệ trước, đảm bảo luồng dữ liệu liên tục, giữ cho các bộ xử lý luôn trong trạng thái bận rộn.
3. Từ 'căn phòng' đến 'siêu thành phố' tính toán: Đây có lẽ là bước nhảy vọt quan trọng nhất. Các công nghệ kết nối tiên tiến như NVLink và InfiniBand giờ đây có thể liên kết hàng trăm nghìn GPU rời rạc thành những siêu máy tính có kích thước bằng nhà kho, hoạt động như một thực thể nhận thức thống nhất duy nhất. Vài năm trước, điều này là bất khả thi.
"Chúng ta đã đi từ 2 GPU huấn luyện AlexNet vào năm 2012 đến hơn 100,000 GPU trong các cụm máy tính lớn nhất ngày nay, mỗi chiếc còn mạnh mẽ hơn nhiều so với những người tiền nhiệm của chúng."
Tốc độ cải thiện vượt xa mọi dự đoán truyền thống
Khi ba yếu tố phần cứng này hội tụ, kết quả là sự gia tăng đáng kinh ngạc về năng lực tính toán hiệu quả, vượt xa những dự báo lạc quan nhất.
Một ví dụ cụ thể: thời gian huấn luyện một mô hình ngôn ngữ đã giảm từ 167 phút trên 8 GPU vào năm 2020 xuống còn chưa đầy 4 phút trên phần cứng hiện đại tương đương. Trong khi Định luật Moore truyền thống dự đoán cải thiện khoảng 5 lần trong giai đoạn này, thực tế chúng ta đã chứng kiến mức cải thiện 50 lần.
Cuộc cách mạng không dừng lại ở phần cứng. Trên mặt trận phần mềm và thuật toán, những cải tiến còn ấn tượng hơn. Nghiên cứu từ tổ chức Epoch AI cho thấy lượng tính toán cần thiết để đạt được một mức hiệu suất cố định (như độ chính xác trong nhận dạng hình ảnh) đang giảm một nửa sau mỗi 8 tháng. Tốc độ này nhanh hơn rất nhiều so với chu kỳ 18-24 tháng của Định luật Moore. Điều này đồng nghĩa với việc chi phí triển khai và vận hành AI đang sụt giảm chóng mặt.
Một số mô hình AI gần đây đã chứng kiến chi phí triển khai (serving cost) giảm tới 900 lần tính theo cơ sở hàng năm. AI không chỉ đang trở nên mạnh hơn, mà còn rẻ hơn theo cấp số nhân.
Viễn cảnh tương lai: Từ chatbot đến 'đội quân' tác nhân AI tự chủ
Với đà tăng trưởng hiện tại, các con số cho tương lai gần – chỉ 3-5 năm tới – thật sự choáng ngợp và khó hình dung.
- Các phòng lab hàng đầu như của OpenAI, Anthropic, và Google DeepMind đang tăng công suất tính toán với tốc độ gần 4 lần mỗi năm.
- Kể từ 2020, lượng tính toán được sử dụng để huấn luyện các mô hình tiên phong (frontier models) đã tăng gấp 5 lần mỗi năm.
- Dự báo đến năm 2027, tổng năng lực tính toán liên quan đến AI toàn cầu sẽ đạt mức tương đương 100 triệu chip H100 của Nvidia – một mức tăng gấp mười lần chỉ trong ba năm.
Tổng hợp tất cả các yếu tố – từ phần cứng, phần mềm đến kiến trúc hệ thống – Suleyman ước tính chúng ta có thể chứng kiến thêm 1.000 lần cải thiện về tính toán hiệu quả vào cuối năm 2028. Thậm chí, ông đưa ra một viễn cảnh đáng kinh ngạc: đến năm 2030, thế giới có thể cần thêm 200 gigawatt công suất điện mỗi năm chỉ để chạy các trung tâm dữ liệu AI – tương đương mức tiêu thụ năng lượng đỉnh điểm của Anh, Pháp, Đức và Italy cộng lại.
Sự tăng trưởng theo cấp số nhân này không phải là phỏng đoán. Nó được dẫn dắt bởi các khoản đầu tư khổng lồ, lộ trình sản phẩm rõ ràng từ các hãng bán dẫn, và sự cạnh tranh khốc liệt giữa các gã khổng lồ công nghệ.
Vậy tất cả sức mạnh tính toán khổng lồ và ngày càng rẻ này sẽ mang lại điều gì cụ thể? Suleyman tin rằng nó sẽ thúc đẩy quá trình chuyển đổi căn bản: từ những chatbot đơn thuần, chỉ có khả năng phản hồi văn bản, sang các tác nhân AI (AI agents) cấp độ gần như con người.
Đây không còn là những trợ lý ảo thụ động. Chúng là những hệ thống bán tự trị có khả năng:
- Lập kế hoạch và viết mã phần mềm trong nhiều ngày liên tục.
- Thực hiện các dự án phức tạp kéo dài hàng tuần, thậm chí hàng tháng.
- Chủ động thực hiện cuộc gọi, đàm phán điều khoản hợp đồng.
- Quản lý các chuỗi cung ứng và hậu cần logistics.
"Hãy quên đi những trợ lý cơ bản chỉ biết trả lời câu hỏi. Hãy nghĩ đến những đội ngũ 'công nhân AI' có thể suy nghĩ, thảo luận, cộng tác và thực thi các nhiệm vụ phức tạp một cách có tổ chức."
Điều này có nghĩa gì với bạn?
Chúng ta mới chỉ ở chân núi của sự chuyển đổi này, nhưng hệ quả của nó sẽ trải rộng ra ngoài phạm vi công nghệ, chạm đến từng ngóc ngách của nền kinh tế và xã hội.
Đối với doanh nghiệp và nền kinh tế: Mọi ngành công nghiệp dựa trên lao động nhận thức – từ luật sư, tư vấn tài chính, nghiên cứu y sinh, thiết kế kiến trúc đến quản lý dự án và tiếp thị – đều sẽ được định hình lại một cách triệt để. Đây vừa là cơ hội chưa từng có để tự động hóa, tối ưu hóa quy trình và sáng tạo ra những sản phẩm/dịch vụ mới, vừa là lời cảnh báo nghiêm túc về sự xáo trộn thị trường lao động. Các công việc lặp đi lặp lại về mặt trí óc sẽ là mục tiêu tự động hóa đầu tiên.
Đối với cá nhân và sự nghiệp: Việc liên tục học hỏi và thích nghi với các công cụ AI mạnh mẽ sẽ trở thành kỹ năng sống còn, không chỉ cho các kỹ sư phần mềm mà cho hầu hết các ngành nghề tri thức. Giá trị lao động sẽ dịch chuyển từ khả năng thực hiện nhiệm vụ sang khả năng đặt ra vấn đề đúng đắn, giám sát, đánh giá và tích hợp đầu ra từ các tác nhân AI, cũng như đưa ra các quyết định mang tính đạo đức và chiến lược mà máy móc chưa thể thay thế.
Đối với xã hội và quản trị: Sự xuất hiện của các "đội quân" tác nhân AI bán tự trị đặt ra những câu hỏi hóc búa về trách nhiệm pháp lý, an ninh mạng, an ninh việc làm và sự phân bổ của cải trong xã hội. Các chính sách và khung quản trị mới cần được xây dựng song hành với tốc độ phát triển của công nghệ.
Điểm Chính Cần Nhớ
- Sự phát triển của AI đang được thúc đẩy bởi sự tăng trưởng theo cấp số nhân của "tính toán hiệu quả", kết hợp từ phần cứng, kiến trúc hệ thống và phần mềm.
- Tốc độ cải thiện thực tế (50x) đã vượt xa dự đoán của Định luật Moore truyền thống (5x) trong cùng kỳ, và đang tiếp tục tăng tốc.
- Đích đến là sự chuyển đổi từ chatbot sang các tác nhân AI bán tự trị, có khả năng thực hiện công việc phức tạp, dài hạn thay con người.
- Hệ quả sẽ làm biến đổi mọi ngành công nghiệp dựa trên nhận thức, đòi hỏi cá nhân và tổ chức phải tái tư duy về kỹ năng, giá trị lao động và mô hình kinh doanh.
Tương lai không thuộc về những người sợ hãi sự thay đổi theo cấp số nhân, mà thuộc về những người có đủ tầm nhìn để hiểu các động lực cơ bản và can đảm để học cách cưỡi lên làn sóng đó. Cuộc cách mạng tính toán hiệu quả đang mở ra một chương mới, và nó mới chỉ bắt đầu.