Google vừa tung ra Gemma 4 — mô hình AI miễn phí nhỏ mà mạnh đến bất ngờ

Google DeepMind vừa ra mắt Gemma 4 — thế hệ mô hình AI mã nguồn mở mới nhất với hàng loạt cải tiến vượt trội so với người tiền nhiệm. Điều đáng chú ý nhất không chỉ là sức mạnh, mà còn là giấy phép Apache 2.0 cho phép sử dụng hoàn toàn miễn phí kể cả trong kinh doanh. Nếu bạn đang tìm kiếm một mô hình AI mạnh để chạy trên máy tính cá nhân hoặc tích hợp vào sản phẩm, đây là thời điểm đáng để chú ý.

Gemma 4 là gì và tại sao nó quan trọng?

Gemma 4 là dòng mô hình AI mã nguồn mở mới nhất từ Google DeepMind, được thiết kế để chạy hiệu quả ngay cả trên phần cứng phổ thông. Không giống các mô hình AI lớn như GPT-4 hay Gemini Ultra vốn chỉ chạy trên máy chủ đám mây, Gemma 4 được tối ưu để người dùng có thể tải về và chạy trực tiếp trên máy tính của mình. Đây là bước tiến quan trọng trong xu hướng đưa AI về tay người dùng cá nhân.

Thay đổi lớn nhất: Gemma 4 sử dụng giấy phép Apache 2.0 — bất kỳ ai, kể cả doanh nghiệp, đều có thể dùng hoàn toàn miễn phí mà không lo vấn đề bản quyền. Đây là bước ngoặt so với các phiên bản Gemma trước.

Gemma 4 mạnh đến mức nào?

Dòng Gemma 4 bao gồm nhiều kích cỡ khác nhau, trong đó đáng chú ý nhất là mô hình 31B tham số sử dụng kiến trúc Mixture-of-Experts (MoE) với 1 nghìn tỷ token huấn luyện nhưng chỉ kích hoạt 32 tỷ tham số mỗi lần chạy. Điều này giúp mô hình vừa mạnh vừa tiết kiệm tài nguyên hơn đáng kể so với các đối thủ cùng phân khúc.

Gemma 4 31B chỉ kích hoạt 32 tỷ trong tổng số hơn 1 nghìn tỷ tham số mỗi lần chạy — giúp tiết kiệm tài nguyên đáng kể mà vẫn giữ được hiệu suất cao.

Cộng đồng AI đã ghi nhận những kết quả ấn tượng trên các bài kiểm tra chuẩn như GPQA (câu hỏi khoa học chuyên sâu) và AIME (toán học cấp cao), với điểm số cải thiện rõ rệt so với Gemma 3. Nhiều người dùng thử nghiệm cho rằng Gemma 4 có thể vượt trội các mô hình lớn hơn gấp 20 lần về kích thước — dù con số này cần được kiểm chứng thêm trong thực tế.

Hỗ trợ đa phương thức: văn bản, hình ảnh, và cả âm thanh

Gemma 4 không chỉ xử lý văn bản. Toàn bộ dòng sản phẩm hỗ trợ đầu vào hình ảnh, trong khi các mô hình nhỏ hơn như E2B và E4B còn được tích hợp thêm khả năng nhận dạng và hiểu giọng nói. Điều này mở ra nhiều ứng dụng thực tế hơn, từ phân tích ảnh, đọc tài liệu có hình, đến xử lý nội dung âm thanh.

Tính năng nổi bật: Gemma 4 hỗ trợ function calling và structured JSON output — hai tính năng quan trọng giúp lập trình viên tích hợp AI vào ứng dụng một cách dễ dàng và đáng tin cậy. Khả năng xử lý hình ảnh với tỷ lệ khung hình tự nhiên cũng được đánh giá cao.

Chạy được ngay trên máy tính cá nhân

Một trong những điểm được cộng đồng hào hứng nhất là Gemma 4 có thể chạy ngay trên phần cứng phổ thông. Người dùng sở hữu MacBook M2 Ultra đã báo cáo chạy mượt mà mô hình Gemma 4 26B ở định dạng Q8_0. Thậm chí có người đã thử nghiệm thành công trực tiếp trên trình duyệt thông qua công nghệ WebGPU mà không cần cài đặt gì thêm.

"brew install + llama-server" — lệnh một dòng đã trở thành cách phổ biến nhất để cộng đồng chạy Gemma 4 ngay trên máy Mac trong ngày đầu ra mắt.

Cộng đồng đã nhanh chóng tạo ra hướng dẫn cài đặt đơn giản. Mô hình cũng được hỗ trợ ngay từ ngày đầu trên các công cụ phổ biến như Transformers, llama.cpp, Ollama, giúp việc triển khai trở nên dễ dàng hơn bao giờ hết.

Kiến trúc bên trong: không phải transformer thông thường

Về mặt kỹ thuật, Gemma 4 sử dụng nhiều lựa chọn kiến trúc thú vị. Mô hình kết hợp hybrid attention (xen kẽ giữa local và global attention), per-layer embeddings, và cơ chế KV cache sharing để tối ưu bộ nhớ. Các chuyên gia nhận xét đây là thiết kế không phải transformer tiêu chuẩn với nhiều cải tiến sáng tạo.

Góc nhìn thận trọng: Nhà nghiên cứu Sebastian Raschka cho rằng phiên bản 31B về kiến trúc không khác nhiều Gemma 3 27B. Bước nhảy vọt hiệu suất chủ yếu đến từ dữ liệu huấn luyện tốt hơn — không phải thay đổi kiến trúc triệt để.

Liệu Gemma 4 có trong Siri mới của Apple?

Một chi tiết thú vị được cộng đồng AI bàn luận: khả năng chạy trên thiết bị (on-device) xuất sắc của Gemma 4 khiến nhiều người đặt câu hỏi liệu đây có phải là nền tảng cho Siri thế hệ mới trong khuôn khổ thỏa thuận hợp tác giữa Apple và Google hay không. Dù chưa có xác nhận chính thức, đây là một hướng phát triển hoàn toàn có thể xảy ra và đáng theo dõi.

Điều này có nghĩa gì với bạn?

Nếu bạn là lập trình viên hoặc người yêu thích công nghệ tại Việt Nam, Gemma 4 mở ra cơ hội thực sự để xây dựng ứng dụng AI mà không tốn chi phí bản quyền hay phụ thuộc vào máy chủ nước ngoài. Bạn có thể chạy mô hình ngay trên laptop cá nhân, tích hợp vào sản phẩm thương mại, và thậm chí xử lý dữ liệu nhạy cảm mà không cần gửi lên cloud.

Với người dùng phổ thông, sự cạnh tranh từ Gemma 4 có nghĩa là các dịch vụ AI sẽ ngày càng rẻ hơn và tốt hơn. Khi Google liên tục cải thiện mô hình mã nguồn mở, các công ty khác buộc phải nâng cao chất lượng sản phẩm để cạnh tranh — và người hưởng lợi cuối cùng chính là bạn.

Những điều cần nhớ

Gemma 4 là mô hình AI mã nguồn mở mới nhất của Google, miễn phí hoàn toàn kể cả cho mục đích thương mại nhờ giấy phép Apache 2.0
Mô hình hỗ trợ văn bản, hình ảnh và âm thanh — có thể chạy trực tiếp trên máy tính cá nhân hoặc thậm chí trên trình duyệt
Phiên bản 31B dùng kiến trúc MoE, chỉ kích hoạt 32 tỷ tham số mỗi lần chạy, giúp tiết kiệm tài nguyên đáng kể
Được hỗ trợ ngay từ ngày đầu trên Transformers, llama.cpp, Ollama — dễ dàng cài đặt và sử dụng
Có thể là nền tảng cho Siri thế hệ mới trong thỏa thuận Apple-Google, dù chưa được xác nhận chính thức

Google vừa tung ra Gemma 4 — mô hình AI miễn phí nhỏ mà mạnh đến bất ngờ

Gemma 4 là gì và tại sao nó quan trọng?

Gemma 4 mạnh đến mức nào?

Hỗ trợ đa phương thức: văn bản, hình ảnh, và cả âm thanh

Chạy được ngay trên máy tính cá nhân

Kiến trúc bên trong: không phải transformer thông thường

Liệu Gemma 4 có trong Siri mới của Apple?

Điều này có nghĩa gì với bạn?

Những điều cần nhớ

Rò rỉ Anthropic Mythos: Mô hình AI siêu mạnh bị truy cập trái phép

AI đang học cách 'suy nghĩ' từng bước khi nhìn ảnh, và đây là bước đột phá từ Alibaba

OpenAI ra mắt GPT-5.5-Cyber: AI chuyên biệt cho an ninh mạng

Nắm bắt AI trong 5 phút mỗi sáng