Google Ra Mắt Ứng Dụng Chuyển Giọng Nói Thành Văn Bản Hoạt Động Hoàn Toàn Ngoại Tuyến

Trong một động thái bất ngờ, Google đã lặng lẽ tung ra một ứng dụng thử nghiệm mới trên iOS, hứa hẹn thay đổi cách chúng ta ghi chép bằng giọng nói. Ứng dụng có tên 'Google AI Edge Eloquent' được thiết kế để hoạt động ngay cả khi không có kết nối mạng, đặt sự riêng tư và tốc độ lên hàng đầu.

Đây không chỉ là bản nâng cấp cho tính năng ghi âm có sẵn, mà là một nền tảng AI xử lý giọng nói hoàn toàn mới, hoạt động độc lập và tập trung vào việc hiểu ý định thực sự của người nói.

Ứng Dụng Hoạt Động Như Thế Nào?

Google AI Edge Eloquent sử dụng mô hình nhận diện giọng nói tự động (ASR) dựa trên nền tảng Gemma AI của chính Google. Người dùng chỉ cần tải ứng dụng miễn phí từ App Store, sau đó tải về các mô hình AI cần thiết một lần duy nhất. Kể từ đó, mọi thao tác chuyển giọng nói thành văn bản đều có thể thực hiện ngay trên thiết bị.

Google AI Edge Eloquent được thiết kế để thu hẹp khoảng cách giữa lời nói tự nhiên và văn bản chuyên nghiệp, sẵn sàng sử dụng.

Trong quá trình sử dụng, ứng dụng hiển thị bản ghi chép trực tiếp theo thời gian thực. Điểm khác biệt nằm ở chỗ khi người dùng tạm dừng, AI sẽ lập tức vào cuộc để 'dọn dẹp' văn bản. Nó tự động lọc bỏ các từ đệm như 'ừm', 'à', các câu tự sửa giữa chừng, và chỉnh sửa ngữ pháp.

Hoàn toàn ngoại tuyếnSau lần tải mô hình đầu tiên

Chế Độ Xử Lý Cục Bộ Và Bảo Mật Dữ Liệu

Một trong những tính năng đáng chú ý nhất của Eloquent là khả năng hoạt động hoàn toàn ngoại tuyến. Người dùng có thể tắt 'Chế độ đám mây' để đảm bảo mọi xử lý đều diễn ra cục bộ trên thiết bị. Khi bật chế độ này lên, ứng dụng sẽ sử dụng các mô hình Gemini dựa trên đám mây của Google để nâng cao khả năng xử lý văn bản.

Ứng dụng cho phép nhập khẩu từ khóa từ Gmail và thêm từ tùy chỉnh, giúp cải thiện độ chính xác đáng kể khi làm việc với thuật ngữ chuyên ngành.

Theo Dõi Lịch Sử Và Thống Kê Chi Tiết

Google AI Edge Eloquent cung cấp khả năng theo dõi toàn diện các phiên ghi chép. Người dùng có thể xem lại lịch sử của tất cả các phiên làm việc và tìm kiếm xuyên suốt chúng.

Ứng dụng còn hiển thị các từ đã đọc trong phiên gần nhất, tốc độ đọc tính theo từ trên phút, và tổng số từ đã nói - những chỉ số hữu ích cho những ai muốn cải thiện kỹ năng diễn đạt hoặc theo dõi tiến độ làm việc.

Tương Lai Trên Android Và Tích Hợp Hệ Thống

Mặc dù hiện chỉ có trên iOS, mô tả trên App Store có đề cập đến phiên bản Android với lời hứa về 'tích hợp liền mạch'. Theo đó, ứng dụng có thể được đặt làm bàn phím mặc định để truy cập toàn hệ thống trên mọi trường văn bản.

Ngoài ra, ứng dụng còn có tính năng nút nổi, tương tự như Wispr Flow trên Android, cho phép truy cập nhanh vào chức năng ghi chép từ bất kỳ đâu. Sự xuất hiện của Eloquent cho thấy Google đang thử nghiệm nghiêm túc trong lĩnh vực ứng dụng ghi chép thông minh.

Điểm Chính Cần Nhớ

  • Ứng dụng hoạt động chủ yếu ngoại tuyến, bảo vệ quyền riêng tư và hoạt động nhanh hơn.
  • AI tự động chỉnh sửa, loại bỏ từ đệm và tạo văn bản 'sạch' ngay lập tức.
  • Hiện có trên iOS, phiên bản Android và tích hợp bàn phím hệ thống đang được phát triển.
  • Đây là sản phẩm thử nghiệm, đánh dấu sự tham gia chính thức của Google vào thị trường ứng dụng ghi chép AI.

Điều này có nghĩa gì với bạn?

Sự ra mắt của Google AI Edge Eloquent không chỉ là tin tức công nghệ thông thường. Nó phản ánh xu hướng lớn hơn: AI đang trở nên 'cá nhân hóa' và 'cục bộ hóa'. Thay vì phụ thuộc hoàn toàn vào đám mây, các mô hình AI ngày càng đủ nhẹ và hiệu quả để chạy ngay trên thiết bị cá nhân.

Đối với người dùng thông thường, điều này mang lại hai lợi ích chính: tốc độ và quyền riêng tư. Bạn không cần chờ đợi kết nối mạng hay lo lắng về việc các cuộc hội thoại cá nhân được gửi lên server. Đối với các nhà báo, sinh viên, nhà nghiên cứu hay bất kỳ ai thường xuyên cần ghi chép nhanh, đây có thể là công cụ thay đổi cuộc chơi.

Tuy nhiên, đây vẫn là một ứng dụng thử nghiệm. Khả năng nhận diện giọng nói tiếng Việt, độ chính xác trong các ngữ cảnh chuyên môn, và khả năng tích hợp với các ứng dụng khác vẫn là những dấu hỏi cần được trả lời. Nhưng một điều chắc chắn: cuộc đua trong lĩnh vực AI xử lý giọng nói vừa trở nên nóng hơn bao giờ hết, và người dùng cuối cùng sẽ là người được hưởng lợi nhiều nhất từ sự cạnh tranh này.