Tại sự kiện Google I/O 2024, công ty công nghệ lớn đã giới thiệu Gemini Live, một phiên bản trí tuệ nhân tạo độc đáo trên thiết bị di động có khả năng thực hiện "các cuộc trò chuyện tự nhiên". Đây có thể được xem như một phiên bản tương tự với Siri, vì người dùng có thể tham gia vào cuộc đối thoại hai chiều với Gemini và để AI phản hồi một cách đầy đủ.
Kể từ khi thông báo ban đầu được đưa ra, chúng ta chưa nghe nhiều về công nghệ này cho đến gần đây, khi các chuỗi mã tham chiếu đến Gemini Live được phát hiện trong bản beta của ứng dụng Google. Mã này nói về "chế độ nền" cho phép người dùng tiếp tục cuộc trò chuyện "trong khi sử dụng các ứng dụng khác hoặc khi màn hình điện thoại đang khóa". Như 9To5Google chỉ ra, điều này đã thực sự biến trải nghiệm Gemini Live thành một dạng cuộc gọi thoại gọn nhẹ và tiện lợi.
Với Gemini Live, trí tuệ nhân tạo sẽ tiếp tục nhận diện lệnh bằng giọng nói và phản hồi trong khi bạn thực hiện các hoạt động khác. Ví dụ, người dùng có thể mở trình duyệt Chrome trên điện thoại chạy hệ điều hành Android, tìm kiếm thông tin trên internet và sau đó chuyển thông tin đó trở lại Gemini một cách mượt mà. Điều này giúp việc tương tác với trí tuệ nhân tạo trở nên tự nhiên hơn.
Theo 9To5Google, tương tác có thể được kết thúc bằng cách "tìm kiếm thông báo liên tục" hoặc bằng cách nói "Dừng" với Gemini Live thông qua lệnh giọng.
Tuy nhiên, vẫn còn rất nhiều điều chưa được khám phá trong phiên bản beta ngoài chế độ nền. Google hiện đang tiến hành nghiên cứu để cung cấp cho người dùng quyền truy cập nhanh vào Gemini ngay cả khi điện thoại của họ đang bị khóa. Dựa vào thông tin ban đầu, người dùng sẽ có thể sử dụng bốn tiện ích mở rộng cho các dịch vụ của bên thứ nhất: Google Maps, Google Flights, Google Hotels và YouTube.
Chưa rõ chính xác các tính năng mà bạn có thể sử dụng với các tiện ích mở rộng đó vì thông tin chi tiết chưa được tiết lộ. Tuy nhiên, dựa vào những gì đã được công bố, người dùng có thể yêu cầu Gemini chỉ đường, phát nhạc trên YouTube hoặc đặt vé máy bay.
Bốn tiện ích sẽ được kích hoạt tự động và Google đang có kế hoạch mở rộng hỗ trợ cho nhiều tiện ích hơn. Tuy nhiên, một vấn đề nhỏ là "các tiện ích mở rộng không cần thông tin xác thực từ người dùng hoặc không truy cập vào dữ liệu riêng tư sẽ được kích hoạt mặc định". Các ứng dụng khác có thể yêu cầu kích hoạt bằng tay.
Bên cạnh đó, người dùng còn có khả năng kích hoạt hoặc vô hiệu hóa ba tính năng bổ sung cho Gemini trên màn hình khóa, tăng cường khả năng kiểm soát của trí tuệ nhân tạo. Messages cho phép bạn gửi tin nhắn cho bạn bè và gia đình, trong khi Workspace có thể định vị và tóm tắt email hoặc tài liệu. Cuối cùng, Home Automation, có thể nói là phần thú vị nhất vì nó giúp chủ nhà quản lý các thiết bị thông minh trong nhà ngay từ màn hình khóa.
Thời điểm ra mắt dịch vụ Gemini Live vẫn chưa được xác định. Thông báo vào tháng 5 cho biết rằng công cụ này dự kiến sẽ được đưa đến các người dùng đã đăng ký gói Gemini Advanced trong thời gian sắp tới. Google vẫn chưa tiết lộ thông tin. Có thể nền tảng trí tuệ nhân tạo này sẽ ra mắt trước khi mùa hè kết thúc hoặc muộn hơn vào mùa thu.
Trước khi được phát hành, thông tin về cấu trúc và tương tác từ màn hình khóa có thể giúp Gemini AI vượt trội so với Apple Intelligence. Công nghệ của Apple cũng tiềm năng, cung cấp các công cụ để tổ chức và tạo nội dung. Tuy nhiên, so với Apple, Gemini Live ít yêu cầu sự tương tác liên tục từ người dùng, giúp việc sử dụng dễ dàng hơn.