ByteDance vừa chính thức giới thiệu một công nghệ tiên tiến trong lĩnh vực trí tuệ nhân tạo. Hệ thống robot mới của họ có khả năng thực hiện các công việc nhà như treo quần áo và lau bàn. Đây là một bước tiến đáng kể, mở ra nhiều triển vọng cho việc ứng dụng AI trong cuộc sống hàng ngày.
Trong một màn trình diễn ấn tượng, ByteMini, mẫu robot di động hai tay, đã thể hiện khả năng xỏ áo sơ mi vào móc và treo lên giá một cách linh hoạt. Được trang bị GR-3, mô hình AI tiên tiến kết hợp giữa thị giác máy tính, ngôn ngữ và hành động, ByteMini mang đến một trải nghiệm thú vị và đầy tiềm năng cho tương lai công nghệ.
Theo thông báo từ trang web chính thức của ByteDance, GR-3 là một bước đột phá trong lĩnh vực robot. Công nghệ này không chỉ giúp robot hiểu và thực hiện chỉ dẫn bằng ngôn ngữ tự nhiên mà còn cho phép chúng tương tác với những vật thể chưa từng gặp trước đó. Điều đáng chú ý là GR-3 có khả năng làm việc trong không gian mới, đồng thời xử lý các khái niệm trừu tượng như kích thước và vị trí tương đối. Đây hứa hẹn sẽ mở ra nhiều cơ hội mới cho sự phát triển của trí tuệ nhân tạo và robot trong tương lai.
ByteMini có khả năng nhận diện và lựa chọn chính xác các đối tượng theo các hướng dẫn cụ thể như "chiếc đĩa lớn hơn" hay "vật ở bên trái". Nó còn có thể lựa chọn một món đồ trong nhóm và đặt đúng chỗ theo yêu cầu. Đặc biệt, ByteMini có thể tự động "dọn dẹp bàn ăn" chỉ với một câu lệnh đơn giản.
Một điểm nổi bật trong báo cáo kỹ thuật là khả năng của GR‑3 trong việc xử lý áo ngắn tay, mặc dù dữ liệu huấn luyện của nó chỉ bao gồm áo dài tay. Điều này chứng tỏ GR‑3 có khả năng tổng quát hóa vượt trội so với các mô hình robot truyền thống, mở ra nhiều cơ hội mới trong lĩnh vực công nghệ và ứng dụng thực tế.
Để phát triển GR-3, đội ngũ chuyên gia đã áp dụng một phương pháp độc đáo kết hợp nhiều kỹ thuật tiên tiến. Họ tiến hành huấn luyện chung với dữ liệu thị giác-ngôn ngữ quy mô lớn. Sau đó, quá trình tinh chỉnh được thực hiện nhờ dữ liệu hành vi người thu thập từ thiết bị thực tế ảo. Cuối cùng, nhóm cũng sử dụng học bắt chước từ dữ liệu chuyển động của robot để nâng cao hiệu suất mô hình. Phương pháp đa dạng này không chỉ tạo ra một mô hình mạnh mẽ mà còn mở ra những khả năng mới cho các ứng dụng trong tương lai.
Nhóm nghiên cứu của ByteDance chia sẻ rằng họ tin tưởng GR-3 sẽ là bước ngoặt quan trọng trong việc phát triển thế hệ robot tổng quát. Robot này hứa hẹn sẽ hỗ trợ con người trong các hoạt động hàng ngày, nâng cao chất lượng cuộc sống và mang đến những tiện ích mới mẻ.
Dự án GR-3 do bộ phận Seed của ByteDance triển khai. Đây là đội ngũ chuyên sâu vào nghiên cứu trí tuệ nhân tạo cùng phát triển các mô hình ngôn ngữ lớn. Bộ phận này đã được thành lập vào năm 2023, chỉ sau một thời gian ngắn kể từ khi ChatGPT ra mắt vào cuối năm 2022.
Tính đến cuối tháng 7, Seed đã công bố hơn 15 vị trí tuyển dụng liên quan đến lĩnh vực robot và trí tuệ nhập thể, một khái niệm tập trung vào việc ứng dụng trí tuệ nhân tạo trong các hệ thống vật lý như robot. Trong các thông báo này, công ty nhấn mạnh rằng họ đang phát triển một sản phẩm mới đầy hứa hẹn.
Zhang Yiming, đồng sáng lập ByteDance, mặc dù đã từ chức CEO và Chủ tịch từ năm 2021, vẫn giữ vị trí chiến lược quan trọng trong các quyết định liên quan đến trí tuệ nhân tạo. Ông thường xuyên di chuyển giữa Singapore và Bắc Kinh để theo dõi chặt chẽ quá trình nghiên cứu và phát triển, thể hiện cam kết mạnh mẽ của mình đối với sự tiến bộ của công nghệ này.