Tự động trích xuất dữ liệu là một trong những ứng dụng công nghệ tiên tiến, bao gồm cả trí tuệ nhân tạo và nhận diện ký tự quang học. Công nghệ này giúp lấy thông tin từ nhiều nguồn khác nhau như văn bản, hình ảnh và tài liệu scan. Sau khi thu thập, dữ liệu sẽ được chuyển đổi thành định dạng dễ dàng xử lý như file Excel. Đây là một quy trình quan trọng trong các ứng dụng văn phòng số, đóng vai trò thiết yếu trong việc số hóa các tài liệu vật lý tại các tổ chức.
Mặc dù công nghệ viết đã có những bước tiến mạnh mẽ, việc nhận diện và trích xuất thông tin từ bảng biểu trong tài liệu vẫn gặp nhiều thách thức. Việc tự động hóa quy trình này không chỉ giúp giảm bớt khối lượng công việc nhập liệu thủ công mà còn nâng cao độ chính xác và tốc độ xử lý văn bản.
Đội ngũ nghiên cứu đã công bố rằng công nghệ trích xuất dữ liệu từ bảng biểu của Viettel AI có khả năng xử lý nhanh gấp 4 lần so với các phương pháp hiện tại. Đặc biệt, trong một số trường hợp, tốc độ có thể đạt tới 40 khung hình mỗi giây. Điều đáng chú ý là mặc dù tốc độ được cải thiện đáng kể nhưng độ chính xác vẫn được duy trì ở mức cao. Sự khác biệt về độ chính xác so với các giải pháp hiện có chỉ khoảng 2% khi thử nghiệm trên các tập dữ liệu tiêu chuẩn.
Nhóm nghiên cứu đã tối ưu hóa quy trình trích xuất thông tin bằng cách rút ngắn từ hai giai đoạn xuống chỉ còn một. Điều này giúp việc xử lý các bảng dữ liệu phức tạp với nhiều hàng và cột trở nên nhanh chóng hơn. Giải pháp mới không chỉ giảm bớt độ phức tạp trong quy trình mà còn tiết kiệm bộ nhớ, đồng thời đơn giản hóa việc huấn luyện mô hình AI. Nhờ những cải tiến này, Viettel kỳ vọng sẽ đạt được những bước tiến vượt bậc trong tương lai.
Đại diện nhóm nghiên cứu đã chia sẻ về công nghệ đột phá này, hiện đã được tích hợp vào Viettel IDP. Đây là giải pháp xử lý hồ sơ thông minh do Viettel AI phát triển. Viettel IDP có khả năng tự động bóc tách thông tin từ ảnh chỉ trong vòng chưa đầy 2 giây cho mỗi trang tài liệu. So với phương pháp nhập liệu thủ công, tốc độ này nhanh gấp 60 đến 80 lần. Đặc biệt, độ chính xác của hệ thống đạt tới 90%, mang lại lợi ích lớn cho người dùng bằng cách tiết kiệm đến 80% thời gian phê duyệt hồ sơ.
Công nghệ mới được giới thiệu tại Hội nghị ECAI 2024 đánh dấu một bước tiến đáng kể trong việc cải thiện tốc độ xử lý của Viettel IDP. Mục tiêu hướng đến không chỉ là hoàn thành trong vòng 2 giây mà còn đạt được tốc độ xử lý tức thì. Cải tiến này hứa hẹn sẽ nâng cao hiệu quả trong việc xử lý thông tin, mang lại trải nghiệm người dùng tốt hơn.
ECAI là hội nghị quốc tế hàng đầu về trí tuệ nhân tạo, thu hút hàng trăm chuyên gia và nhà nghiên cứu danh tiếng từ khắp nơi trên thế giới. Sự kiện này không chỉ tập trung vào những nghiên cứu tiên tiến mà còn là nền tảng cho các công nghệ đột phá. Tại ECAI, các ý tưởng sáng tạo trong lĩnh vực AI được trình bày và thảo luận, mở ra cơ hội hợp tác và phát triển các giải pháp mới. Đây chính là cơ hội vô giá cho những ai muốn khám phá các xu hướng và thành tựu mới trong ngành công nghiệp trí tuệ nhân tạo.