PHÁT HIỆN VÀ PHÂN LOẠI ĐỐI TƯỢNG DỰA TRÊN PIXEL ĐƠN

PHÁT HIỆN VÀ PHÂN LOẠI ĐỐI TƯỢNG DỰA TRÊN PIXEL ĐƠN

PHÁT HIỆN VÀ PHÂN LOẠI ĐỐI TƯỢNG DỰA TRÊN PIXEL ĐƠN

10:06 - 05/05/2023

Các nhà nghiên cứu đã phát triển một phương pháp mới để phát hiện vị trí, kích thước và danh mục của nhiều đối tượng mà không cần thu thập hình ảnh hoặc yêu cầu tái tạo cảnh phức tạp.

HỆ THỐNG NHẬN DẠNG GIỌNG NÓI TRỞ NÊN TOÀN DIỆN HƠN NHỜ MỘT NGHIÊN CỨU MỚI
AI tạo ra hình ảnh chất lượng cao nhanh hơn 30 lần chỉ trong một bước
CẤU TRÚC NANO METALENS CÓ THỂ THƯƠNG MẠI HÓA VỚI CHI PHÍ THẤP?
YOLO v9: Vượt qua ranh giới phát hiện đối tượng theo thời gian thực
Chip mới mở ra cánh cửa cho điện toán AI với tốc độ ánh sáng

Phương pháp mới này dựa trên một máy dò pixel đơn, cho phép phát hiện nhiều đối tượng hiệu quả và mạnh mẽ trực tiếp từ số lượng nhỏ các phép đo 2D. Loại công nghệ cảm biến không cần hình ảnh này dự kiến ​​sẽ giải quyết các vấn đề về giới hạn băng thông, chi phí tính toán cao và tỷ lệ phát hiện thấp của các hệ thống nhận thức trực quan hiện có. Vì phương pháp mới giúp giảm đáng kể sức mạnh tính toán cần thiết để phát hiện đối tượng nên nó có thể hữu ích để xác định các mối nguy hiểm khi lái xe.

Các phương pháp nhận thức không cần hình ảnh ngày nay chỉ có thể đạt được sự phân loại, nhận dạng hoặc theo dõi những đối tượng đơn lẻ. Để thực hiện cả ba điều này cùng một lúc, các nhà nghiên cứu đã phát triển một kỹ thuật được gọi là phát hiện đối tượng pixel đơn không cần hình ảnh (SPOD). Công bố đăng trên tạp chí Optics Letters cho thấy rằng SPOD có thể đạt được độ chính xác phát hiện đối tượng hơn 80%.

Đối với lái xe tự hành, SPOD có thể được sử dụng cùng với lidar để giúp cải thiện tốc độ tái tạo cảnh và độ chính xác khi phát hiện đối tượng. Các nhà nghiên cứu tin rằng nó có tỷ lệ phát hiện và độ chính xác đủ cao để lái xe tự động đồng thời giảm băng thông truyền dẫn và yêu cầu tài nguyên máy tính cần thiết.

Tự động hóa các tác vụ trực quan nâng cao, dù được sử dụng để điều hướng phương tiện hay theo dõi máy bay đang di chuyển, thường yêu cầu hình ảnh chi tiết để trích xuất các tính năng cần thiết nhằm xác định đối tượng. Tuy nhiên, điều này đòi hỏi phần cứng hoặc thuật toán tái tạo phức tạp, dẫn đến chi phí tính toán cao, thời gian chạy dài và tải truyền dữ liệu nặng.

Các phương pháp cảm biến không cần hình ảnh dựa trên bộ phát hiện pixel đơn có thể cắt giảm sức mạnh tính toán cần thiết để phát hiện đối tượng. Thay vì sử dụng một cảm biến dò điểm ảnh như CMOS hoặc CCD, hình ảnh một điểm ảnh chiếu sáng vùng giám sát bằng một chuỗi các mẫu ánh sáng có cấu trúc và sau đó ghi lại cường độ ánh sáng truyền qua để thu được thông tin không gian của các vật thể. Thông tin này sau đó được sử dụng để tính toán tái tạo lại đối tượng hoặc để tính toán các thuộc tính của nó.

Các nhà nghiên cứu đã sử dụng một mẫu ánh sáng có cấu trúc nhỏ nhưng được tối ưu hóa để quét nhanh toàn bộ vùng giám sát và thu được các phép đo 2D. Các phép đo này được đưa vào một mô hình học sâu được gọi là bộ mã hóa biến đổi để trích xuất các đặc điểm có ý nghĩa. Các đặc điểm này sau đó được đưa vào bộ giải mã để trích xuất ra thông tin về loại, vị trí và kích thước của tất cả các mục tiêu trong vùng giám sát.

Hiện tại, SPOD không thể phát hiện mọi danh mục đối tượng có thể vì bộ dữ liệu phát hiện đối tượng hiện có được sử dụng để huấn luyện mô hình chỉ chứa 80 danh mục. Tuy nhiên, khi đối mặt với một nhiệm vụ cụ thể, mô hình được đào tạo trước có thể được tinh chỉnh để đạt được khả năng phát hiện đa đối tượng không có hình ảnh của các lớp mục tiêu mới cho các ứng dụng như phát hiện người đi bộ, phương tiện hoặc thuyền. Chi tiết tham khảo tại:

Lintao Peng, Siyu Xie, Tong Qin, Lu Cao, Liheng Bian. Image-free single-pixel object detection. Optics Letters, 2023; 48 (10): 2527 DOI: 10.1364/OL.486078

 

(Sưu tầm)
VIỆN IMC
Tòa nhà IMC Tower, Số 176 Trường Chinh, Phường Khương
Thượng, Quận Đống Đa, Thành phố Hà Nội, Việt Nam
Tel/Fax : (+84) 24 3566 6232 / 24 3566 6234
Email: info@imc.org.vn   Website: https://imc.org.vn