Giải pháp ứng dụng mạng học sâu nén và phân đoạn ngữ nghĩa cho bản đồ đám mây điểm LiDAR

5 lượt xem

Các tác giả

  • Bui Thi Thanh Tam (Tác giả đại diện) Viện Công nghệ thông tin và Điện tử, Viện Khoa học và Công nghệ quân sự
  • Cao Van Toan Viện Công nghệ thông tin và Điện tử, Viện Khoa học và Công nghệ quân sự
  • Phan Huy Anh Viện Công nghệ thông tin và Điện tử, Viện Khoa học và Công nghệ quân sự
  • Pham Van Quoc Trường THPT chuyên Khoa học Tự nhiên, Đại học Quốc gia Hà Nội
  • Pham Dang Duong Trường THPT chuyên Khoa học Tự nhiên, Đại học Quốc gia Hà Nội

DOI:

https://doi.org/10.54939/1859-1043.j.mst.IITE.2025.131-138

Từ khóa:

Học sâu, Định vị dẫn đường; Bản đồ đám mây điểm; LiDAR; Phân đoạn ngữ nghĩa.

Tóm tắt

 Việc điều hướng các thiết bị bay không người lái (UAV) trong môi trường không có tín hiệu GNSS thường dựa vào các bản đồ LiDAR được xây dựng sẵn. Tuy nhiên, dung lượng bộ nhớ lớn và độ phức tạp tính toán cao của các bản đồ đám mây điểm này đặt ra những thách thức đáng kể cho các UAV có tài nguyên hạn chế. Bài báo này đề xuất một giải pháp học sâu sử dụng kiến trúc RandLA-Net gọn nhẹ để nén và phân đoạn ngữ nghĩa hiệu quả các bản đồ này. Kết quả cho thấy giải pháp đề xuất giúp giảm về dung lượng mô hình và tập dữ liệu, trong khi vẫn duy trì độ chính xác phân đoạn tương đương với mô hình RandLA-Net cơ sở, qua đó đưa ra một giải pháp khả thi cho việc xử lý thời gian thực trên thiết bị trong các hệ thống nhúng.

Tài liệu tham khảo

[1]. Chang, Y., “A Review of UAV Autonomous Navigation in GPS-Denied Environments,” Robotics and Autonomous Systems, Vol. 170, p. 104533 (2023).

[2]. Meng, H.-Y., “VV-Net: Voxel VAE Net with Group Convolutions,” in IEEE/CVF International Conference on Computer Vision (ICCV) (2019).

[3]. Guibas, H. T., “KPConv: Flexible and Deformable Convolution for Point Clouds,” in IEEE/CVF International Conference on Computer Vision (ICCV), Seoul (2019).

[4]. Hu, Q., “RandLA-Net: Efficient Semantic Segmentation of Large-Scale Point Clouds,” in IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Seattle, WA, USA (2020).

[5]. Yang, B., “PIXOR: Real-Time 3D Object Detection from Point Clouds,” in IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (2018).

[6]. Qi, C. R., “PointNet: Deep Learning on Point Sets for 3D Classification,” in IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (2017).

[7]. Qi, C. R., “PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metric Space,” in Advances in Neural Information Processing Systems (NeurIPS) (2017).

[8]. Landrieu, L., “Large-Scale Point Cloud Semantic Segmentation with Superpoint Graphs,” in IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (2018).

[9]. Armeni, I., “Joint 2D-3D-Semantic Data for Indoor Scene Understanding,” in IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (2017).

Tải xuống

Đã Xuất bản

30-10-2025

Cách trích dẫn

[1]
Bui Thi Thanh Tam, Cao Van Toan, Phan Huy Anh, Pham Van Quoc, và Pham Dang Duong, “Giải pháp ứng dụng mạng học sâu nén và phân đoạn ngữ nghĩa cho bản đồ đám mây điểm LiDAR”, JMST, số p.h IITE, tr 131–138, tháng 10 2025.

Số

Chuyên mục

Kỹ thuật điện tử

Các bài báo được đọc nhiều nhất của cùng tác giả

1 2 > >>