{"title":"Tăng cường độ chính xác trong việc nhận diện đối tượng trên các thiết bị cạnh thông minh (SEDs)","authors":"Lê Chí Luận, Tô Hải Thiên","doi":"10.54654/isj.v2i19.948","DOIUrl":null,"url":null,"abstract":"Tóm tắt— Nhận diện đối tượng là một trong những chủ đề chính của lĩnh vực AI. Có nhiều mô hình (models) AI được tạo ra với độ chính xác cao, chạy tốt trên các thiết bị có cấu hình cao. Tuy nhiên, các thiết bị cạnh thông minh (Smart Edge Devices - SED) đang được sử dụng rộng rãi trên nhiều lĩnh vực khác nhau bởi tính linh động nhỏ gọn, đảm bảo chính sách dữ liệu của cá nhân. Nhược điểm của các thiết bị cạnh thông minh này chính là giới hạn về phần cứng, chúng chỉ chạy được các model 8bits 16bits hoặc 32bits. Do đó, các mô hình khi chạy trên các SED phải trải qua bước hoán đổi (“quantization”). Điều này cũng khiến các mô hình nhận diện sẽ bị giảm độ chính xác đáng kể. Bài báo này, chúng tôi đề xuất giải thuật tên là “GreedyPlus” - nhằm tìm kiếm các đối tượng nhỏ trong ảnh bằng cách chọn lựa khung ảnh có chất lượng tốt (không bị nhòe). Sau đó, chia các khung hình (frame) thành các ô, rồi phóng to, nhận diện đối tượng trong các ô. Bước cuối cùng là ghép các đối tượng trong các ô để tạo ra kết quả nhận diện tốt nhất. Phương pháp này đơn giản nhưng đạt hiệu quả cao, cải thiện kết quả nhận diện cho mô hình một cách rõ rệt không cần phải training lại mô hình với dataset mới. Kết quả được thực nghiệm trên các bộ dataset KITTI, CrownAI, Autti.","PeriodicalId":471638,"journal":{"name":"Nghiên cứu khoa học và công nghệ trong lĩnh vực an toàn thông tin","volume":"39 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-10-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Nghiên cứu khoa học và công nghệ trong lĩnh vực an toàn thông tin","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.54654/isj.v2i19.948","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
Tóm tắt— Nhận diện đối tượng là một trong những chủ đề chính của lĩnh vực AI. Có nhiều mô hình (models) AI được tạo ra với độ chính xác cao, chạy tốt trên các thiết bị có cấu hình cao. Tuy nhiên, các thiết bị cạnh thông minh (Smart Edge Devices - SED) đang được sử dụng rộng rãi trên nhiều lĩnh vực khác nhau bởi tính linh động nhỏ gọn, đảm bảo chính sách dữ liệu của cá nhân. Nhược điểm của các thiết bị cạnh thông minh này chính là giới hạn về phần cứng, chúng chỉ chạy được các model 8bits 16bits hoặc 32bits. Do đó, các mô hình khi chạy trên các SED phải trải qua bước hoán đổi (“quantization”). Điều này cũng khiến các mô hình nhận diện sẽ bị giảm độ chính xác đáng kể. Bài báo này, chúng tôi đề xuất giải thuật tên là “GreedyPlus” - nhằm tìm kiếm các đối tượng nhỏ trong ảnh bằng cách chọn lựa khung ảnh có chất lượng tốt (không bị nhòe). Sau đó, chia các khung hình (frame) thành các ô, rồi phóng to, nhận diện đối tượng trong các ô. Bước cuối cùng là ghép các đối tượng trong các ô để tạo ra kết quả nhận diện tốt nhất. Phương pháp này đơn giản nhưng đạt hiệu quả cao, cải thiện kết quả nhận diện cho mô hình một cách rõ rệt không cần phải training lại mô hình với dataset mới. Kết quả được thực nghiệm trên các bộ dataset KITTI, CrownAI, Autti.