Enhancing Efficiency and Robustness of Compressed Deep Learning Models on Edge Devices for IoT Sensor Data

Abstract:

The proliferation of Internet of Things devices has amplified the need for efficient and reliable edge-based intelligence. Compressed deep learning models, particularly those using post-training quantization and quantization-aware training, offer promising solutions for resource-constrained edge deployments. However, real-world IoT sensor data are often noisy, incomplete, or subject to drift, which can significantly degrade model performance. This study systematically investigates the trade-offs between computational efficiency and robustness of compressed models under realistic sensor noise conditions. Through controlled experiments, we demonstrate that PTQ, while highly efficient in terms of latency, is prone to substantial accuracy loss in noisy environments. In contrast, QAT preserves model accuracy while maintaining low inference latency, providing a more reliable solution for practical edge deployments. The results highlight the necessity of robustness-aware compression and underscore the limitations of evaluating models solely on clean datasets. This work offers a deployment-centric framework for assessing model trustworthiness and provides guidance for developing lightweight, robust deep learning models for safety-critical IoT applications, including industrial monitoring and healthcare.
الملخص

أدى انتشار أجهزة إنترنت الأشياء إلى زيادة الحاجة إلى ذكاء فعال وموثوق قائم على الحوسبة الطرفية. تُقدم نماذج التعلم العميق المضغوطة، ولا سيما تلك التي تستخدم التكميم بعد التدريب والتدريب المُراعي للتكميم، حلولًا واعدة لعمليات النشر الطرفية ذات الموارد المحدودة. مع ذلك، غالبًا ما تكون بيانات مستشعرات إنترنت الأشياء في العالم الحقيقي مشوشة أو غير مكتملة أو عرضة للانحراف، مما قد يُؤدي إلى تدهور كبير في أداء النموذج. تُحقق هذه الدراسة بشكل منهجي في المفاضلات بين الكفاءة الحسابية ومتانة النماذج المضغوطة في ظل ظروف ضوضاء المستشعرات الواقعية. من خلال تجارب مضبوطة، نُبين أن التكميم بعد التدريب، على الرغم من كفاءته العالية من حيث زمن الاستجابة، إلا أنه عُرضة لفقدان كبير في الدقة في البيئات المشوشة. في المقابل، يحافظ التدريب المُراعي للتكميم على دقة النموذج مع الحفاظ على زمن استجابة استدلال منخفض، مما يُوفر حلًا أكثر موثوقية لعمليات النشر الطرفية العملية. تُبرز النتائج ضرورة الضغط المُراعي للمتانة وتُؤكد على محدودية تقييم النماذج على مجموعات البيانات النظيفة فقط. يقدم هذا العمل إطار عمل يركز على النشر لتقييم موثوقية النموذج ويوفر إرشادات لتطوير نماذج التعلم العميق خفيفة الوزن وقوية لتطبيقات إنترنت الأشياء ذات الأهمية البالغة للسلامة، بما في ذلك المراقبة الصناعية والرعاية الصحية