Edge AI giá $8: chạy YOLOv8 trên Rockchip RV1106 NPU 0.5 TOPS
Quantization-aware training quan trọng hơn model nén. INT8 RKNN giảm size 3× với accuracy drop <2%. Chiến lược offline-first cứu mạng khi 4G chập.
Vì sao RV1106
Triển khai trạm quan trắc nông trại 80km cách trung tâm, 4G chập 3-4 lần/ngày. Cloud-based bị mù khi mất mạng. Chủ trại cần biết sâu bệnh trong vài phút.
Rockchip RV1106 = chip $8, NPU 0.5 TOPS, 256MB RAM. Đủ cho YOLOv8 nano nếu nén kỹ.
Pipeline tối ưu
- Train YOLOv8n trên dataset 18k ảnh 7 lớp sâu bệnh (FP32, GPU)
- Quantization-aware training 50 epoch cuối với calibration data thực tế từ camera trạm
- Export ONNX → convert RKNN INT8 (rknn-toolkit2)
- Test trên hardware thật — không chỉ simulator
Kết quả nén
| Size | Accuracy mAP@0.5 | FPS | |
|---|---|---|---|
| FP32 PT | 6.1 MB | 0.882 | 1.8 |
| FP16 ONNX | 3.2 MB | 0.879 | 4.1 |
| INT8 PTQ | 1.8 MB | 0.812 | 12 |
| INT8 QAT | 2.1 MB | 0.864 | 12 |
Chú ý: Post-training quant rớt accuracy 7%. .