专利名称:面向内存受限设备的深度学习模型自适应推理方法及系统
专利国别:中国
专利号:202410279838.2
法律状态:实审
发明人:刘云新,李元春,李翔宇
申请人:清华大学
地址:100084 北京市海淀区清华园
申请日期:2024-03-12
授权日期:
摘要:
本发明提供一种面向内存受限设备的深度学习模型自适应推理方法及系统,包括:获取内存约束受限设备的内存预算;基于所述内存预算对给定的深度神经网络模型进行切片、加载以及计算联合规划,生成离线内存规划方案;基于所述离线内存规划方案进行实际部署模型推理,缩减规划方案与实际执行方案之间的差值,完成所述离线内存规划方案的在线部署执行。本发明解决就现有深度神经网络推理过程内存占用高,难以部署在内存受限设备的问题。