CoreML归档 - 小码的CheatSheet

端侧AI革命：苹果CoreML如何驯服70亿参数大模型

Tim

2025-04-27

在移动设备上运行70亿参数的大语言模型，曾被认为是天方夜谭。2023年某国际研究机构数据显示，传统移动端推理框架处理Mistral 7B这类模型时，延迟普遍超过15秒/词，内存占用突破12GB。而苹果最新公布的CoreML优化方案，在iPhone 15...