ONNXruntime归档 - 小码的CheatSheet

ONNX Runtime对决TensorRT：谁才是轻量化部署的终极武器？

Tim

213

2025-04-19

.NET, ONNX, ONNXruntime, TensorRT, 大模型部署

在工业级AI模型部署的战场上，轻量化推理引擎的选择直接决定了业务系统的生死线。本文将以技术解剖的视角，深度解析ONNX Runtime与TensorRT两大主流框架的架构差异与优化实践，通过详尽的基准测试数据与工程案例，揭示不同场景下的最佳技术选型策略。一、计算图优化机制的技术内幕 1.1...

ONNXruntime深度解析：打破框架壁垒的模型部署实战指南

Tim

2025-04-06

tech

.NET, ONNXruntime, 机器学习模型部署, 机器学习部署, 跨框架部署

在人工智能工程化落地的进程中，模型部署始终是制约技术转化的关键瓶颈。不同训练框架生成的模型格式差异、异构硬件平台的适配难题、推理性能与精度的平衡困境，构成了阻碍AI规模化应用的三重门。本文将以ONNXruntime技术体系为核心，深入剖析跨框架模型部署的标准化实践路径，揭示如何通过开放神经网络交换（