职位概述 岗位职责: 1、负责LLM和Diffusion Model的性能优化; 2、通过TensorRT、量化、剪枝、算子融合、CUDA算子编写等性能优化的手段,结合业务需求,将GPU性能发挥到极致; 3、负责团队推理优化...的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等; 4、具备丰富的基于CUDA的GPU性能优化经验; 5、了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,了解至少一种深度学习训练框架及其模型...