**目标版本** main **功能描述** 尝试使用基于 muDNN 的 ScaledDotProductAttention 替换 InfiniLM v0.2.0 中 attention 的拼接实现,以提升性能