介绍 transformer 架构模型的多层感知器(MLP)等概念,MLP 与注意力机制的区别是什么

视频信息