帮我证明Transformer架构中的反向传播

视频信息