大语言模型的Attention机制是如何运行的?

视频信息