484 字
2 分钟
逐行逐字解读深度学习代码Annotated Research Paper Implementations-Transformers, StyleGAN, Stable Diffusion, DDPM DDIM, LayerNorm, Nucleus Sampling and more

转载自 labml.ai 带注释的 PyTorch 版论文实现

论文实现#

Transformers#

Low-Rank Adaptation (LoRA)#

Eleuther GPT-neox#

扩散模型#

生成对抗网络#

循环高速路网络#

LSTM#

超网络-HyperLSTM#

ResNet#

ConvMixer#

胶囊网络#

U-Net#

Sketch RNN#

✨ 图神经网络#

强化学习#

虚拟遗憾最小化(CFR)#

使用 CFR 解决诸如扑克等不完全信息游戏

优化器#

归一化层#

蒸馏#

自适应计算#

不确定性#

激活函数#

语言模型采样技术#

可扩展训练/推理#

安装#

pip install labml-nn
逐行逐字解读深度学习代码Annotated Research Paper Implementations-Transformers, StyleGAN, Stable Diffusion, DDPM DDIM, LayerNorm, Nucleus Sampling and more
https://blog.fuxieyi.top/posts/逐行逐字解读深度学习代码annotated-research-paper-implementations-transformers-stylegan-stable-diffusion-ddpm-ddim-layernorm-nucleus-sampling-and-more/
作者
谢懿Shine
发布于
2025-07-03
许可协议
CC BY-NC-SA 4.0