Transformer
-
Switch Transformer的全面解析
一、Switch Transformer简介 Switch Transformer是一种新型的神经网络模型,是由CMU和Facebook AI Research的研究人员于2021…
-
TransGAN: 基于Transformer的图像生成模型
一、TransGAN简介 TransGAN是一种新型的图像生成模型,它是基于Transformer模型而成。与其他图像生成模型相比,TransGAN不依赖于前置训练模型,只需要使用…
-
如何有效地为Transformer添加位置编码
一、简介 Transformer是一种虽然比较新颖但已经相当成熟的深度神经网络结构。在很多自然语言处理任务中,Transformer已经展示出了惊人的效果。其中一个关键的结构就是位…
-
Transformer代码详解
一、Transformer代码块 Transformer是用于自然语言处理的深度学习模型,在对文本进行处理时表现出了非常出色的性能。在代码实现中,Transformer被划分为一个…
-
了解wav2vec:transformer和语音识别的结合
一、什么是wav2vec Wav2vec是Facebook AI研究团队提出的一种语音识别模型。其目的是通过波形到向量的转换,使人类语音数据更易于处理,并为语音识别、语音合成等任务…
-
Transformer-XL详解
一、Transformer-XL简介 Transformer-XL是一种基于transformer的语言模型,由Dai等人于2019年提出。 与普通的transformer语言模型…