您现在的位置是：主页 > news > 全国事业单位招聘网/百度关键词网站排名优化软件

全国事业单位招聘网/百度关键词网站排名优化软件

admin2025/6/1 6:39:56【news】

简介全国事业单位招聘网,百度关键词网站排名优化软件,苹果网站用什么做的,哪个网站注册域名好Seq2Seq 讲解Attention之前，必须先了解Seq2Seq模型。 sequence to sequence模型广泛应用于机器翻译、机器问答、文章摘要、图片描述等等领域，是深度学习领域最常见的模型之一。它的基本结构如下： 模型包含一个编码器encoder和一个解码器dec…

全国事业单位招聘网,百度关键词网站排名优化软件,苹果网站用什么做的,哪个网站注册域名好Seq2Seq 讲解Attention之前，必须先了解Seq2Seq模型。 sequence to sequence模型广泛应用于机器翻译、机器问答、文章摘要、图片描述等等领域，是深度学习领域最常见的模型之一。它的基本结构如下： 模型包含一个编码器encoder和一个解码器dec…

Seq2Seq

讲解Attention之前，必须先了解Seq2Seq模型。

sequence to sequence模型广泛应用于机器翻译、机器问答、文章摘要、图片描述等等领域，是深度学习领域最常见的模型之一。它的基本结构如下：

在这里插入图片描述

模型包含一个编码器encoder和一个解码器decoder。编码器encoder将输入序列source转化成一种中间表示形式C：

$source = (x_1, x_2, ..., x_m)$
$C = F(x_1, x_2, ..., x_m)$

解码器decoder依赖中间表示C和已经生成的序列，生成当前序列：

$y_i = G(C, y_1, y_2, ..., y_{i-1})$
$target = (y_1, y_2, ..., y_n)$

source和target序列可以为文本、语音、图像，分别用于不同类型的任务。比如source和target为同语言的文本，则可用于文本摘要任务，或则问答任务；不同语言文本，则用于语言翻译任务；source为语音序列，target为文本序列，则用于语音识别任务，等等。

Google 2014年的论文《Sequence to Sequence Learning with Neural Networks》介绍了一种基于RNN的seq2seq模型。基本结构如下：

在这里插入图片描述

这种结构的模型至少存在两方面的问题：

source序列的中间表示C形式固定，当source序列较长时，信息量的压缩比较大，模型的性能急剧下降
target序列的每个元素，所依赖的中间表示C是固定不变的，也就是 $y_2=G(C, y_1),y_3=G(C,y_2,y_1),y_n=G(C,y_{n-1},...,y_1)$ 。这种设计也是不合理的。因为target序列的每个元素所依赖的source序列元素往往不同。例如对于机器翻译任务来说，target序列的当前元素应该依赖于source序列的某个位置开始的一个或若干个元素，而不是整个source序列。这就是所谓的翻译问题重点对齐问题。