如今到了文章中比较有趣的部分。到如今为止,咱们所作的一切都叫做正向传递。在训练算法以及在生产中使用的时候,咱们都要涉及以上这些步骤。这里咱们要谈论一下向后传递,并且只谈论在训练中让算法学习的那一部分。算法
另外一种方法是,经过 LSTM 来运行每一个输入,可能链接全部的输出向量,并考虑编码阶段的输出。我认为这样效率很低,由于仪器和特征之间的相互做用和相关性将会丢失,并且这将会须要相比以前多于10倍的计算量。另外一方面,这样的架构能够在多个 GPU 和主机之间畅通并行,无疑是一个优势。api
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------网络