小蜜蜂問答

小蜜蜂問答

從Seq2seq到Attention模型到Self Attention（一）

2018-10-08attention RNN vector seq2seq context

從Seq2seq到Attention模型到Self Attention（一）

不管是Seq2seq或是Attention model，其中使用的都是RNN，RNN的缺點就是無法平行化處理，導致模型訓練的時間很長，有些論文嘗試用CNN去解決這樣的問題，像是Facebook提出的Convolutional Seq2seq...

玩轉Keras之Seq2Seq自動生成標題（附開原始碼）

2018-09-04seq2seq 解碼向量 decoder Mask

玩轉Keras之Seq2Seq自動生成標題（附開原始碼）

Seq2Seq提升前面所示的 Seq2Seq 模型是標準的，但它把整個輸入編碼為一個固定大小的向量，然後用這個向量解碼，這意味著這個向量理論上能包含原來輸入的所有資訊，會對 encoder 和 decoder 有更高的要求，尤其在機器翻譯等...

《Get To The Point: Summarization with Pointer-Generator Networks》閱讀筆記

2017-06-06模型 attention seq2seq 摘要 network

《Get To The Point: Summarization with Pointer-Generator Networks》閱讀筆記

attention是針對原文的機率分佈，目的在於告訴模型在當前步的預測過程中，原文中的哪些詞更重要，具體的計算公式為在計算出當前步的attention分佈後，對encoder輸出的隱層做加權平均，獲得原文的動態表示，稱為語境向量最終，依靠d...