[名詞解釋]Stable Diffusion中的VAE (變分自編碼器)

【AI解答】

VAE是一種自編碼器,它可以將輸入數據映射到一個潛在空間中,並從該空間中生成新的數據。它是一種生成模型,通過學習數據的分布來生成新的數據。VAE與傳統自編碼器不同之處在於,它使用變分推論來學習潛在變量的分布,這使得VAE可以生成更多樣化和真實的數據。

VAE的訓練過程包括兩個部分:編碼器和解碼器。編碼器將輸入數據映射到潛在空間中,解碼器則將潛在變量映射回輸出空間中。VAE的目標是最小化重建誤差和KL散度,以學習數據的分布並生成新的數據。

 

【Wiki說明】

機器學習中,變分自編碼器(Variational Autoencoder,VAE)是由Diederik P. Kingma和Max Welling提出的一種人工神經網絡結構,屬於概率圖模式和變分貝葉斯方法。

VAE與自編碼器模型有關,因為兩者在結構上有一定親和力,但在目標和數學表述上有很大區別。VAE屬於概率生成模型(Probabilistic Generative Model),神經網絡僅是其中的一個組件,依照功能的不同又可分為編碼器和解碼器。

編碼器可將輸入變量映射到與變分分布的參數相對應的潛空間(Latent Space),這樣便可以產生多個遵循同一分布的不同樣本。解碼器的功能基本相反,是從潛空間映射回輸入空間,以生成數據點。雖然噪聲模型的方差可以單獨學習而來,但它們通常都是用重參數化技巧(Reparameterization Trick)來訓練的。

此類模型最初是為無監督學習設計的,但在半監督學習和監督學習中也表現出卓越的有效性。

文章網址:VAE變分自編碼器

 

【參考文章】

error: 抱歉,本站所有內容不提供複製 !!
為提供您最佳個人化且即時的服務,本網站透過使用"Cookies"記錄與存取您的瀏覽使用訊息。若您使用本網站,即表示您同意我們上述Cookies聲明。