[名詞解釋]DALL·E 2

【AI簡答】

DALL·E 2是一個由OpenAI開發的人工智能模型,它可以生成圖像,並且可以根據文字描述生成圖像。DALL·E 2是DALL·E的升級版,它可以生成更高質量的圖像,並且可以生成更多種類的圖像。

DALL·E 2使用了一種名為GPT-3的人工智能模型,這種模型可以根據給定的文字生成相應的文字。DALL·E 2使用了一種名為CLIP的人工智能模型,這種模型可以將圖像和文字關聯起來。DALL·E 2可以生成各種各樣的圖像,例如動物、食品、家具等等。

 

【Wiki說明】

DALL·E是一個可以通過文本描述中生成圖像的人工智慧程序。於2021年1月5日由OpenAI發表。

DALL·E通過120億參數版本的GPT-3 Transformer模型來理解自然語言輸入(例如「五邊形形狀的綠色皮革錢包」或「一隻悲傷水豚的等距視圖」)並生成相應的圖片。

它既可以生成現實的對象(例如「帶有藍色草莓圖像的彩色玻璃窗」),也能夠生成現實中不存在的對象(例如「具有豪豬紋理的立方體」)。它的名字是2008年動畫電影WALL-E(瓦力)和20世紀西班牙加泰隆尼亞畫家薩爾瓦多·達利(Salvador Dalí)之混成詞。

自2000年代以來,已有其他許多神經網絡有生成逼真圖像的能力。而DALL·E的特點在於它能夠通過純文本描述生成這樣逼真的圖像。

OpenAI尚未發布DALL·E模型的原始碼,不過OpenAI在其網站上提供了DALL·E演示,可以查看部分文本描述的輸出圖像。除了官方版本的DALL·E,另有DALL·E Mini等其他人發布的以少量數據訓練的開源替代方案。

2022年4月,OpenAI宣布了新版本的DALL·E 2,聲稱它可以從文本描述中生成照片般逼真的圖像,另外還有一個允許對輸出進行簡單修改的編輯器。根據OpenAI的公告,該程序仍處於研究階段,訪問權限僅限於小部分測試版用戶。該模型有時仍會犯一些人類不會犯的嚴重錯誤。OpenAI稱DALL·E 2是一個「可以從文本描述中生成原創、逼真的圖像和藝術」的模型。

文章網址:https://zh.wikipedia.org/zh-tw/DALL-E

 

【官方網址】
https://openai.com/product/dall-e-2

 

error: 抱歉,本站所有內容不提供複製 !!
為提供您最佳個人化且即時的服務,本網站透過使用"Cookies"記錄與存取您的瀏覽使用訊息。若您使用本網站,即表示您同意我們上述Cookies聲明。