先帶大家看一下深度學習模型發展歷程:
2014年:GAN 圖像生成發布,對輸出結果的控制力較弱,容易產生隨機圖像、分辨率比較低。
2017年:Transformer 自然語言模型發布,引入自注意力機制,能夠基于兩個單詞間的關系進行建模,有效理解單詞在上下文中的意思,支持并行訓練,使語言模型訓練效果達到新高度。是自然語言理解飛躍性發展,平行訓練優勢逐步發展出超億規模的大模型,ChatGPT打開AI新紀元。
2021年:CLIP 文本-圖像生成發布,對文字、圖像分別進行訓練,不斷調整兩個模型內部參數,使得模型分別輸出文字特征值和圖像特征值并確認匹配,多模態技術推動AIGC內容多樣性雛形。
2022年:Diffusion 圖像生成發布,通過增加噪聲破壞訓練數據來學習,然后找出如何逆轉這種噪聲過程以恢復原始圖像,高效地解決GAN無AI繪畫法訓練、訓練不穩定的問題。圖像生成技術突破,點燃AIGC
從以上的發展不難看出,AIGC今年的爆發是厚積薄發的必然結果。