Techcrunch整理了一份AI行業最常見到的技術詞語詞典,搞懂這些,或許能幫初學者們輕松邁入AI世界的大門。
- AGI 通用人工智能
通用人工智能(AGI)是一個有些模糊的概念,通常指在多數任務上比普通人更強大的AI。OpenAI將其定義為“在最具經濟價值的工作上超越人類的高度自主系統”。谷歌DeepMind則認為AGI是“在大多數認知任務上至少與人類能力相當的AI”。
- Chain of Thought 思維鏈
思維鏈推理意味著讓AI像人一樣一步步思考,把一個大問題拆解成多個小步驟。雖然慢一點,但在邏輯推理或編程這種需要嚴謹思考的場景里,答案會更準確?,F在的大語言模型經過優化,在處理復雜問題時,就是靠這種“思維鏈”來提高準確性。
- Deep learning 深度學習
AI能自我優化學習的關鍵技術。它模仿人腦神經元連接方式,搭建多層人工神經網絡,使AI算法能夠建立比簡單機器學習系統更復雜的關聯關系。
深度學習模型能自己識別數據里的重要特征,而無需人類預先定義,還能從錯誤中學習,不斷改進。
- Diffusion 擴散模型
擴散技術是眾多藝術、音樂和文本生成AI模型的核心。受物理學啟發,先“故意”一步步往數據里加噪聲,直到數據面目全非。然后,AI學習如何“逆向擴散”,把這些被破壞的數據還原回來,從而獲得從噪聲中“創造”出全新數據的能力。
- Distillation 知識蒸餾
一種“師父帶徒弟”的學習方法。讓一個大型(“老師”)AI模型處理問題,然后把它的答案用來訓練一個更小、更高效的(“學生”)模型,讓學生模型學會老師的行為。這樣就能用更小的模型,實現接近大型模型的性能。
- Fine-tuning 微調
微調是指對已訓練的AI模型進行進一步訓練,通過輸入新的專業化數據,優化其在特定任務或領域的性能表現,使其超越原始訓練的重點范圍。很多AI公司都在用這個技術,把大型語言模型“微調”成適合自己行業的產品,提升實用性。
- GAN 生成對抗網絡
讓AI能“以假亂真”的關鍵技術。它由兩個互相競爭的神經網絡組成:生成器負責創造數據,判別器負責鑒別真偽。就像一場“貓捉老鼠”的游戲,兩者不斷對抗,讓AI能自動生成極其逼真的數據,無需人工干預。GAN適合用于生成圖片或視頻。
- Hallucination 幻覺
“幻覺”是AI行業對模型虛構內容的專業術語,特指AI生成錯誤信息的行為。這顯然是影響AI質量的核心問題。
- Neural Network 神經網絡
神經網絡是指支撐深度學習的多層算法結構,是推動生成式AI工具全面爆發的技術基礎。盡管這個概念由來已久,GPU的崛起也讓這個概念迎來了爆發。GPU被證明非常適合訓練具有更多層次的算法,使得基于神經網絡的AI系統在語音識別、自動駕駛導航和藥物研發等多個領域實現了遠超以往的性能表現。
- Transfer Learning 遷移學習
把一個已經訓練好的AI模型拿來當起點,開發一個針對不同但相關的任務的新模型。這樣可以節省大量開發時間,尤其是在新任務數據量不多的時候非常有用。但要注意,模型可能還需要在新領域的數據上進行額外訓練才能表現最佳。
- Weights 權重
權重是AI訓練的核心要素,它決定了在訓練系統所用數據中,不同特征(或輸入變量)的重要程度,直接影響AI模型的最終輸出。訓練開始時權重是隨機的,但隨著學習的深入,它們會不斷調整,讓AI的預測越來越準。
這份詞典由Techcrunch定期維護,有需要的朋友可以收藏:https://techcrunch.com/2025/05/25/from-llms-to-hallucinations-heres-a-simple-guide-to-common-ai-terms/
ps:轉自量子位