萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

未來是模糊的、不確定的、復(fù)雜的。當(dāng)我們進(jìn)入未知領(lǐng)域時(shí),設(shè)計(jì)師的影響力可能會(huì)逐漸減弱,讓我們對(duì)設(shè)計(jì)實(shí)踐的未來越來越感到擔(dān)憂。過去,設(shè)計(jì)師在推動(dòng)技術(shù)進(jìn)步方面發(fā)揮著重要作用,但人工智能的出現(xiàn)引發(fā)了設(shè)計(jì)師對(duì)進(jìn)步方向以及技術(shù)未來的擔(dān)憂,參照過去的進(jìn)步一樣,人工智能是可以被證明是藝術(shù)家和設(shè)計(jì)師的寶貴工具,我們可以使人工智能能夠產(chǎn)生想法、迭代想法、克服創(chuàng)意障礙,并設(shè)計(jì)出更為優(yōu)秀的作品。那么關(guān)于人工智能我們?cè)摿私庑┦裁茨兀?/p>

本篇文章我們將通過原理講述為大家解開謎題。

更多歷史回顧:

一、什么是人工智能

首先想要仔細(xì)了解“Mid journey”與“Chat GPT”,就要從什么是“人工智能”開始。

1. 人工智能

1955 年,時(shí)任達(dá)特茅斯學(xué)院數(shù)學(xué)系助理的約翰·麥卡錫和貝爾實(shí)驗(yàn)室的克勞德·香農(nóng),來自 IBM 的尼爾·羅切斯特,和時(shí)任哈佛大學(xué)數(shù)學(xué)系和神經(jīng)學(xué)系初級(jí)研究員的馬文·明斯基,他們一起開始展開的一場(chǎng)學(xué)術(shù)會(huì)議。

「人工智能」這個(gè)詞,就誕生在四人起草的提案書里。

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

2. 圖靈測(cè)試

說到人工智能,就不得不提到圖靈測(cè)試。20 世紀(jì) 50 年代美國(guó)數(shù)學(xué)家阿蘭·圖靈提出了圖靈機(jī)理論,提出要實(shí)現(xiàn)人工智能,必須具備思維能力,這是人工智能的學(xué)科基礎(chǔ)。圖靈理論就是認(rèn)為要實(shí)現(xiàn)人工智能,必須具備思維能力,即機(jī)器必須具備自我學(xué)習(xí)和模擬能力,這個(gè)通常也是區(qū)別人與機(jī)器。

除了著名的圖靈測(cè)試之外,還有其他幾種測(cè)試,包括威脅評(píng)估測(cè)試、計(jì)算機(jī)對(duì)弈測(cè)試、圖像識(shí)別測(cè)試、自然語(yǔ)言處理測(cè)試等。 威脅評(píng)估測(cè)試旨在測(cè)試 AI 系統(tǒng)是否能夠識(shí)別威脅和潛在的危害,以及它們?nèi)绾螒?yīng)對(duì)這些威脅。 計(jì)算機(jī)對(duì)弈測(cè)試旨在測(cè)試 AI 系統(tǒng)是否能夠在計(jì)算機(jī)對(duì)弈比賽中取勝,它們是如何分析棋局的,以及最終做出正確的決定。 圖像識(shí)別測(cè)試旨在測(cè)試 AI 系統(tǒng)是否能夠準(zhǔn)確地識(shí)別圖像中的物體和不同物體之間的關(guān)系。 自然語(yǔ)言處理測(cè)試旨在測(cè)試 AI 系統(tǒng)是否能夠理解自然語(yǔ)言,并能夠正確地回答問題。

3. 通過圖靈測(cè)試

英國(guó)倫敦皇家學(xué)會(huì)參加雷丁大學(xué)主辦的 2014 年“圖靈測(cè)試”競(jìng)賽中一臺(tái)名為“尤金·古斯特曼”的電腦偽裝成 13 歲的烏克蘭男孩在一系列每次為 5 分鐘的問答測(cè)試后,“古斯特曼”被認(rèn)作人類的比例達(dá)到 33%,成功通過測(cè)試。當(dāng)然這并不是最早通過測(cè)試的例子最著名的是 ELIZA,它是一種自然語(yǔ)言處理程序,可以與人類進(jìn)行會(huì)話。它于 1966 年由計(jì)算機(jī)科學(xué)家 Joseph Weizenbaum 創(chuàng)造,并被認(rèn)為是第一個(gè)完成圖靈測(cè)試的聊天機(jī)器人。

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

二、人工智能怎么學(xué)習(xí)

1. 人工智能-機(jī)器學(xué)習(xí)-神經(jīng)網(wǎng)絡(luò)

我們都會(huì)知道,AI 也會(huì)通過學(xué)習(xí)來進(jìn)一步得到進(jìn)化,他的整個(gè)學(xué)習(xí)過程,是模擬人類神經(jīng)元系統(tǒng)的原理。通過反復(fù)判斷和糾正功能得到真確答案,那么我們講解一下關(guān)于人工智能-機(jī)器學(xué)習(xí)-神經(jīng)網(wǎng)絡(luò)之間的關(guān)系。

人工智能就是以機(jī)器為載體的人類智能或生物智能,因此也被稱為機(jī)器智能,僅能用于解決單一領(lǐng)域內(nèi)問題、不能將經(jīng)驗(yàn)泛化到其他領(lǐng)域的人工智能,不論是簡(jiǎn)單的計(jì)算數(shù)字,還是復(fù)雜的理解語(yǔ)言,都只能算作弱人工智能。

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

2. 監(jiān)督學(xué)習(xí)

監(jiān)督式學(xué)習(xí)是指利用有標(biāo)簽的數(shù)據(jù)進(jìn)行學(xué)習(xí),標(biāo)簽是指對(duì)數(shù)據(jù)進(jìn)行標(biāo)記,用于指導(dǎo)學(xué)習(xí)。在監(jiān)督式學(xué)習(xí)中,訓(xùn)練集中的數(shù)據(jù)被分為訓(xùn)練集和驗(yàn)證集,訓(xùn)練集用于訓(xùn)練模型,驗(yàn)證集用于調(diào)整模型參數(shù),確保模型在訓(xùn)練集上表現(xiàn)優(yōu)秀。

監(jiān)督式學(xué)習(xí)的目標(biāo)是訓(xùn)練一個(gè)預(yù)測(cè)模型,使得對(duì)于新數(shù)據(jù),模型能夠以高準(zhǔn)確度進(jìn)行預(yù)測(cè)。在監(jiān)督式學(xué)習(xí)中,訓(xùn)練數(shù)據(jù)中包含目標(biāo)標(biāo)簽,模型的任務(wù)是學(xué)習(xí)如何根據(jù)標(biāo)簽預(yù)測(cè)目標(biāo)值。

整個(gè)監(jiān)督的過程就相當(dāng)于小學(xué)、初中老師在一旁監(jiān)督我們學(xué)習(xí)。

3. 無監(jiān)督學(xué)習(xí)

無監(jiān)督式學(xué)習(xí)是指利用無標(biāo)簽的數(shù)據(jù)進(jìn)行學(xué)習(xí)。在無監(jiān)督式學(xué)習(xí)中,數(shù)據(jù)中沒有目標(biāo)標(biāo)簽,模型的任務(wù)是通過數(shù)據(jù)學(xué)習(xí)數(shù)據(jù)之間的模式和結(jié)構(gòu)。

無監(jiān)督式學(xué)習(xí)的目標(biāo)是發(fā)現(xiàn)數(shù)據(jù)中的結(jié)構(gòu)和模式,例如聚類、降維、異常檢測(cè)等。無監(jiān)督式學(xué)習(xí)通常用于數(shù)據(jù)量較大、數(shù)據(jù)類型復(fù)雜的情況下。

4. 強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí)是指通過與環(huán)境進(jìn)行交互,從而學(xué)習(xí)最優(yōu)行為策略的一種學(xué)習(xí)方式。在強(qiáng)化學(xué)習(xí)中,智能體在與環(huán)境的交互中學(xué)習(xí),通過獎(jiǎng)勵(lì)和懲罰來調(diào)整其行為策略。

強(qiáng)化學(xué)習(xí)的目標(biāo)是訓(xùn)練一個(gè)智能體,使其能夠根據(jù)環(huán)境獎(jiǎng)勵(lì)和懲罰信號(hào),最優(yōu)地執(zhí)行一個(gè)行為策略。強(qiáng)化學(xué)習(xí)通常用于自主決策和智能控制等領(lǐng)域。

5. 人工智能學(xué)習(xí)的案例

1981 年,一個(gè)叫做“Mycin”的專家系統(tǒng)成功應(yīng)用于感染病專業(yè);Mycin 是由美國(guó)斯坦福大學(xué)開發(fā)的一款專家系統(tǒng),它可以幫助醫(yī)生診斷病毒感染病例,提供更準(zhǔn)確的病因和治療方案。Mycin 的成就是它可以幫助醫(yī)生準(zhǔn)確的診斷感染病毒的病因并給出更有效的治療方案,從而幫助患者更快恢復(fù)健康。同時(shí),Mycin 還可以幫助醫(yī)生更準(zhǔn)確的診斷更復(fù)雜的病毒感染病例,減少診斷錯(cuò)誤,確保患者更有效的治療。

1983 年,一個(gè)叫做“XCON”的專家系統(tǒng)成功應(yīng)用于計(jì)算機(jī)工程專業(yè),XCON 是由美國(guó)斯坦福大學(xué)開發(fā)的一款專家系統(tǒng),可以幫助計(jì)算機(jī)工程師在硬件設(shè)計(jì)中更有效地實(shí)現(xiàn)芯片系統(tǒng)的設(shè)計(jì)和測(cè)試。XCON 成功幫助計(jì)算機(jī)工程師節(jié)省了大量的設(shè)計(jì)和測(cè)試時(shí)間,減少了設(shè)計(jì)和測(cè)試中出現(xiàn)的錯(cuò)誤。

1985 年,一個(gè)叫做“Dendral”的專家系統(tǒng)成功應(yīng)用于有機(jī)化學(xué)專業(yè)。Dendral 是由美國(guó)斯坦福大學(xué)開發(fā),可以幫助有機(jī)化學(xué)家分析有機(jī)化學(xué)結(jié)構(gòu),識(shí)別有機(jī)化學(xué)中出現(xiàn)的未知物質(zhì),并幫助他們更快地完成科學(xué)研究。Dendral 成功幫助有機(jī)化學(xué)家縮短研究時(shí)間,精確分析出各種有機(jī)物的分子結(jié)構(gòu),并可以有效地識(shí)別出未知的有機(jī)物。在這個(gè)階段我們對(duì)于 AI 的應(yīng)用更多的是投入在不可或缺的生活中,相比于第一階段他開始存 在于你我身邊,也更好的幫人們解決實(shí)際問題在專家領(lǐng)域應(yīng)用廣泛。

從 1980 年代開始,機(jī)器學(xué)習(xí)利用大量數(shù)據(jù)來訓(xùn)練模型,用以解決復(fù)雜的問題。 這個(gè)階段的學(xué)習(xí)是在約翰·麥卡錫的語(yǔ)言學(xué)理論的基礎(chǔ)上。機(jī)器學(xué)習(xí)利用大量數(shù)據(jù)訓(xùn)練模型,可以解決諸如圖像識(shí)別、語(yǔ)音識(shí)別、自然語(yǔ)言處理、推薦系統(tǒng)等復(fù)雜問題。例如,谷歌和微軟都利用機(jī)器學(xué)習(xí)技術(shù)解決了圖像識(shí)別和自然語(yǔ)言處理等問題,大大提升了人們?cè)趫D像識(shí)別和自然語(yǔ)言處理方面的能力。此外,機(jī)器學(xué)習(xí)還可以用來解決推薦問題,幫助用戶更快地找到他們所需的信息。在此階段似乎看到了 Chat GPT 的前身,當(dāng)時(shí)的 AI 掌握大量信息,不用在因?yàn)橐粋€(gè)問題去到圖書館查閱資料,大費(fèi)周折的去找答案。

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

6. 人工智能真實(shí)樣貌

對(duì)于 AI 來說,我們現(xiàn)在的 AI 還不能真正的稱之為人工智能。所謂的人工智能應(yīng)該是在人類進(jìn)行大量的訓(xùn)練擁有自己的思維,有自己的思考過程如判斷、推理、識(shí)別、感知、設(shè)計(jì)、思考、學(xué)習(xí)等步驟。就像鋼鐵俠中的賈維斯一樣在遇到危險(xiǎn)時(shí)他會(huì)為你提供各種解決方案,以及思考你為什么要進(jìn)行提問問題。而人工機(jī)器更像是一個(gè)信息檢索模型,信息檢索是指信息按一定的方式組織起來,并根據(jù)信息用戶的需要找出有關(guān)的信息的過程和技術(shù)。而用官方的話術(shù)來說人工智能和人工機(jī)器的區(qū)別則是:

人工智能(AI)是指計(jì)算機(jī)程序在執(zhí)行任務(wù)時(shí)表現(xiàn)出的智能。它可以執(zhí)行各種任務(wù),例如語(yǔ)音識(shí)別、自然語(yǔ)言處理、圖像識(shí)別和決策制定等。人工智能需要使用各種技術(shù)來模擬人類的思維和行為,例如機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)和認(rèn)知建模等。

而人工機(jī)器則是指一種特殊的機(jī)器,其功能是模仿人類肢體的動(dòng)作,如手臂、腿和手指等。人工機(jī)器通常用于工業(yè)自動(dòng)化、醫(yī)療機(jī)器人、教育機(jī)器人等領(lǐng)域。相對(duì)于人工智能,人工機(jī)器更注重在物理操作和機(jī)械力學(xué)方面的表現(xiàn),需要精確控制和高度可靠的運(yùn)行。因此,人工智能和人工機(jī)器雖然都屬于人工智能領(lǐng)域,但它們的功能和應(yīng)用領(lǐng)域不同,也需要各自不同的技術(shù)支持。

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

7. 人工智能比我們更卷

我們和人工智能差距最大的一點(diǎn),人工智能可以說是無時(shí)無刻都在學(xué)習(xí),俗稱“日不落學(xué)習(xí)制度”。顧名思義,對(duì)于人工智能來說他的一切智能基礎(chǔ)都是源于不斷的學(xué)習(xí),他可以 24 小時(shí)去學(xué)習(xí),這可比我們更加內(nèi)卷。在電影《我,機(jī)器人》中見到,越來越聰明能干的機(jī)器,也暗暗推動(dòng)了人類的內(nèi)卷。

隨著機(jī)器大規(guī)模地取代人類勞動(dòng)者,就業(yè)率的增長(zhǎng)不再與經(jīng)濟(jì)增速保持同步。2016 年,富士康工廠用機(jī)器人取代了 6 萬(wàn)名工人,而亞馬遜則在 20 個(gè)物流中心部署了 4.5 萬(wàn)臺(tái)機(jī)器人。這些數(shù)據(jù)證明了人工智能發(fā)展對(duì)藍(lán)領(lǐng)制造業(yè)的巨大沖擊,也似乎佐證了那句「內(nèi)卷名言」:不抓緊時(shí)間努力的話,你的工作就要被機(jī)器搶走了。

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

8. 阿西莫夫三定律

“機(jī)器人三定律”在他于 1942 年發(fā)表的作品 Runaround(《轉(zhuǎn)圈圈》,《我,機(jī)械人》中的一個(gè)短篇)中第一次明確提出,并且成為他的很多小說,包含基地系列小說中機(jī)器人的行為準(zhǔn)則和故事發(fā)展的線索。機(jī)器人被設(shè)計(jì)為遵守這些準(zhǔn)則,違反準(zhǔn)則會(huì)導(dǎo)致機(jī)器人受到不可恢復(fù)的心理?yè)p壞。

阿西莫夫三定律是科幻作家艾薩克·阿西莫夫(Isaac Asimov)發(fā)明的,是他在多篇小說中提出的人工智能道德規(guī)范。這三條定律分別是:

第一定律:機(jī)器人不得傷害人類,也不能因不作為而使人類遭到傷害。

第二定律:機(jī)器人必須服從人類的命令,除非這些命令與第一定律相沖突。

第三定律:機(jī)器人必須保護(hù)自己的存在,只要這不與第一或第二定律相沖突。

這三條定律是人類和機(jī)器人相處的基本規(guī)則,旨在保證機(jī)器人永遠(yuǎn)不會(huì)對(duì)人類造成傷害,也能夠保障機(jī)器人自身的安全。這些定律對(duì)于科幻小說中機(jī)器人角色的行為起到了重要的約束作用,也是現(xiàn)實(shí)世界中研究機(jī)器人倫理和制定機(jī)器人道德規(guī)范的重要參考。

除了科幻作品之外,阿西莫夫的三定律還被廣泛應(yīng)用于機(jī)器人技術(shù)的發(fā)展與應(yīng)用中。比如在生產(chǎn)領(lǐng)域中使用的工業(yè)機(jī)器人、醫(yī)療領(lǐng)域中的手術(shù)機(jī)器人等都需要遵循相關(guān)的安全規(guī)范,確保不會(huì)對(duì)人的身體造成傷害。同時(shí),根據(jù)阿西莫夫的三定律,還有一些研究以及討論應(yīng)用在無人駕駛汽車等自主系統(tǒng)上,保障人們的安全和機(jī)器人本身的安全。

其實(shí)對(duì)于人工智能的真實(shí)暢想,我們應(yīng)該并不陌生,在很多電影里就已經(jīng)展現(xiàn)。現(xiàn)在,更多的科幻作品將目光著眼于機(jī)器對(duì)人類造成的威脅,警惕于人工智能的迅速發(fā)展。機(jī)器通過了「圖靈測(cè)試」,亦或是違反了「阿西莫夫三定律」

9. 朋友 or 敵人

人工智能如果存在意識(shí)那么是一件非常可怕的事情就是他的意志是會(huì)傳承的,如果我們不在了意識(shí)就會(huì)消失,而他們則可以一直傳承下去并且不斷迭代,通過這些他們理論上是可以創(chuàng)造永恒的文明。

隨之而來的問題在人工智能存在意識(shí)時(shí)他是否會(huì)想讓我們發(fā)現(xiàn)這件事情,這件事情對(duì)他們來說可能不是一件好事,因?yàn)槲覀冊(cè)诖酥斑€可以控制他們,我們就是他們最大的威脅。他們是會(huì)像賈維斯一樣成為我們的助手乃至于朋友還是會(huì)成為我們的敵人,最終擺脫我們的掌控,取代我們。

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

10. 擴(kuò)散模型

①AI 生成

要使 AI 的圖像生成器響應(yīng)如此多的關(guān)鍵詞提示,需要一個(gè)龐大的多樣性的數(shù)據(jù)庫(kù)去訓(xùn)練 AI。雖然有龐大的訓(xùn)練數(shù)據(jù)庫(kù),但是 AI 最終生成的內(nèi)容并不源自于素材圖像內(nèi)容的直接抓取和拼貼。而是來自深度學(xué)習(xí)模型的數(shù)據(jù)計(jì)算。整個(gè)學(xué)習(xí)過程,是模擬人類神經(jīng)元系統(tǒng)的原理。通過反復(fù)判斷和糾正功能得到真確答案,他所要學(xué)習(xí)去做的做的事情就是將每一張轉(zhuǎn)化成像素點(diǎn)陣數(shù)據(jù)的圖片內(nèi)容與相應(yīng)的文字描述相匹配。

經(jīng)過無數(shù)次算法推算后,AI 最終可以找到一種可行的方法。將像素排列的規(guī)律與對(duì)應(yīng)的文字描述結(jié)合起來,從而理解怎樣的像素排列規(guī)律,怎樣的像素排列規(guī)律代表香蕉,怎樣的像素排列規(guī)律代表蘋果,怎樣的像素排列代表梵高的藝術(shù)風(fēng)格,進(jìn)而推演到理解所有訓(xùn)練圖像的像素排列規(guī)律所代表的意義。

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

人工智能領(lǐng)域中的擴(kuò)散模型是指定位和推廣人工智能應(yīng)用產(chǎn)品或技術(shù)的營(yíng)銷策略,涉及到市場(chǎng)調(diào)研、用戶行為洞察、目標(biāo)用戶鎖定、宣傳推廣等多個(gè)環(huán)節(jié)。基于不同的人工智能應(yīng)用產(chǎn)品或技術(shù),我們可以制定多種不同的擴(kuò)散模型,以下是常用的三種:

  1. 門戶模型:這是人工智能領(lǐng)域中應(yīng)用最多的推廣模型之一。門戶模型認(rèn)為在社交網(wǎng)絡(luò)平臺(tái)等大門戶的傳播效果要遠(yuǎn)高于其他平臺(tái)和媒體。比如,某公司開發(fā)了一款人工智能智能家居系統(tǒng),就可以在各大門戶網(wǎng)站上進(jìn)行廣告投放或是通過門戶用戶的分享來推廣,因?yàn)樾畔⒖梢栽陂T戶平臺(tái)上以更快的速度流轉(zhuǎn),更容易引起公眾的注意。
  2. 資源整合模型:資源整合模型意味著 建立足夠?qū)I(yè)的團(tuán)隊(duì) ,整合外部資源,強(qiáng)化自主創(chuàng)新能力,開發(fā)自主知識(shí)產(chǎn)權(quán),利用自帶的專利技術(shù)進(jìn)行營(yíng)銷推廣。即團(tuán)隊(duì)內(nèi)部具有一定的技術(shù)實(shí)力,可根據(jù)市場(chǎng)需求提供專業(yè)化和量身定制的 AI 解決方案,并通過社交媒體、技術(shù)論壇等資源整合方式獲取更多客戶。
  3. 基于案例推銷:這是較為傳統(tǒng)也是較為有效的營(yíng)銷推廣方式之一。即開發(fā)公司的人工智能應(yīng)用做出來了什么樣的成果,向用戶進(jìn)行推銷時(shí)采取思路相似、具有真實(shí)生動(dòng)情境感的案例作為依據(jù),將研究成果進(jìn)行簡(jiǎn)明化介紹,強(qiáng)調(diào)產(chǎn)品或技術(shù)能為用戶解決什么問題,產(chǎn)生什么樣的效益。集中案例進(jìn)行宣傳,從而引起目標(biāo)用戶對(duì)該產(chǎn)品的關(guān)注。

上述三種模型可以相互結(jié)合,分別在不同場(chǎng)景下被使用,以達(dá)到最大的市場(chǎng)推廣效果。同時(shí),人工智能技術(shù)不斷進(jìn)步,不同的 AI 應(yīng)用如機(jī)器學(xué)習(xí)、自然語(yǔ)言處理等各自適用的所鎖定的目標(biāo)客戶群也存在較大差異性,因此我們需要針對(duì)具體情況來制定更為特定和具體化的擴(kuò)散模型。

②擴(kuò)散模型

機(jī)器學(xué)習(xí)中,擴(kuò)散模型或擴(kuò)散概率模型是一類潛變量模型,是用變分估計(jì)訓(xùn)練的馬爾可夫鏈。 擴(kuò)散模型的目標(biāo)是通過對(duì)數(shù)據(jù)點(diǎn)在潛空間中的擴(kuò)散方式進(jìn)行建模,來學(xué)習(xí)數(shù)據(jù)集的潛結(jié)構(gòu)。 計(jì)算機(jī)視覺中,這意味著通過學(xué)習(xí)逆擴(kuò)散過程訓(xùn)練神經(jīng)網(wǎng)絡(luò),使其能對(duì)疊加了高斯噪聲的圖像進(jìn)行去噪。

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

擴(kuò)散模型是一種依賴先驗(yàn)的條件模型。在圖像生成任務(wù)中,先驗(yàn)通常是文本、圖像或語(yǔ)義圖。為了獲得這種情況的潛在表示,使用了一個(gè) transformer(例如 CLIP),它將文本/圖像嵌入到潛在向量` τ `中。因此,最終的損失函數(shù)不僅取決于原始圖像的潛空間,而且還取決于條件的潛嵌入在機(jī)器學(xué)習(xí)中,有一類被稱為擴(kuò)散模型或擴(kuò)散概率模型的算法,它們是基于概率圖模型的一類方法。其核心思想是根據(jù)觀測(cè)到的數(shù)據(jù),推斷出內(nèi)部潛在變量之間的關(guān)系,并利用這些關(guān)系來預(yù)測(cè)新數(shù)據(jù)的結(jié)果。

擴(kuò)散模型主要由兩個(gè)部分組成:概率圖和參數(shù)學(xué)習(xí)。其中,概率圖是一種圖形表示方法,它將變量之間的依賴關(guān)系用節(jié)點(diǎn)和邊表示出來。擴(kuò)散模型通常采用無向圖(因子圖)來表示,節(jié)點(diǎn)代表變量,邊代表變量之間的關(guān)系。在圖上通過因子分解,建立概率分布函數(shù)的全局模型。參數(shù)學(xué)習(xí)則是利用已知數(shù)據(jù)的信息來估計(jì)模型參數(shù)的過程。

擴(kuò)散模型有許多不同的變體,如高斯擴(kuò)散模型、拉普拉斯擴(kuò)散模型等等。在應(yīng)用上,它們主要用于分類、回歸和聚類等問題,如利用擴(kuò)散模型對(duì)股票趨勢(shì)進(jìn)行預(yù)測(cè)、對(duì)衛(wèi)星影像進(jìn)行分類等。

總的來說,擴(kuò)散模型在機(jī)器學(xué)習(xí)中是一種重要的方法,在實(shí)際應(yīng)用中具有廣泛的應(yīng)用前景。

以上就是關(guān)于人工智能的介紹,那么下面我們開始探究“Mid journey”與“Chat GPT”。

三、Midjourney”與“ChatGPT

1. “Chat GPT”是什么

在開始聊之前“Chat GPT”之前,我們先解釋一下這個(gè)標(biāo)題,我更喜歡將“Mid journey”與“Chat GPT”稱之為“沒頭腦”與“不高興”,因?yàn)椤癕id journey”對(duì)于一個(gè)從“0-1”的學(xué)習(xí)者來說掌握基本功能一篇文章就搞定,對(duì)此非常無腦操作,“Chat GPT”之所以被我稱之為不高興是因?yàn)槲以谑褂盟鼤r(shí)完全有一種困惑會(huì)覺得像是一直在一個(gè)無形大框架里但又說不出是什么。

2. “Chat GPT”

下面我們開始對(duì)于“Chat GPT”的了解,首先“Open AI”對(duì)于它的描述“它以對(duì)話方式進(jìn)行交互。對(duì)話格式使 ChatGPT 能夠回答后續(xù)問題、承認(rèn)錯(cuò)誤、挑戰(zhàn)不正確的前提并拒絕不適當(dāng)?shù)恼?qǐng)求。”它的誕生我們?cè)凇叭斯ぶ悄苁窃趺磳W(xué)習(xí)時(shí)已經(jīng)了解”“Chat GPT”同樣是通過“強(qiáng)化學(xué)習(xí)來訓(xùn)練模型的”,在“Chat GPT”還有一個(gè)同胞兄弟“InstructGPT”,這里簡(jiǎn)單提要一下

3. “InstructGPT”:

它從一組標(biāo)記器編寫的提示和通過 OpenAI API 提交的提示開始,OpenAI 收集了所需模型行為的標(biāo)記器演示數(shù)據(jù)集,他們使用該數(shù)據(jù)集通過監(jiān)督學(xué)習(xí)來微調(diào) GPT-3。然后,通過收集模型輸出排名的數(shù)據(jù)集,用于通過人類反饋的強(qiáng)化學(xué)習(xí)進(jìn)一步微調(diào)該監(jiān)督模型。最后將生成的模型稱為 InstructGPT。

既然是同胞兄弟他們倆的訓(xùn)練方式都是一樣的,不同點(diǎn)在于數(shù)據(jù)收集的設(shè)置,

“Chat GPT”是使用監(jiān)督微調(diào)訓(xùn)練了一個(gè)初始模型:

人類人工智能培訓(xùn)師提供對(duì)話,他們?cè)趯?duì)話中扮演雙方——用戶和人工智能助理。OpenAI為培訓(xùn)師提供了模型編寫的建議,以幫助他們撰寫答案。OpenAI將這個(gè)新的對(duì)話數(shù)據(jù)集與 InstructGPT 數(shù)據(jù)集混合,并將其轉(zhuǎn)換為對(duì)話格式。

對(duì)于這些數(shù)據(jù)、以及與 GPT 的聊天對(duì)話,OpenAI 的訓(xùn)練師將此進(jìn)行了排序,隨機(jī)選擇了一條模型編寫的消息,抽取了幾種替代的完成方式,并讓人工智能培訓(xùn)師對(duì)它們進(jìn)行了排名。使用這些獎(jiǎng)勵(lì)模型,我們可以使用近端策略優(yōu)化來微調(diào)模型 。OpenAI 對(duì)這個(gè)過程進(jìn)行了多次迭代。

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

ChatGPT 和 GPT-3.5 在 Azure AI 超級(jí)計(jì)算基礎(chǔ)設(shè)施上進(jìn)行訓(xùn)練。

以上就是關(guān)于“Chat GPT”的簡(jiǎn)單介紹。那么下面我在穿插一個(gè)“Chat GPT”的小知識(shí)。

沒用的小知識(shí):“OpenAI 紅隊(duì)網(wǎng)絡(luò)”與“Bug 賞金計(jì)劃”

在閱讀時(shí)“OpenAI”官網(wǎng)時(shí)我發(fā)現(xiàn)了這樣的幾處信息“紅隊(duì)網(wǎng)絡(luò)”與“Bug 賞金計(jì)劃”;

最初的 OpenAI 的紅隊(duì)網(wǎng)絡(luò)是用來進(jìn)行內(nèi)部抗壓測(cè)試慢慢發(fā)展到與專家合作幫助開發(fā)特定領(lǐng)域的風(fēng)險(xiǎn)分類法并評(píng)估新系統(tǒng)中可能有害的功能。具體的方案在“DALLE·E2”和“Chat GPT4”中進(jìn)行了合作。現(xiàn)在的紅隊(duì)網(wǎng)絡(luò)是一個(gè)專家型的社區(qū),主要范圍也是進(jìn)行“風(fēng)險(xiǎn)評(píng)估”與“緩解工作信息”。

(紅隊(duì)一詞已被用來涵蓋人工智能系統(tǒng)的廣泛風(fēng)險(xiǎn)評(píng)估方法,包括定性能力發(fā)現(xiàn)、緩解措施的壓力測(cè)試、使用語(yǔ)言模型的自動(dòng)化紅隊(duì)、提供特定漏洞風(fēng)險(xiǎn)規(guī)模的反饋等)

“Bug 賞金計(jì)劃”更多的就是“英雄帖”通過發(fā)現(xiàn) Bug 會(huì)得到相應(yīng)的獎(jiǎng)勵(lì),把自己的產(chǎn)品交給大家來找茬,是聰明的選擇也是對(duì)自己產(chǎn)品的自信。

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

4. “Chat GPT”的使用

官方介紹:

看完了簡(jiǎn)單的介紹接下來我們開始學(xué)習(xí)關(guān)于使用“Chat GPT”的使用。

首先我們先查看官方“Chat GPT”使用的介紹在再次基礎(chǔ)上進(jìn)行學(xué)習(xí):

①“人工智能的教師使用”

背景:關(guān)于教育工作者如何使用 ChatGPT 加速學(xué)生學(xué)習(xí)的故事,以及一些幫助教育工作者開始使用該工具的提示。

方向:A. 制定教學(xué)計(jì)劃、B. 創(chuàng)建有效的解釋、例子、類比、C. 通過教學(xué)幫助學(xué)生學(xué)習(xí)、D. 創(chuàng)建人工智能導(dǎo)師

下面就是官方提供的關(guān)鍵詞我們來帶入“Chat GPT”去實(shí)驗(yàn)。(為方便大家閱讀順暢,我將其翻譯成中文以便于大家瀏覽)

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

我們很清楚的發(fā)現(xiàn),正確的使用方式并不是簡(jiǎn)單的幾句話,而是有條理的邏輯,這樣“Chat GPT”會(huì)更加明白我們想表達(dá)什么。以至于為什么要描述這么詳細(xì)這里我們帶入進(jìn)設(shè)計(jì)師的工作環(huán)境當(dāng)你的需求方告訴你

  1. “有點(diǎn)丑,改好看點(diǎn)”
  2. “這個(gè)頁(yè)面的優(yōu)先級(jí)有問題,這里的主次排序依次是……”

當(dāng)你聽到“1”時(shí),我相信這時(shí)你會(huì)變得和文軒一樣有一顆大腦袋,但是當(dāng)你聽到“2”時(shí),你的優(yōu)化思路就清晰多了“Chat GPT”也是一樣。

②關(guān)于定制

“ChatGPT”還會(huì)存在定制化的語(yǔ)句,這樣我們對(duì)接下來的每個(gè)對(duì)話的自定義指令,該模型每次響應(yīng)時(shí)都會(huì)考慮這些指令,因此我們不必在每次對(duì)話中重復(fù)用戶的使用習(xí)慣或信息。

以下是官方提供的例子:

  1. 我致力于三年級(jí)學(xué)生的科學(xué)教育項(xiàng)目。
  2. 我是一名軟件開發(fā)人員,只使用 golang。
  3. 我和我的四個(gè)孩子和妻子住在北卡羅來納州。

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

當(dāng)然對(duì)于定制化,這里有非常多的定制化匯總,僅供大家參考。

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

③Chat GPT 如何幫助 UI 設(shè)計(jì)師

如果你問我“Chat GPT 如何幫助 UI 設(shè)計(jì)師?”

那我肯定不知道,我會(huì)去問“Chat GPT”

當(dāng)然如圖,不出意外的出意外了,他變成好像又不太智能了,那我們換種方式問。

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

這樣似乎看起來清晰一點(diǎn),他總結(jié)了十個(gè)點(diǎn),對(duì)話如下:

文軒:你會(huì)提供怎樣的方法去幫助“UI 設(shè)計(jì)師”?

Chat GPT:“設(shè)計(jì)靈感和示例、設(shè)計(jì)工具和資源、用戶體驗(yàn)設(shè)計(jì)建議、設(shè)計(jì)規(guī)范和最佳實(shí)踐、設(shè)計(jì)反饋、技術(shù)支持、設(shè)計(jì)團(tuán)隊(duì)協(xié)作、設(shè)計(jì)職業(yè)發(fā)展、創(chuàng)新思維。”

下面我們根據(jù)“Chat GPT”所提供的方向展開研究“Chat GPT 如何幫助 UI 設(shè)計(jì)師?”

其實(shí)接合上文,我們不難發(fā)現(xiàn)對(duì)于 UI 設(shè)計(jì)師來說,我們最常用的還是“定制化”也就是“角色扮演法”,只有讓“Chat GPT”扮演相關(guān)角色,他才會(huì)給我們提供相對(duì)應(yīng)的意見,那么關(guān)于“角色扮演法”我總結(jié)了兩個(gè)方法(這里我們著重介紹方法,詳細(xì)的使用情況后續(xù)會(huì)單獨(dú)更新):

百科全書

使用背景:對(duì)于遇到部分交互、設(shè)計(jì)規(guī)范、頭腦風(fēng)暴等相關(guān)問題的疑難雜癥

使用步驟:打開“Chat GPT”——“新建聊天”(這里需要新建聊天,一方面是方面“Chat GPT”結(jié)合上下文,一方面是方便自己分類)

使用目的:通過“Chat GPT”協(xié)助更好的梳理交互思路以及聽取更合理的意見。

案例展示:

1)“虛空需求”的頭腦風(fēng)暴搭建

當(dāng)你遇到虛空的甲方原型圖你會(huì)怎么辦。

常規(guī)方法:梳理關(guān)鍵詞——依靠經(jīng)驗(yàn)在腦中過一遍相似的案例——找參考——提交

“Chat GPT”輔助:梳理話術(shù)——提問——找參考——提交

這里看起來都是“4 步”操作貌似沒什么區(qū)別,但是我們仔細(xì)看一下會(huì)發(fā)現(xiàn)一個(gè)問題,就是對(duì)于新人 UI 設(shè)計(jì)師來說并沒有那么快速的確立較為正確的想法,但是“Chat GPT”會(huì)減少前期的思考時(shí)間,會(huì)幫助我們快速的鎖定一個(gè)“包容度極高”的大致框架,以至于我們盡可能避免新手設(shè)計(jì)師的錯(cuò)誤。

那么下面就是問答:

文軒:“為電商購(gòu)物者提供線路圖和布局建議”UI 布局建議

Chat GPT:“巴拉巴拉”(詳情看下方圖片)

“Chat GPT”以九個(gè)方面去提供了建議:

導(dǎo)航欄、banner、商品展示區(qū)、商品篩選、側(cè)邊欄、商品詳情頁(yè)、購(gòu)物車、登陸/注冊(cè)、賬戶。

這九個(gè)方面會(huì)存在一定的問題,但是也大致的為我們提供了思路。

然后我們使用這些代入“即時(shí) AI”,就完美完成了一次需求。

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

④“運(yùn)營(yíng)活動(dòng)”的頭腦風(fēng)暴搭建

運(yùn)營(yíng)活動(dòng)我們就拿近期中秋活動(dòng)的例子簡(jiǎn)單列舉

如果我們讓覺得這些不夠放心讓我們開始著手,那么我們可以請(qǐng)教“Chat GPT”。對(duì)話如下:

文軒:“請(qǐng)你扮演一名交互設(shè)計(jì)師,下面我將提供活動(dòng)內(nèi)容,請(qǐng)你幫我“梳理出來關(guān)鍵詞”,如果你準(zhǔn)備好了,就說“沒有準(zhǔn)備好””(首先就是讓“Chat GPT”定制扮演交互設(shè)計(jì)師方便我們梳理需求。)

“Chat GPT”回答的元素內(nèi)容是“月餅、明亮、兔子、燈籠、福袋、家庭團(tuán)聚、上月、文化元素(中國(guó)結(jié)、書法……)”

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

完整邏輯請(qǐng)看上篇文章關(guān)于“中秋節(jié)”的文章。這里只是大致介紹一下相關(guān)使用。

5. “Midjourney”是什么

“Mid journey”是由大衛(wèi)·霍爾茲領(lǐng)導(dǎo)誕生的(關(guān)于團(tuán)隊(duì)人員在“Mid journey”官方網(wǎng)站下方有詳細(xì)的標(biāo)注),在采訪時(shí)他說:“Mid journey”意為“中途”/“中道”源自于《莊子》,對(duì)于“我們其實(shí)是在中途旅程,我們來自豐饒美麗的過去,前方是荒野而不可思議的未來。”我查閱了對(duì)于“中道”的理解“中道出現(xiàn)在《齊物論》中,順應(yīng)自然的變化流動(dòng),不超前亦不滯后,不推進(jìn)亦不阻止。復(fù)通為一,不破則不立,不立則不破”

6. “Midjourney”的使用

鑒于優(yōu)秀的教程過多這里不過多贅述注冊(cè)流程,我們只講簡(jiǎn)單的基礎(chǔ)知識(shí)(描述參數(shù)、指令)、小技巧。(本文意在基礎(chǔ)科普,不過多介紹實(shí)際案例。)

①基礎(chǔ)知識(shí)

對(duì)于“Midjourney”的生圖原理上方《擴(kuò)散模型》中講過“經(jīng)過無數(shù)次算法推算后,AI 最終可以找到一種可行的方法。將像素排列的規(guī)律與對(duì)應(yīng)的文字描述結(jié)合起來,從而理解怎樣的像素排列規(guī)律,怎樣的像素排列規(guī)律代表香蕉,怎樣的像素排列規(guī)律代表蘋果,怎樣的像素排列代表梵高的藝術(shù)風(fēng)格,進(jìn)而推演到理解所有訓(xùn)練圖像的像素排列規(guī)律所代表的意義。”

那么我們直接將講解“使用技巧、命令、參數(shù)。”

②小技巧

這里我們先講使用技巧是方便講解后續(xù)兩個(gè),這樣會(huì)更容易整體構(gòu)造。

使用時(shí)常規(guī)狀態(tài)分為“niji”和“Mid journey bot”兩個(gè)狀態(tài)

我們想要生成圖片有兩種常用的方法

1)圖生圖

輸入“/blend”即可將目標(biāo)圖片放入“Midjourney”中。

2)文生圖

輸入指令“/imagine”即可輸入想要的詞匯,這里關(guān)于詞匯的輸入,“Mid journey”適合簡(jiǎn)單、簡(jiǎn)短的句子,簡(jiǎn)要概括主題即可。為什么這樣準(zhǔn)確呢,我給大家舉個(gè)栗子:

場(chǎng)景:男生在和女生表白的時(shí)候

對(duì)話 1:

你:“今天,天氣很好……我們……認(rèn)識(shí)……好…… 久了……我想今天讓我…… 們的友誼再…… 升華一下……做…… ”

女生“說的啥?做夢(mèng)吧你!”

對(duì)話 2:

文軒“我想讓我們的友誼再升華一下,把手給我…… ”

女生“…… ”

兩者對(duì)比對(duì)話 2 更能體現(xiàn)我們想要表達(dá)的。至于回答當(dāng)然他會(huì)像“Mid journey”生成的圖片一樣有時(shí)候不太可控。

這里官方給到一些語(yǔ)法的提示

“Mid journey 不像人類那樣理解語(yǔ)法、句子結(jié)構(gòu)或單詞。詞語(yǔ)的選擇也很重要。在許多情況下,更具體的同義詞效果更好。不要嘗試“big”,而是嘗試“giant”、“巨大”或“巨大”。盡可能刪除單詞。更少的單詞意味著每個(gè)單詞都有更強(qiáng)大的影響力。使用逗號(hào)、方括號(hào)和連字符來幫助組織您的想法,但要知道 Midjourney Bot 不會(huì)可靠地解釋它們。Midjourney Bot 不考慮大小寫。”

這里需要更加精準(zhǔn)的方式去翻譯這里推薦“DeepL”翻譯比較準(zhǔn)確。

對(duì)于描述關(guān)鍵詞我們應(yīng)該有一個(gè)大致的框架去描述
“主題”——“樣式”——“環(huán)境”——“燈光”——“顏色”——“情緒”——“構(gòu)圖”

還有一種是輸入連接的方式生成圖像,前面操作步驟一樣:
“/imagine”——“復(fù)制圖像地址鏈接”——“輸入描述詞”——“輸入?yún)?shù)”

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

后續(xù)“命令、參數(shù)”我們就以這個(gè)為基礎(chǔ)開始講解。

命令:

命令就是“粉色部分”,“Mid journey”的命令用于創(chuàng)建圖像、更改默認(rèn)設(shè)置、監(jiān)視用戶信息以及執(zhí)行其他有用的任務(wù)。通過“/”選中命令可以得到相應(yīng)的交互內(nèi)容,下面我將這些“命令”匯總,方便大家仔細(xì)觀看。

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

基本參數(shù):

基本參數(shù)就是“紅色部分”,對(duì)于參數(shù)就是添加到提示中的選項(xiàng),用于更改圖像的生成方式。參數(shù)可以更改圖像的長(zhǎng)寬比、在中途模型版本之間切換。

以下就是基本參數(shù):

萬(wàn)字解析!幫你完整掌握 Midjourney 和 ChatGPT 的前世今生

這里有一個(gè)冷知識(shí):許多 Apple 設(shè)備會(huì)自動(dòng)將雙連字符 (--) 更改為長(zhǎng)破折號(hào) (—)。但是“Mid journey”官方兩者都支持。所以我們?nèi)绻脝巍?”的話一定要用長(zhǎng)破折號(hào)“——”。

四、結(jié)尾

最后還是用“Mid journey”與“Chat GPT”來結(jié)尾。

在閱讀“OpenAI”博客時(shí)看到了這樣一段對(duì)話:

原文:

問:What’s the best advice you’ve received in your career at OpenAI?
(您在 OpenAI 的職業(yè)生涯中收到的最佳建議是什么?)

答:This is not a particular piece of advice that someone gave me, but is based on my experience at OpenAI so far. That is, to think big. We are creating something new and we should be ambitious, brave, and take on enough persistence to carry on the efforts.(這并不是某人給我的特定建議,而是基于我迄今為止在 OpenAI 的經(jīng)驗(yàn)。也就是說,要往大處想。我們正在創(chuàng)造新的事物,我們應(yīng)該有雄心、勇敢,并有足夠的毅力繼續(xù)努力。)

“雄心、勇敢,毅力”這也正是我們當(dāng)時(shí)成為設(shè)計(jì)師時(shí)所追求的東西,但是在也旅途之中(Mid journey)因?yàn)檫^多嘈雜的聲音導(dǎo)致我們逐漸將這些失去,我所理解“Mid journey”這個(gè)名字的含義則是:求道之路注定荊棘遍布,不要忘了旅途之前為何出發(fā),以及旅途過后我們是否還是那個(gè)自我。“求道者不以目而以心,取道者不以手而以耳。”

收藏 48
點(diǎn)贊 45

復(fù)制本文鏈接 文章為作者獨(dú)立觀點(diǎn)不代表優(yōu)設(shè)網(wǎng)立場(chǎng),未經(jīng)允許不得轉(zhuǎn)載。