昨天,谷歌在官網宣布從5月15日起,將向所有谷歌相冊用戶免費提供Magic Editor、Photo Unblur和Magic Eraser三款生成式AI編輯工具。
通過這三款強大的AI圖像編輯工具,用戶可以輕松將模糊的圖片變高清,實現一鍵PS/調色/光影,刪除圖片多余內容等。而在此之前,這三個是谷歌Pixel手機獨有功能。
功能介紹: 1. Magic Editor:這是一款強大的AI圖像編輯工具,它可以幫助用戶輕松實現一鍵PS/調色/光影,改變圖片中的物體位置等。這項功能最初在2023年10月4日隨Pixel 8系列手機發布。Magic Editor的優勢在于它的細節調整和融合度比傳統的PS工具更強,而且操作簡單,無需深度的專業知識。不過,需要注意的是,所有谷歌相冊用戶每月只能使用10次Magic Editor,如果想要更多使用次數,用戶需要購買Pixel 8手機或開通Google One計劃(2TB及以上)。 2. Photo Unblur:這是一款專用于去除圖片模糊的工具。用戶在拍攝圖片時可能會因為手抖、環境等因素導致圖片模糊,Photo Unblur能夠一鍵還原圖片的清晰度,讓模糊的圖片變高清。 3. Magic Eraser:這是一款圖片擦除工具,可以幫助用戶去除照片中不希望出現的元素,如行人或物體。對于不熟悉PS技術的用戶來說,Magic Eraser提供了一種簡單快捷的解決方案,一鍵完美去除圖片中的障礙物。
哪款你最期待呢?評論區說出你的想法吧~
OpenAI 發布了GPT-4-Turbo 正式版,這是一個帶有視覺能力的模型,能夠處理128k的上下文。
這個模型現在已經全面開放,可以通過“gpt-4-turbo”來使用,最新版本為“gpt-4-turbo-2024-04-09”。
GPT-4-Turbo模型的基礎能力得到了顯著提升,它不僅能夠處理文本輸入,還能夠識別和理解圖片。這一特性使得GPT-4-Turbo在多種應用場景中具有更廣泛的應用潛力。例如,它可以用于自動編碼、圖像識別和營養分析等領域,為用戶提供更加豐富和便捷的服務。
GPT-4-Turbo的價格與之前的版本保持一致,這使得用戶能夠以相對較低的成本使用這一先進的AI技術。同時,OpenAI還提供了詳細的接口信息和使用限制,幫助開發者更好地理解和利用這一模型。
大家覺得這個新功能怎么樣,實用性高嗎?
4月10日凌晨,谷歌在官網正式發布了Gemini1.5Pro,現在可在180多個國家/地區使用。
Gemini 1.5 Pro 不僅能夠生成創意文本和代碼,還能理解、總結上傳的視頻和音頻內容,并且支持高達100萬tokens的上下文。
在Google AI Studio開發平臺中,用戶可以免費試用Gemini 1.5 Pro,并且它支持中文提示。這使得用戶能夠通過簡單的操作,上傳視頻或音頻文件,并獲取內容的深度總結。例如,用戶可以上傳一個視頻并詢問影片的內容,Gemini 1.5 Pro能夠快速解析并提供答案。
Gemini 1.5 Pro還提供了音頻理解功能,能夠快速解析音頻文件并總結其內容。這對于需要處理大量視頻和音頻內容的用戶來說,無疑是一個巨大的幫助,因為它可以節省大量的時間。
谷歌還對Gemini API進行了性能優化,包括系統指令、JSON模式以及函數調用優化,這些改進顯著提升了模型的穩定性和輸出能力。系統指令功能允許用戶根據特定需求控制模型的行為,JSON模式可以幫助開發者從文本或圖像中提取結構化數據,而函數調用優化則支持開發者實現更全面的查詢響應。
詳情點此查看: https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html
音頻理解能力: https://github.com/google-gemini/cookbook/blob/main/quickstarts/Audio.ipynb
剛剛,OpenAI 官方賬號發布的一支由 Sora 制作的MV(Music Video)——《Worldweight》
這支 MV 的音樂是由藝術家 AugustKamp 作曲,而畫面內容則是通過 Sora 來生成的。AugustKamp 表示,Sora 使得他能夠將原本只存在于他心中的想象轉化為可以與他人共享的藝術形式。這并非他首次使用AIGC技術來制作MV,他之前已經在 Instagram 上分享過由 Sora 生成的 MV 片段。
但是和以往不同的是,全球知名的藝術家,包括麻辣雞(NickiMinaj)、水果姐(KatyPerry)、碧梨(BillieEilish)等,聯名抗議AIGC技術的使用。他們認為AIGC技術在未經補償的情況下使用藝術家的聲音、作品來訓練AI模型,并稀釋支付給藝術家的版稅池,這些問題不僅損害了藝術家的經濟利益,也對他們的創作自由和藝術價值構成了威脅。
科技的發展與創造力的邊界在哪里?從 MV 到音樂劇。AI如何重塑我們的音樂體驗呢?歡迎在評論區留言討論!
繼上線視頻生成功能后,Dreamina 又上線了一個新功能——智能畫布。該功能集成了 mj、sd 和 PS 的功能,讓用戶能夠在一個平臺上完成多種操作,無需在不同的軟件之間切換。Dreamina 智能畫布的核心特點之一是支持多圖層的 AI 可控能力,如:邊緣保持,支持超清、重繪、摳圖、擴圖等豐富的后編輯能力。
以下是 Dreamina 功能概況: - 智能畫布功能:Dreamina的智能畫布支持多圖層的AI可控能力,包括邊緣保持、超清重繪、摳圖、擴圖等后編輯能力。這意味著用戶可以像使用Photoshop一樣操作多個圖層,并通過AI生成新的圖片。 - 提高工作效率:智能畫布的智能化操作方式不僅提高了工作效率,還降低了操作難度,使得更多用戶能夠輕松上手。 - 應用場景: - 制作小程序產品宣傳圖 - 生成品牌的創意宣傳海報 - logo創意玩法,將品牌logo嵌入圖片中 - 對小企業和個人店鋪的優勢:對于宣傳費用有限的小企業和個人店鋪,Dreamina提供了一個免費制作宣傳圖的工具。
→ 官方使用教程文檔
哇塞,W&B團隊真是太牛了!他們開發的這個開源工具OpenUI,簡直是我們設計師的福音啊!你只需用文字描述一下你想要的UI界面,OpenUI就能立刻幫你渲染出效果,實時呈現你的設計想法。
更神奇的是,你還可以通過聊天的方式隨時修改設計,而且它能輕松將HTML轉換成React、Svelte、Web Components等各種前端框架的代碼。這簡直就是設計界的神器啊!
我試了試,發現它現在用的是GPT模型,效果還挺不錯的。雖然項目還有些小瑕疵,但已經很有潛力了,絕對值得繼續深入研究。對于我們設計師來說,這絕對是個能大大提升工作效率的好幫手!
OpenUI 線上試玩戳這里!
OpenAI 周五在其官網上發表了博客文章,名為“駕馭合成聲音的挑戰和機遇”, 這也是 OpenAI 在官網首次展示了全新自定義音頻模型“Voice Engine”。
用戶只需要提供15秒左右的參考聲音,通過Voice Engine就能生成幾乎和原音一模一樣的全新音頻,在清晰度、語音連貫、音色、自然度等方面比市面上多數產品都強很多。
除了能合成音頻之外,OpenAI 還展示了Voice Engine很多其他際商業用途,例如,一位失去聲音表達能力的女孩,在Voice Engine幫助下能像以前一樣正常發音說話。
全文內容:OpenAI 官網
Voice Engine 應用場景: 1. 閱讀助手:可以通過自然且富有情感的聲音為非閱讀者和兒童提供閱讀輔助,實時個性化響應,與學生互動。 2. 內容翻譯:可以翻譯視頻和播客等內容,使創作者和企業能夠以流利且原汁原味的聲音觸達全球更多受眾。 3. 服務全球:改善偏遠地區的必要服務。 4. 幫助言語障礙人士:為言語障礙人士提供治療應用,以及為有學習需求的人士提供教育增強功能,使殘疾人能夠進行交流。 5. 幫助病人恢復聲音:幫助患有突發性或退行性言語障礙的患者恢復聲音。
近日,Adobe 放了個大招,推出了這個 Adobe GenStudio 的神器。說實話,這簡直就是咱們營銷人的福音啊!以后做跨渠道活動,啥工具都不愁了,一站式搞定!
GenStudio 是基于生成式人工智能打造的,簡單說,就是它懂你,知道你想要啥。用它來規劃、制作、管理、發布和評估內容,那簡直就是輕松加愉快。最關鍵的是,還能保證內容和品牌形象嚴絲合縫,不掉鏈子。
來說說它都有哪些牛X的功能吧:
1. 創作:有了 Adobe 的 AI 技術,咱們營銷人也能秒變創作達人!快速出圖,品質還高。而且都是基于品牌認證的模板,AI 護航,不怕品牌形象跑偏。 2. 內容中心:這個平臺界面簡潔明了,找素材、編輯、重復用、分享,全都方便得不行。再也不用東翻西找,浪費時間了。 3. 活動管理:GenStudio 還有個活動概覽功能,活動簡介、時間表一目了然。策劃活動?那是分分鐘的事! 4. 發布:更牛的是,GenStudio 還能和 Adobe Experience Cloud 的其他產品(比如 Journey Optimizer、Experience Manager、Marketo 和 Target)無縫對接,想導出到其他應用也是輕而易舉。 5. 數據洞察:最后,還能實時看到內容在不同渠道的表現,AI 還能幫忙生成不同版本的內容,讓活動效果更好。
Adobe GenStudio 試玩地址戳這里!