今天凌晨,微軟帶來了一系列重磅產品,一口氣發布了 50 多項更新。
發布會上,微軟 CEO Satya Nadella 談到了關于現代計算的兩個夢想。一個是計算機是否可以理解我們,而不是我們必須理解計算機?第二個是在這個信息不斷增加的世界里,計算機能否幫助我們根據所有這些信息進行推理、規劃和更有效地采取行動? 從 AI 基礎設施的搭建,到模型產品的落地,微軟在尋找答案的過程中,逐漸成長為一個全方位的 AI 解決方案提供商。今夜過后,或許我們都得重新審視微軟這個巨頭。
發布會要點速覽: 1、Team Copilot ,從個人助理變成團隊助理 2、全新的 Agent 代理功能 3、Phi-3 家族迎來新成員 4、Azure AI Studio,包含 API 集成、完整的工具鏈及部署全家桶 5、Fabric 大升級,推出實時智能(real-time intelligence) 6、專為云端規模化應用性能優化的 Cobalt 芯片
發布會更多詳情:https://mp.weixin.qq.com/s/MoHPci4JAb25ifDhMwUWiQ
現在,你可以像和 ChatGPT 聊天一樣使用谷歌地圖了。
谷歌地圖最新升級包括以下 5 點: 1. 對話式地圖搜索 直接與 Google Maps 聊天搜索信息,AI 將使用 Google Maps 上的商戶信息、照片、評分和評論等信息來提供可信的結果。
2. 實時查看地圖 只需點擊相機圖標即可使用實時視圖進行搜索。谷歌地圖會顯示附近的 ATM、餐廳、公園和公交站,并顯示其開放時間和評級,且跟隨 AR 箭頭,準確引導您到達目的地。
3. 全新沉浸式視圖 在正式訪問地點之前先確定其范圍,查看逼真的視圖,并獲取天氣預報、高峰時段等有用信息,而且還能查看室內景觀。比如在訂餐時可以展現餐廳氛圍,幫助您選擇。
4. 新增多重搜索 現在,您可以結合文字和圖像, 在 Google 地圖上訪問數百萬本地企業的信息。
5. 獲取人工智能建議 隨時隨地獲取人工智能支持的建議。如果開始下雨,可以向地圖詢問“雨天活動”并獲取附近的喜劇表演或電影院等建議。
2024 春季火山引擎 Force 原動力大會大家看了嗎?放大招了,火山引擎第一次正式亮相了豆包大模型家族,一口氣直接祭出了9個成員。
以下是大會的重點信息概要:
1. 核心模型:豆包通用模型分為兩個尺寸,大杯(Pro)和中杯(Lite),其中Pro版本窗口尺寸最大可達128K,全系列可精調;Lite版本響應速度快。 2. 價格優勢:豆包通用模型Pro的價格遠低于行業標準,小于32K窗口尺寸的價格為0.0008元/千tokens,128K窗口尺寸為0.005元/千tokens。 3. 使用量:豆包大模型自上線以來,每天處理的token數量高達1200億,生成圖片數量為3000萬張。 4. 多場景應用:豆包大模型在抖音、今日頭條等50多個場景中進行實踐和驗證。 5. 文本對話與語音功能:豆包大模型在文本對話和語音合成方面表現出色,提供了更自然、更像人的聲音效果。 6. 角色扮演模型:豆包大模型還包括角色扮演模型,允許用戶與虛擬角色進行對話。 7. AI應用開發平臺:火山引擎還發布了一站式AI應用開發平臺“扣子(coze)”,支持用戶通過簡單的操作來創建智能體。 8. 火山方舟2.0:火山引擎的MaaS平臺火山方舟升級到2.0版本,提供一站式服務,讓企業可以快速落地大模型應用。 9. 安全性與穩定性:火山方舟在算力、算法和安全層面提供了優化方案,包括GPU資源池、SFT訓練引擎和安全沙箱等。 10. 差異化插件:火山引擎提供了聯網插件、內容插件和RAG知識庫插件,以提供差異化服務。 11. 戰略差異:火山引擎的戰略與其他大模型廠商不同,更注重實際使用量和用戶體驗,而不是僅僅依賴榜單分數和參數規模。 12. 市場反饋:豆包APP累計下載量超過1億,火山引擎與多個行業的企業合作,共同優化大模型。 13. 總體評價:火山引擎的大模型以更大的使用量、更低的價格、更多的應用場景、更人性化和智能化的特點,展示了其在大模型時代的競爭力。
小編覺得本次大會最吸引我的當屬這個文本對話語音功能了,很逼真了,大家可以一起感受一下:(右鍵視頻-顯示控件-可以打開聲音)
更多介紹可以戳這里: 2024 春季火山引擎 Force 原動力大會
昨晚 OpenAI 發布了 GPT-4o 后,壓力就給到了 Google I/O ,現在給我說 OpenAI 不是故意的,我都不信!
這場發布會體現了 Google 在 AI 領域的深厚技術積累和對未來技術趨勢的洞察,同時也表明了 Google 將 AI 技術深度融合到其產品生態中的決心。
以下是發布會的一些重點概述:
發布會要點: 1、Google Search AI:發布了 AI Overviews,加強版 AI 搜索概要功能,多步推理能力上架。 2、Gemini 大模型:Gemini 1.5 Flash(100 萬上下文);Gemini Pro(200 萬上下文)。 3、Gemma 大模型:發布開源多模態大模型 Pali Gemma 和 Gemma2。 4、AI in Google Workspace:用 Gemini 的能力和 Side Panel 的形式,將 Google 系列產品串在一起。 5、Gemini App:手機版的 Gemini 應用程序,即將支持和 AI 視頻對話,近幾周發布。 6、Project Astra:最新的多模態 AI 項目,包含 Imagen3、 Music AI Sandbox 和 Veo 等針對圖像、音樂、視頻的生成式 AI。
更多關于2024 谷歌I/O大會 的介紹及點評,大家可以看看這篇文章,總結的非常詳細:Google I/O 2024
太震撼了啊,沒等到GPT-5,卻迎來了 OpenAI 新旗艦模型GPT-4o!
5月14日凌晨,GPT-4o 在 OpenAI 官網正式發布了,GPT-4o是一個多模態模型,能夠處理視頻、音頻和文本數據,具有實時推理的能力。它能夠執行多種任務,包括實時翻譯、唱歌、做數學題和講笑話等。GPT-4o的語音響應時間非常短,平均響應時間為320毫秒,并且在MMLU評測中創下了88.7%的新高分,超過了其他市面上的大模型。
這是正兒八經的原生多模態,更重要的是可以實時推理音頻、視覺和文本,注意這里是實時,實時,實時,推理的不是文本,是音頻!視覺!
某種程度上,AGI 已然成為現實,我們即將迎來一個新的時代啊!
哈哈,我發現了一個超級逗趣的AI小游戲,《換你來當爹》!這游戲太神奇了,劇情和圖片都是AI根據LLM的情節現場打造的,玩得時候簡直像是在看好萊塢大片,效果炸裂,比起那些人工制作的游戲也毫不遜色!
但這游戲的賣點,可不僅僅是高質量哦!最厲害的是,它的劇情可以無窮無盡,你的“好大兒”的成長道路總是千變萬化,絕不重復。想象一下,你可以把那個總惹麻煩的室友、腳臭得能讓人昏厥的發小,還有那個一天到晚放屁的同桌,統統收入麾下,變成你的“乖兒子”。通過你的悉心“調教”,他們會眼淚汪汪地喊出:“爸爸,您辛苦了!”是不是感覺人生巔峰就在此刻?
別忘了,你也要像個真正的老爸一樣對他們的行為作出回應。是請他們吃“竹筍炒肉”,還是溫柔地講道理,都會影響他們的“孝順值”。游戲結束時,還有一份超詳細的“生涯統計”等你查收,看看你的“育兒”成果如何。
我猜,這種寓教于樂、互動滿滿的游戲方式,說不定就是陪伴式AI的下一個大熱門。更多的玩法,更低的上手和消費難度,這不就是我們夢寐以求的娛樂體驗嗎?趕緊來試試,看你能不能成為“最佳虛擬老爸”!
這里領取你的孝子,來了都是爹: https://lipu.badiya.cn/
設計師們,最近有個超級給力的AI工具你們一定不能錯過,那就是剛剛更名為“即夢”的剪映Dreamina!這個全新的品牌不僅名字夢幻,功能更是強大到不行。
如果你經常需要為了找靈感、作圖、處理圖片而煩惱,那“即夢”絕對是你的救星。它支持將你的文字描述直接轉化成圖片,就像變魔術一樣,把你腦海中的創意呈現出來。再也不用為了找不到合適的圖片而發愁了!
而且,它的智能畫布功能簡直太神奇了。你可以輕松摳圖、重組圖像,甚至根據提示詞重新繪制新的圖像。這簡直就是設計師的福音啊,再也不用為了修圖、摳圖熬夜加班了。
更厲害的是,它還能將你的文字描述轉換成視頻!你沒聽錯,就是直接生成視頻。如果你想做視頻內容,但是又不懂剪輯、特效,這個功能簡直就是你的大救星。只需要輸入文字,就能生成一段精彩的視頻,還支持利用圖片作為基礎,通過AI智能生成視頻內容。這簡直就是視頻創作的新時代啊!
如果你們還在為作圖、修圖、視頻剪輯而煩惱,那就趕緊試試“即夢”吧!它絕對會讓你們愛不釋手的!
線上體驗地址:https://jimeng.jianying.com/ai-tool/video/generate