国产中文字幕一区二区三区_青青久久av_久久精品国产99国产精品_欧美日韩国产亚洲一区

<li id="i22q4"><source id="i22q4"></source></li>

<tfoot id="i22q4"><delect id="i22q4"></delect></tfoot>

<table id="i22q4"></table>

<strike id="i22q4"><samp id="i22q4"></samp></strike>

<li id="i22q4"></li>

TensorRT-LLM 更新加速 AI 推理性能，支持在 RTX 驅動的 PC 上運行新模型

2023/11/16 閱讀 8.4k 評論有獎閱讀本文需 7 分鐘

摘要：微軟Ignite全球技術大會發布的新工具和資源包括OpenAIChatAPI的TensorRT-LLM封裝接口、RTX驅動的性能改進DirectMLforLlama2、其他熱門LLM

WindowsPC上的AI標志著科技史上的關鍵時刻，它將徹底改變玩家、創作者、主播、上班族、學生乃至普通PC用戶的體驗。AI為1億多臺采用RTX GPU的Windows PC和工作站提高生產力帶來前所未有的機會。NVIDIA RTX技術使開發者更輕松地創建AI應用，從而改變人們使用計算機的方式。

在微軟Ignite大會上發布的全新優化、模型和資源將更快地幫助開發者提供新的終端用戶體驗。TensorRT-LLM是一款提升AI推理性能的開源軟件，它即將發布的更新將支持更多大語言模型，在RTXGPU8GB及以上顯存的PC和筆記本電腦上使要求嚴苛的AI工作負載更容易完成。

Tensor RT-LLM for Windows即將通過全新封裝接口與OpenAI廣受歡迎的聊天API兼容。這將使數以百計的開發者項目和應用能在RTXPC的本地運行，而非云端運行，因此用戶可以在PC上保留私人和專有數據。定制的生成式AI需要時間和精力來維護項目。特別是跨多個環境和平臺進行協作和部署時，該過程可能會異常復雜和耗時。

AI Workbench 是一個統一、易用的工具包，允許開發者在 PC 或工作站上快速創建、測試和定制預訓練生成式 AI 模型和 LLM。它為開發者提供一個單一平臺，用于組織他們的AI項目，并根據特定用戶需求來調整模型。這使開發者能夠進行無縫協作和部署，快速創建具有成本效益、可擴展的生成式AI模型。加入搶先體驗名單，成為首批用戶以率先了解不斷更新的功能，并接收更新信息。

為支持AI開發者，NVIDIA與微軟發布DirectML增強功能以加速最熱門的基礎AI模型之一的Llama2。除了全新性能標準，開發者現在有更多跨供應商部署可選。

便攜式AI

10月，NVIDIA發布TensorRT-LLMfor Windows -- 一個用于加速大語言模型(LLM)推理的庫。

本月底發布的TensorRT-LLMv0.6.0 更新將帶來至高達5倍的推理性能提升，并支持更多熱門的LLM，包括全新Mistral7B和Nemotron-38B。這些LLM版本將可在所有采用8GB及以上顯存的GeForceRTX30系列和40系列GPU上運行，從而使最便攜的WindowsPC設備也能獲得快速、準確的本地運行LLM功能。

TensorRT-LLM 更新加速 AI 推理性能，支持在 RTX 驅動的 PC 上運行新模型

TensorRT-LLM v0.6.0 帶來至高達5倍推理性能提升

新發布的TensorRT-LLM可在/NVIDIA/TensorRT-LLM GitHub代碼庫中下載安裝，新調優的模型將在ngc.nvidia.com提供。

從容對話

世界各地的開發者和愛好者將OpenAI的聊天API廣泛用于各種應用——從總結網頁內容、起草文件和電子郵件，到分析和可視化數據以及創建演示文稿。

這類基于云的AI面臨的一大挑戰是它們需要用戶上傳輸入數據，因此對于私人或專有數據以及處理大型數據集來說并不實用。

為應對這一挑戰，NVIDIA即將啟用TensorRT-LLM for Windows，通過全新封裝接口提供與OpenAI廣受歡迎的ChatAPI類似的API接口，為開發者帶來類似的工作流，無論他們設計的模型和應用要在RTXPC的本地運行，還是在云端運行。只需修改一兩行代碼，數百個AI驅動的開發者項目和應用現在就能從快速的本地AI中受益。用戶可將數據保存在PC上，不必擔心將數據上傳到云端。

TensorRT-LLM 更新加速 AI 推理性能，支持在 RTX 驅動的 PC 上運行新模型

使用由 TensorRT-LLM 驅動的 Microsoft VS Code 插件 Continue.dev 編碼助手

此外，最重要的一點是這些項目和應用中有很多都是開源的，開發者可以輕松利用和擴展它們的功能，從而加速生成式AI在RTX驅動的WindowsPC上的應用。

該封裝接口可與所有對TensorRT-LLM進行優化的LLM(如，Llama2、Mistral和NVLLM)配合使用，并作為參考項目在GitHub上發布，同時發布的還有用于在RTX上使用LLM的其他開發者資源。

模型加速

開發者現可利用尖端的AI模型，并通過跨供應商API進行部署。NVIDIA和微軟一直致力于增強開發者能力，通過DirectMLAPI在RTX上加速Llama。

在10月宣布的為這些模型提供最快推理性能的基礎上，這一跨供應商部署的全新選項使將AI引入PC變得前所未有的簡單。開發者和愛好者可下載最新的ONNX運行時并按微軟的安裝說明進行操作，同時安裝最新NVIDIA驅動(將于11月21日發布)以獲得最新優化體驗。

這些新優化、模型和資源將加速AI功能和應用在全球1億臺RTXPC上的開發和部署，一并加入400多個合作伙伴的行列，他們已經發布了由RTXGPU加速的AI驅動的應用和游戲。

隨著模型易用性的提高，以及開發者將更多生成式AI功能帶到RTX驅動的WindowsPC上，RTXGPU將成為用戶利用這一強大技術的關鍵。

關于NVIDIA

自1993年成立以來，NVIDIA (NASDAQ: NVDA) 一直是加速計算領域的先驅。NVIDIA 1999年發明的GPU驅動了PC游戲市場的增長，并重新定義了現代計算機圖形，開啟了現代AI時代，正在推動跨市場的工業數字化。NVIDIA現在是一家全棧計算公司，其數據中心規模的解決方案正在重塑整個行業。更多信息，請訪問https://nvidianews.nvidia.com/

收藏 1

點贊 19

復制本文鏈接文章為作者獨立觀點不代表優設網立場，未經允許不得轉載。

繼續閱讀本文相關話題

你即將了解活動賽事

FUTURE FOOD 上海國際食物設計大會精彩呈現

< 上一篇

返回新聞首頁

你即將了解活動賽事

2023第十屆成都創意設計周落下帷幕，我們明年再見！

下一篇 >

發評論！每天贏獎品

點擊登錄后，在評論區留言，系統會隨機派送獎品

2012年成立至今，是國內備受歡迎的設計師平臺，提供獎品贊助聯系我們

本期獎品

標志設計標準教程

已累計誕生 730 位幸運星

查看獲獎名單

發表評論

{{ moreBtnTxt }}

以上留言僅代表用戶個人觀點，不代表優設立場

評論就這些咯，讓大家也知道你的獨特見解立即評論

1 聯系優設

QQ直接交流

點擊交談

2 微信掃碼咨詢

榜上有名聯系優設

行業風向標！13年助力企業品牌宣發

渠道豐富
場景多樣

搜索引擎
極速收錄

內容推廣
量身打造

品牌流量
助力曝光

熱門頻道

AIGC專題
熱門問答
設計大賽
免費教程
設計導航
設計課程

設計靈感

主編推薦
Banner設計
海報設計
Logo設計
插畫繪畫
字體設計

支持與服務

官方社群
優設官方微信群
01優設AIGC自學交流群
02優設小紅書個人IP交流群
03優設設計師交流群
04優設UI設計師交流群
05優設交互設計師交流群
06優設電商交流群
07優設私單群

08優設硬件種草交流群
09優設同城搭子群
10優設大學生交流群
11優設插畫師交流群
12優設平面品牌設計師交流群
13優設3D設計師交流群
14優設攝影剪輯愛好者交流群
微信掃碼添加管理員招財

微信號：掃碼添加

嚴格審核打造高質量交流群

進群會有面試題謝絕打廣告
優設微博

@
優設AIGC
400W粉絲！每日更新設計干貨
@
優設
強烈推薦！優設官方品牌微博
@
優優教程網
官方微博，海量教程看不完
@
優設基礎訓練營
零基礎入門，帶你成為軟件高手
優設微信

每天官微五分鐘

一年萌新變大神

掃碼關注

1000W

優設新媒體矩陣等你來關注

優優教程網

優設大課堂

設計師導航

主站蜘蛛池模板：潜山县| 延川县| 青河县| 徐州市| 西藏| 阿鲁科尔沁旗| 大渡口区| 饶平县| 和龙市| 河北省| 洛宁县| 鄂托克旗| 建宁县| 灌阳县| 景泰县| 固镇县| 泰兴市| 平武县| 开江县| 淅川县| 政和县| 阿合奇县| 平塘县| 奉贤区| 高碑店市| 平顶山市| 荣昌县| 泰州市| 天长市| 土默特右旗| 西林县| 临邑县| 惠州市| 乌兰浩特市| 东乌珠穆沁旗| 二连浩特市| 新沂市| 莱芜市| 达尔| 迁西县| 原阳县|

<center id="6wemu"><tr id="6wemu"></tr></center>

<code id="6wemu"><acronym id="6wemu"></acronym></code>