哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

學習資源 | NVIDIA TensorRT 全新教程上線

NVIDIA英偉達 ? 來源:未知 ? 2023-08-04 17:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA TensorRT是一個用于高效實現(xiàn)已訓練好的深度學習模型推理過程的軟件開發(fā)工具包,內(nèi)含推理優(yōu)化器和運行環(huán)境兩部分,其目的在于讓深度學習模型能夠在 GPU 上以更高吞吐量和更低的延遲運行,目前已在業(yè)界得到廣泛應用與部署。

為了幫助廣大開發(fā)者更好地了解 TensorRT,NVIDIA GPU 計算專家團隊(Devtech)工程師李瑋、王猛基于最新的 8.6.1 版本錄制了NVIDIA TensorRT 教程。本系列教程預計 4 小時,包含五個章節(jié),旨在相對全面地介紹 TensorRT。該教程濃縮了 NVIDIA TensorRT 開發(fā)團隊的技術(shù)和經(jīng)驗,以及與客戶在合作過程中遇到的各種問題和相應的解決方法,期待開發(fā)者們在觀看該教程及配套代碼庫后能有所收獲,為學習、科研和工作添磚加瓦。

需要注意的是,在未來版本的 TensorRT 中,部分 API 和用法可能發(fā)生變化,該教程內(nèi)容也會隨之進行更新,請在配合代碼進行學習的時候,注意開發(fā)環(huán)境和軟件版本,避免兼容性方面的問題。

立即掃碼充電!

TensorRT教程介紹

第一部分:TensorRT 簡介(時長: 41 分鐘)

TensorRT 基本特性和用法Workflow:使用 TensorRT API 搭建Workflow:使用 ONNX-ParserWorkflow:使用框架內(nèi) TensorRT 接口 本章節(jié)將介紹 TensorRT 的基本特性和用法,并介紹使用 TensorRT 的三種常見工作流程。在該章節(jié)中,將從頭搭建一個可以在 TensorRT 中運行推理計算的程序,方便了解一些基本 API 的用法,然后分別使用 TensorRT 的原生 API 搭建、使用 Parser 解析 ONNX 模型,以及使用 TensorFlow 和 Pytorch 等平臺自帶的 TensorRT 接口這三種方法將 TensorRT 用起來。

第二部分:開發(fā)輔助工具(時長:24 分鐘)

trtexecNetronpolygraphyonnx-graphsurgeonNsightSystems

本章節(jié)介紹使用 TensorRT 過程中五個常用的開發(fā)輔助工具,它們在性能測試、網(wǎng)絡(luò)可視化、模型遷移、精度檢驗、計算圖編輯、模型整體性能優(yōu)化等方面都起到了重要的作用。第二章節(jié)將逐一介紹這五個工具,并列舉在實際工作中使用這些工具的范例和經(jīng)驗。

第三部分:插件書寫(時長:18 分鐘)

使用 Plugin 的簡單例子關(guān)鍵 API結(jié)合使用 Parser 和 PluginPlugin 高級話題使用 Plugin 的例子

本章節(jié)將著重介紹 TensorRT Plugin 的相關(guān)技術(shù),將從一個最簡單的標量加法的 Plugin 例子開始,講解 Plugin 的原理、特性、用法等,然后介紹一個把 Plugin 和 Parser 結(jié)合使用的例子,最后補充一些 Plugin 的高級用法,以及在工作中使用 Plugin 的一些案例。

第四部分:TensorRT高級用法(時長: 28 分鐘)

多 OptimizationProfile多 Stream多 ContextCUDAGraphTimingCacheRefitTacticSource硬件兼容+版本兼容更多工具

本章節(jié)將介紹 TensorRT 的一些高級話題。這些技術(shù)在 TensorRT 的使用過程中不是必須的,但在復雜的實際應用場景中,這些技術(shù)對于改善模型性能和內(nèi)存占用、模型的調(diào)試分析、算法精確控制等方面有重要的作用。建議在完成前三個章節(jié)的學習后,瀏覽本章節(jié),將對 TensorRT 的使用起到錦上添花的作用。

第五部分:常見優(yōu)化策略(時長:1 小時 42 分鐘)

概述性能分析工具性能優(yōu)化實例

本章節(jié)將介紹 TensorRT 工作流程中常見的模型優(yōu)化方法。該部分內(nèi)容將深入講解 TensorRT 相關(guān)性能分析工具,并以實例方式講述曾經(jīng)遇到過的一個模型在移植、優(yōu)化、部署的過程中使用的優(yōu)化策略。

wKgaomToPMCACEEQAABDYMZ-TIM441.gif

TensorRT Hackathon、

生成式 AI 模型優(yōu)化賽

!wKgaomToPMCASfeVAAAKhK271LE512.gif

由阿里云、 NVIDIA 聯(lián)合舉辦,由阿里云天池平臺組織運營的“NVIDIA TensorRT Hackathon 2023 生成式 AI 模型優(yōu)化賽”正在火熱報名中,截止時間 8 月 14 日上午 10:00。該賽事面向全社會開放,接受個人或不多于三人的組隊形式參賽。

掃碼報名參賽!

wKgaomToPMCAWwrxAAAcWoAng38399.png ? ? ? ? ? ? ? ? ? ?

相關(guān)資源鏈接:

?TensorRT 介紹https://developer.nvidia.com/tensorrt?TensorRT下載:https://developer.nvidia.com/nvidia-tensorrt-download

?TensorRT Cookbook(本教程配套代碼,包含視頻以外的更多范例代碼):https://github.com/NVIDIA/trt-samples-for-hackathon-cn/tree/master/cookbook

?TensorRT文檔:https://docs.nvidia.com/deeplearning/tensorrt/developer-guide/index.html

?C++ API文檔:https://docs.nvidia.com/deeplearning/tensorrt/api/c_api/

?Python API文檔:https://docs.nvidia.com/deeplearning/tensorrt/api/python_api/ 點擊“閱讀原文”,查看 TensorRT 全新教程! 掃描下方海報二維碼,在 8 月 8日聆聽NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 SIGGRAPH 現(xiàn)場發(fā)表的 NVIDIA 主題演講,了解 NVIDIA 的新技術(shù),包括屢獲殊榮的研究,OpenUSD 開發(fā),以及最新的 AI 內(nèi)容創(chuàng)作解決方案。


原文標題:學習資源 | NVIDIA TensorRT 全新教程上線

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4115

    瀏覽量

    99603

原文標題:學習資源 | NVIDIA TensorRT 全新教程上線

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA DLI推出全新OpenUSD教學套件

    GTC 期間,NVIDIA 深度學習培訓中心(DLI)推出了面向教育工作者的全新 OpenUSD 教學套件,持續(xù)為高校提供體系化 AI 教學資源。
    的頭像 發(fā)表于 04-16 11:42 ?368次閱讀

    NVIDIA向Kubernetes社區(qū)捐贈動態(tài)資源分配GPU驅(qū)動程序

    此外,NVIDIA 在 KubeCon Europe 大會上宣布推出適用于 GPU 加速工作負載的機密容器解決方案、NVIDIA KAI Scheduler 更新,以及用于實現(xiàn)大規(guī)模 AI 工作負載的全新開源項目。
    的頭像 發(fā)表于 04-01 09:10 ?698次閱讀

    NVIDIA在CES 2026發(fā)布全新開放模型、數(shù)據(jù)和工具

    為擴展開放模型生態(tài),NVIDIA 發(fā)布全新開放模型、數(shù)據(jù)和工具,推動各行業(yè) AI 技術(shù)的發(fā)展。
    的頭像 發(fā)表于 01-09 10:42 ?723次閱讀

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服務(wù)為 A
    的頭像 發(fā)表于 11-03 14:48 ?1205次閱讀

    NVIDIA TensorRT LLM 1.0推理框架正式上線

    TensorRT LLM 作為 NVIDIA 為大規(guī)模 LLM 推理打造的推理框架,核心目標是突破 NVIDIA 平臺上的推理性能瓶頸。為實現(xiàn)這一目標,其構(gòu)建了多維度的核心實現(xiàn)路徑:一方面,針對需
    的頭像 發(fā)表于 10-21 11:04 ?1394次閱讀

    NVIDIA 利用全新開源模型與仿真庫加速機器人研發(fā)進程

    科研人員及開發(fā)者打造功能更強大、適應性更強的機器人。 ? 全新NVIDIA Isaac GR00T 開源基礎(chǔ)模型將為機器人賦予接近人類的推理能力,使其能夠拆解復雜指令,并借助已有知識與常識執(zhí)行任務(wù)
    的頭像 發(fā)表于 09-30 09:52 ?3203次閱讀
    <b class='flag-5'>NVIDIA</b> 利用<b class='flag-5'>全新</b>開源模型與仿真庫加速機器人研發(fā)進程

    TensorRT-LLM的大規(guī)模專家并行架構(gòu)設(shè)計

    之前文章已介紹引入大規(guī)模 EP 的初衷,本篇將繼續(xù)深入介紹 TensorRT-LLM 的大規(guī)模專家并行架構(gòu)設(shè)計與創(chuàng)新實現(xiàn)。
    的頭像 發(fā)表于 09-23 14:42 ?1366次閱讀
    <b class='flag-5'>TensorRT</b>-LLM的大規(guī)模專家并行架構(gòu)設(shè)計

    DeepSeek R1 MTP在TensorRT-LLM中的實現(xiàn)與優(yōu)化

    TensorRT-LLM 在 NVIDIA Blackwell GPU 上創(chuàng)下了 DeepSeek-R1 推理性能的世界紀錄,Multi-Token Prediction (MTP) 實現(xiàn)了大幅提速
    的頭像 發(fā)表于 08-30 15:47 ?4669次閱讀
    DeepSeek R1 MTP在<b class='flag-5'>TensorRT</b>-LLM中的實現(xiàn)與優(yōu)化

    NVIDIA RTX AI加速FLUX.1 Kontext現(xiàn)已開放下載

    NVIDIA RTX 與 NVIDIA TensorRT 現(xiàn)已加速 Black Forest Labs 的最新圖像生成和編輯模型;此外,Gemma 3n 現(xiàn)可借助 RTX 和 NVIDIA
    的頭像 發(fā)表于 07-16 09:16 ?2171次閱讀

    NVIDIA Isaac Lab可用環(huán)境與強化學習腳本使用指南

    NVIDIA Isaac Sim 是一款基于 NVIDIA Omniverse 構(gòu)建的參考應用,使開發(fā)者能夠在基于物理的虛擬環(huán)境中模擬和測試 AI 驅(qū)動的機器人開發(fā)解決方案。NVIDIA Isaac
    的頭像 發(fā)表于 07-14 15:29 ?2613次閱讀
    <b class='flag-5'>NVIDIA</b> Isaac Lab可用環(huán)境與強化<b class='flag-5'>學習</b>腳本使用指南

    如何在魔搭社區(qū)使用TensorRT-LLM加速優(yōu)化Qwen3系列模型推理部署

    TensorRT-LLM 作為 NVIDIA 專為 LLM 推理部署加速優(yōu)化的開源庫,可幫助開發(fā)者快速利用最新 LLM 完成應用原型驗證與產(chǎn)品部署。
    的頭像 發(fā)表于 07-04 14:38 ?2405次閱讀

    使用NVIDIA Triton和TensorRT-LLM部署TTS應用的最佳實踐

    針對基于 Diffusion 和 LLM 類別的 TTS 模型,NVIDIA Triton 和 TensorRT-LLM 方案能顯著提升推理速度。在單張 NVIDIA Ada Lovelace
    的頭像 發(fā)表于 06-12 15:37 ?2061次閱讀
    使用<b class='flag-5'>NVIDIA</b> Triton和<b class='flag-5'>TensorRT</b>-LLM部署TTS應用的最佳實踐

    NVIDIA Isaac Sim與NVIDIA Isaac Lab的更新

    在 COMPUTEX 2025 上,NVIDIA 宣布了機器人仿真參考應用 NVIDIA Isaac Sim 和機器人學習框架 NVIDIA Isaac Lab 的更新,以加速各種形態(tài)
    的頭像 發(fā)表于 05-28 10:06 ?2375次閱讀

    NVIDIA攜手合作伙伴提升AI智能體的交互能力

    NVIDIA Enterprise AI Factory 的經(jīng)驗證設(shè)計和全新NVIDIA AI Blueprint 可幫助企業(yè)部署具有溝通、研究和學習能力的智能 AI 成員至日常運
    的頭像 發(fā)表于 05-22 09:52 ?1221次閱讀

    SOLIDWORKS教育版——全方面的學習資源與教程

    功能,更以其全方面的學習資源與教程,為學生構(gòu)建了一個從理論到實踐、從基礎(chǔ)到進階的完整學習體系。本文將深入探討SOLIDWORKS教育版如何憑借其豐富的學習
    的頭像 發(fā)表于 04-23 11:03 ?1013次閱讀
    SOLIDWORKS教育版——全方面的<b class='flag-5'>學習</b><b class='flag-5'>資源</b>與教程
    江门市| 定结县| 富民县| 曲靖市| 黄平县| 老河口市| 和平县| 筠连县| 和平县| 浮梁县| 石楼县| 陇南市| 松滋市| 山阴县| 马关县| 宁津县| 兰坪| 嘉禾县| 博野县| 金堂县| 梨树县| 张掖市| 乐安县| 清涧县| 松江区| 东方市| 康平县| 息烽县| 方山县| 耒阳市| 宝坻区| 广饶县| 丹棱县| 浮山县| 乐平市| 泸西县| 顺平县| 永定县| 天等县| 临沧市| 育儿|