哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在英特爾酷睿Ultra處理器上優(yōu)化和部署YOLOv8模型

英特爾物聯(lián)網(wǎng) ? 來源:英特爾物聯(lián)網(wǎng) ? 2024-05-30 17:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

英特爾 酷睿 Ultra處理器是英特爾公司推出的一個(gè)高端處理器品牌,其第一代產(chǎn)品基于Meteor Lake架構(gòu),使用Intel 4制程,單顆芯片封裝CPU、GPU(Intel Arc Graphics)和 NPU(Intel AI Boost),具有卓越的AI性能。

本文將詳細(xì)介紹使用OpenVINO工具套件在英特爾 酷睿Ultra處理器上實(shí)現(xiàn)對YOLOv8模型的INT8量化和部署。

1

第一步:環(huán)境搭建

首先,請下載并安裝最新版的NPU和顯卡驅(qū)動(dòng):

NPU 驅(qū)動(dòng):https://www.intel.cn/content/www/cn/zh/download/794734/intel-npu-driver-windows.html

顯卡驅(qū)動(dòng):

https://www.intel.cn/content/www/cn/zh/download/785597/intel-arc-iris-xe-graphics-windows.html

a46b2724-1e63-11ef-91d2-92fbcf53809c.png

然后,請下載并安裝Anaconda,然后創(chuàng)建并激活名為npu的虛擬環(huán)境:(下載鏈接:https://www.anaconda.com/download)

conda create -n npu python=3.11    #創(chuàng)建虛擬環(huán)境
conda activate npu           #激活虛擬環(huán)境
python -m pip install --upgrade pip  #升級pip到最新版本

最后,請安裝openvino、nncf、onnx和ultralytics:

pip install openvino nncf onnx ultralytics

a479fd62-1e63-11ef-91d2-92fbcf53809c.png

2

第二步:導(dǎo)出yolov8s模型并實(shí)現(xiàn)INT8量化

使用yolo命令導(dǎo)出yolov8s.onnx模型:

yolo export model=yolov8s.pt format=onnx

使用ovc命令導(dǎo)出OpenVINO格式,F(xiàn)P16精度的yolov8s模型

ovc yolov8s.onnx

a486298e-1e63-11ef-91d2-92fbcf53809c.png

使用benchmark_app程序依次測試FP16精度的yolov8s模型在CPU,GPU和NPU上的AI推理性能,結(jié)果如下圖所示:

benchmark_app -m yolov8s.xml -d CPU  #此處依次換為GPU,NPU

a49247c8-1e63-11ef-91d2-92fbcf53809c.png

用NNCF實(shí)現(xiàn)yolov8s模型的INT8量化

NNCF全稱Neural Network Compression Framework,是一個(gè)實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)訓(xùn)練后量化(post-training quantization)和訓(xùn)練期間壓縮(Training-Time Compression)的開源工具包,如下圖所示,通過對神經(jīng)網(wǎng)絡(luò)權(quán)重的量化和壓縮以最低精度損失的方式實(shí)現(xiàn)推理計(jì)算的優(yōu)化和加速。

a49e1fa8-1e63-11ef-91d2-92fbcf53809c.png

NNCF提供的量化和壓縮算法

在上述量化和壓縮算法中,訓(xùn)練后INT8量化(Post-Training INT8 Quantization)是在工程實(shí)踐中應(yīng)用最廣泛的,它無需重新訓(xùn)練或微調(diào)模型,就能實(shí)現(xiàn)模型權(quán)重的INT8量化,在獲得顯著的性能提升的同時(shí),僅有極低的精度損失,而且使用簡便。

用NNCF實(shí)現(xiàn)YOLOv8s模型INT8量化的范例代碼yolov8_PTQ_INT8.py,如下所示:

import torch, nncf
import openvino as ov 
from torchvision import datasets, transforms
# Specify the path of model and dataset
model_dir = r"yolov8s.xml"
dataset = r"val_dataset"
# Instantiate your uncompressed model
model = ov.Core().read_model(model_dir)
# Provide validation part of the dataset to collect statistics needed for the compression algorithm
val_dataset = datasets.ImageFolder(dataset, transform=transforms.Compose([transforms.ToTensor(),transforms.Resize([640, 640])]))
dataset_loader = torch.utils.data.DataLoader(val_dataset, batch_size=1)
# Step 1: Initialize transformation function
def transform_fn(data_item):
  images, _ = data_item
  return images.numpy()
# Step 2: Initialize NNCF Dataset
calibration_dataset = nncf.Dataset(dataset_loader, transform_fn)
# Step 3: Run the quantization pipeline
quantized_model = nncf.quantize(model, calibration_dataset)
# Step 4: Save the INT8 quantized model
ov.save_model(quantized_model, "yolov8s_int8.xml")

運(yùn)行yolov8_PTQ_INT8.py,執(zhí)行結(jié)果如下所示:

a4aab6c8-1e63-11ef-91d2-92fbcf53809c.png

使用benchmark_app程序依次測試INT8精度的yolov8s模型在CPU,GPU和NPU上的AI推理性能,結(jié)果如下圖所示:

benchmark_app -m yolov8s_int8.xml -d CPU  #此處依次換為GPU,NPU

a4b31c96-1e63-11ef-91d2-92fbcf53809c.png

從上圖可以看出,yolov8s模型經(jīng)過INT8量化后,相比FP16精度模型,無論在Latency還是Throughput上,都有明顯提升。

3

第三步:編寫YOLOv8推理程序

yolov8目標(biāo)檢測模型使用letterbox算法對輸入圖像進(jìn)行保持原始寬高比的放縮,據(jù)此,yolov8目標(biāo)檢測模型的預(yù)處理函數(shù)實(shí)現(xiàn),如下所示:

from ultralytics.data.augment import LetterBox
# 實(shí)例化LetterBox
letterbox = LetterBox()
# 預(yù)處理函數(shù)
def preprocess_image(image: np.ndarray, target_size=(640, 640))->np.ndarray:
  image = letterbox(image)  #YOLOv8用letterbox按保持圖像原始寬高比方式放縮圖像
  blob = cv2.dnn.blobFromImage(image, scalefactor=1 / 255, size=target_size, swapRB=True)
  return blob

yolov8目標(biāo)檢測模型的后處理函數(shù)首先用非極大值抑制non_max_suppression()算法去除冗余候選框,然后根據(jù)letterbox的放縮方式,用scale_boxes()函數(shù)將檢測框的坐標(biāo)點(diǎn)還原到原始圖像上,如下所示:

# 后處理函數(shù): 從推理結(jié)果[1,84,8400]的張量中拆解出:檢測框,置信度和類別
def postprocess(pred_boxes, input_hw, orig_img, min_conf_threshold = 0.25, 
         nms_iou_threshold = 0.7, agnosting_nms = False, max_detections = 300):
  # 用非極大值抑制non_max_suppression()算法去除冗余候選框
  nms_kwargs = {"agnostic": agnosting_nms, "max_det":max_detections}
  pred = ops.non_max_suppression(
    torch.from_numpy(pred_boxes),
    min_conf_threshold,
    nms_iou_threshold,
    nc=80,
    **nms_kwargs
  )[0]
  # 用scale_boxes()函數(shù)將檢測框的坐標(biāo)點(diǎn)還原到原始圖像上
  shape = orig_img.shape
  pred[:, :4] = ops.scale_boxes(input_hw, pred[:, :4], shape).round()
  
  return pred

完整代碼詳細(xì)參見:yolov8_infer_ov.py,其運(yùn)行結(jié)果如下所示:

a4be35fe-1e63-11ef-91d2-92fbcf53809c.png

4

總結(jié)

英特爾 酷睿 Ultra處理器內(nèi)置了CPU、GPU和NPU,相比之前,無論是能耗比、顯卡性能還是AI性能,都有顯著提升;通過OpenVINO和NNCF,可以方便快捷實(shí)現(xiàn)AI模型的優(yōu)化和INT量化,以及本地化部署,獲得非常不錯(cuò)的端側(cè)AI推理性能。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20323

    瀏覽量

    254568
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10316

    瀏覽量

    181017
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    307

    瀏覽量

    6552
  • OpenVINO
    +關(guān)注

    關(guān)注

    0

    文章

    118

    瀏覽量

    815

原文標(biāo)題:在英特爾? 酷睿? Ultra處理器上優(yōu)化和部署YOLOv8模型 | 開發(fā)者實(shí)戰(zhàn)

文章出處:【微信號:英特爾物聯(lián)網(wǎng),微信公眾號:英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    重磅測評!軟硬雙修升級,Ultra 200S Plus漂亮反殺!

    的Intel二進(jìn)制優(yōu)化技術(shù),官方更是宣稱其是Intel有史以來最強(qiáng)的游戲處理器。我們第一時(shí)間也收到了其中的
    的頭像 發(fā)表于 03-26 15:56 ?235次閱讀
    重磅測評!軟硬雙修升級,<b class='flag-5'>酷</b><b class='flag-5'>睿</b><b class='flag-5'>Ultra</b> 200S Plus漂亮反殺!

    性能再越級!英特爾推出全新Ultra 200HX Plus系列移動(dòng)處理器

    Plus系列專為高性能游戲、流媒體、內(nèi)容創(chuàng)作和工作站應(yīng)用而優(yōu)化。新推出的兩款新處理器——英特爾 U
    的頭像 發(fā)表于 03-19 16:43 ?280次閱讀

    釋放極致游戲性能!英特爾Ultra 200S Plus發(fā)布

    布:今日,英特爾發(fā)布全新英特爾Ultra 200S Plus 系列臺式機(jī)處理器——270K
    的頭像 發(fā)表于 03-19 13:13 ?336次閱讀

    輕薄、AI、數(shù)日續(xù)航、性能強(qiáng)勁,第三代英特爾Ultra新品重磅上市

    今日,英特爾在上海舉辦了第三代英特爾Ultra處理器新品分享會(huì)。作為全球首款基于Intel
    的頭像 發(fā)表于 03-19 13:12 ?221次閱讀

    18核/24核雙旗艦!英特爾Ultra 200S Plus發(fā)布,游戲性能大漲15%

    桌面處理器領(lǐng)域,英特爾開啟了新品發(fā)布。3月11日晚間,英特爾發(fā)布全新英特爾
    的頭像 發(fā)表于 03-12 16:27 ?1.1w次閱讀
    18核/24核雙旗艦!<b class='flag-5'>英特爾</b><b class='flag-5'>酷</b><b class='flag-5'>睿</b><b class='flag-5'>Ultra</b> 200S Plus發(fā)布,游戲性能大漲15%

    相當(dāng)完美的新一代移動(dòng)級處理器!英特爾Ultra X9 388H首測

    2026年1月26日,英特爾正式解禁了 Panther Lake ,也就是英特爾Ultra X處理器
    的頭像 發(fā)表于 01-30 13:42 ?2878次閱讀
    相當(dāng)完美的新一代移動(dòng)級<b class='flag-5'>處理器</b>!<b class='flag-5'>英特爾</b><b class='flag-5'>酷</b><b class='flag-5'>睿</b><b class='flag-5'>Ultra</b> X9 388H首測

    【NPU實(shí)戰(zhàn)】迅為RK3588玩轉(zhuǎn)YOLOv8:目標(biāo)檢測與語義分割一站式部署指南

    【NPU實(shí)戰(zhàn)】迅為RK3588玩轉(zhuǎn)YOLOv8:目標(biāo)檢測與語義分割一站式部署指南
    的頭像 發(fā)表于 12-12 14:30 ?6355次閱讀
    【NPU實(shí)戰(zhàn)】<b class='flag-5'>在</b>迅為RK3588<b class='flag-5'>上</b>玩轉(zhuǎn)<b class='flag-5'>YOLOv8</b>:目標(biāo)檢測與語義分割一站式<b class='flag-5'>部署</b>指南

    大顯存突破!解鎖120B MoE大模型,英特爾Ultra 285H拓展AI新應(yīng)用

    電子發(fā)燒友原創(chuàng) 章鷹 11月20日,2025英特爾技術(shù)創(chuàng)新與產(chǎn)業(yè)生態(tài)大會(huì)上,英特爾中國技術(shù)部總經(jīng)理高宇宣布,今天我們帶來兩款重要的產(chǎn)品,英特爾??
    的頭像 發(fā)表于 11-23 08:00 ?9850次閱讀
    大顯存突破!解鎖120B MoE大<b class='flag-5'>模型</b>,<b class='flag-5'>英特爾</b><b class='flag-5'>酷</b><b class='flag-5'>睿</b><b class='flag-5'>Ultra</b> 285H拓展AI新應(yīng)用

    英特爾舉辦行業(yè)解決方案大會(huì),共同打造機(jī)器人“芯”動(dòng)脈

    11月19日,2025英特爾行業(yè)解決方案大會(huì)上,英特爾展示了基于英特爾? ?
    的頭像 發(fā)表于 11-19 21:51 ?7050次閱讀
    <b class='flag-5'>英特爾</b>舉辦行業(yè)解決方案大會(huì),共同打造機(jī)器人“芯”動(dòng)脈

    使用ROCm?優(yōu)化部署YOLOv8模型

    ://github.com/ultralytics/ultralytics/tree/main YOLOv8模型的卓越性能使其多個(gè)領(lǐng)域具有廣泛的應(yīng)用前景,如自動(dòng)駕
    的頭像 發(fā)表于 09-24 18:32 ?972次閱讀
    使用ROCm?<b class='flag-5'>優(yōu)化</b>并<b class='flag-5'>部署</b><b class='flag-5'>YOLOv8</b><b class='flag-5'>模型</b>

    求助,關(guān)于K230部署yolov8時(shí)遇到問題求解

    使用yolov8訓(xùn)練出來了一個(gè)十個(gè)類別的模型并且按照要求轉(zhuǎn)換成了.kmodel模型,部署到K230時(shí) 使用yolo大作戰(zhàn)里面的代碼提示我l
    發(fā)表于 08-12 07:26

    硬件與應(yīng)用同頻共振,英特爾Day 0適配騰訊開源混元大模型

    今日,騰訊正式發(fā)布新一代混元開源大語言模型英特爾憑借人工智能領(lǐng)域的全棧技術(shù)布局,現(xiàn)已在英特爾?
    的頭像 發(fā)表于 08-07 14:42 ?1503次閱讀
    硬件與應(yīng)用同頻共振,<b class='flag-5'>英特爾</b>Day 0適配騰訊開源混元大<b class='flag-5'>模型</b>

    yolov8怎么wsl中搭建呢?

    純小白,yolov8怎么wsl中搭建呢?一直報(bào)錯(cuò)且無法安裝pip包
    發(fā)表于 07-11 07:37

    如何提高yolov8模型k230運(yùn)行的幀率?

    我rgb888p_size參數(shù)[1280,720]時(shí)只有4~6 FPS,調(diào)成[640,640]大概也只有10FPS左右,我是用官方y(tǒng)oolo大作戰(zhàn)的示例代碼看的,用的是yolov8s.pt訓(xùn)
    發(fā)表于 06-20 06:25

    RV1126 yolov8訓(xùn)練部署教程

    本教程針對目標(biāo)檢測算法yolov8的訓(xùn)練和部署到EASY-EAI-Nano(RV1126)進(jìn)行說明,而數(shù)據(jù)標(biāo)注方法可以參考我們往期的文章。
    的頭像 發(fā)表于 04-18 15:18 ?2270次閱讀
    RV1126 <b class='flag-5'>yolov8</b>訓(xùn)練<b class='flag-5'>部署</b>教程
    兰州市| 睢宁县| 衡南县| 江津市| 湘乡市| 潢川县| 连云港市| 涟水县| 无极县| 斗六市| 平昌县| 峡江县| 寿阳县| 甘洛县| 龙井市| 乌恰县| 宁德市| 尚志市| 重庆市| 奉贤区| 离岛区| 新干县| 健康| 北海市| 台安县| 桃江县| 社会| 新密市| 靖远县| 土默特右旗| 奉贤区| 成都市| 曲周县| 连江县| 蒲江县| 尖扎县| 垣曲县| 乐陵市| 德格县| 哈密市| 乌海市|