哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從Satin到Lyra為什么微軟、谷歌都盯向音頻編解碼器?

LiveVideoStack ? 來(lái)源:LiveVideoStack ? 作者:LiveVideoStack ? 2021-05-24 15:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

回顧今年的2月份,可以說(shuō)是音頻編解碼器最為熱鬧的一個(gè)月。先是微軟宣布推出最新款由AI支持的音頻編解碼器——Satin。僅一周后,谷歌推出了用于語(yǔ)音壓縮的新型超低比特率音頻編解碼器——Lyra,并且Android版本已開(kāi)源。在此,也非常感謝來(lái)自國(guó)內(nèi)音頻領(lǐng)域的知名業(yè)內(nèi)人士對(duì)本文發(fā)表評(píng)論及審校。

不難發(fā)現(xiàn),硅谷大佬們對(duì)音頻編解碼器的深度研發(fā)進(jìn)度已提上日程,對(duì)未來(lái)可應(yīng)用的場(chǎng)景讓人們充滿期待。值得注意的是這兩款音頻編解碼器都是基于AI的語(yǔ)音編碼,但它們又有各自不同的特點(diǎn)。

Satin:用于實(shí)時(shí)通信的AI音頻編解碼器 作為一款由人工智能驅(qū)動(dòng)的音頻編解碼器,Satin可以在網(wǎng)速6kbps時(shí)提供超寬頻段的語(yǔ)音,17kbps時(shí)提供全頻段的立體聲音樂(lè),網(wǎng)速越高,質(zhì)量越高。

Satin旨在高丟包率下也提供良好的音頻質(zhì)量。此外,在冗余算法的改進(jìn)下,可以應(yīng)對(duì)突發(fā)丟包情況,提供更好的保護(hù)。以下是經(jīng)過(guò)改進(jìn)的彈性算法和Satin編解碼器的最終效果: SILK@6kbps,突發(fā)數(shù)據(jù)包丟失(附加6kbps的冗余) Satin@6kbps,突發(fā)數(shù)據(jù)包丟失,改進(jìn)的冗余算法(附加6kbps的冗余)

相對(duì)于Silk推出的超寬帶語(yǔ)音,12kHz的頻率,以24kHz的采樣率(在人類聲音超過(guò)12kHz的頻率時(shí),能量會(huì)迅速下降);Satin重新定義了超寬帶,以覆蓋16kHz的頻率,采樣率在32kHz,以提供更高的清晰度和穩(wěn)定性,而其高效的壓縮功能則可以實(shí)現(xiàn)6 kbps的超寬帶語(yǔ)音。

4f0e8eb2-bc62-11eb-bf61-12bb97331649.png

/ t /一詞在“ suit”一詞中的頻率分量。除了4 kHz的窄帶截止甚至8 kHz的寬帶截止以外,還有大量的能量。將能量保留在較高的頻譜分量中會(huì)導(dǎo)致聲音聽(tīng)起來(lái)更加自然。 以下分別為在6kbps下,Silk窄帶和Satin超寬帶的音頻示例(建議使用耳機(jī)試聽(tīng)): 為了保證在6kbps超寬帶下的語(yǔ)音質(zhì)量,Satin使用對(duì)語(yǔ)音產(chǎn)生、建模和心理聲學(xué)的深度理解來(lái)提取和編碼信號(hào)的稀疏表達(dá)。

為了進(jìn)一步降低所需的比特率,Satin只在較低的頻帶中編碼和傳輸某些參數(shù)。在解碼器上,Satin使用深層神經(jīng)網(wǎng)絡(luò)從接收到的低頻帶參數(shù)以及通過(guò)導(dǎo)線發(fā)送的最少量輔助信息中估計(jì)高頻帶參數(shù)。 雖然這種方法解決了在超低比特率下對(duì)使用超寬帶語(yǔ)音的最大挑戰(zhàn),但也帶來(lái)了計(jì)算復(fù)雜度的新挑戰(zhàn)。對(duì)此,微軟將重心放在對(duì)算法優(yōu)化和循環(huán)向量化等技術(shù)上,使計(jì)算復(fù)雜度降低40%,并保障能夠在所有用戶的設(shè)備上運(yùn)行。

4f31376e-bc62-11eb-bf61-12bb97331649.png

除此之外,微軟還關(guān)注到了關(guān)于Satin的丟包數(shù)據(jù)恢復(fù)能力。對(duì)此,Satin對(duì)每個(gè)數(shù)據(jù)包進(jìn)行獨(dú)立編碼,因此丟失一個(gè)數(shù)據(jù)包的效果不會(huì)影響后續(xù)數(shù)據(jù)包的質(zhì)量。編解碼器還被設(shè)計(jì)為有助于在內(nèi)部參數(shù)域中隱藏高質(zhì)量的丟包。這些功能可幫助Satin無(wú)縫處理隨機(jī)丟失,一次丟失一個(gè)或兩個(gè)數(shù)據(jù)包。

目前,Satin已被用于所有Teams和Skype兩方通話,并將很快用于Teams會(huì)議。目前,它以6-36 kbps的比特率范圍在寬帶語(yǔ)音模式下運(yùn)行,并且在不久的將來(lái)將擴(kuò)展為以48 kHz的最大采樣率支持全頻帶立體聲音樂(lè)。

Lyra:一款用于語(yǔ)音壓縮的新型超低比特率編解碼器 Lyra是由谷歌團(tuán)隊(duì)研發(fā)并已開(kāi)源了Android版本。它所擁有的能力在于能在3kbps網(wǎng)絡(luò)帶寬下為用戶提供自然清晰的語(yǔ)音聊天,以及僅90ms延遲的情況下在從高端云服務(wù)器到中端智能手機(jī)的任何設(shè)備上運(yùn)行。(有關(guān)Lyra的詳細(xì)介紹請(qǐng)瀏覽:在3kbps的帶寬下還能清晰地語(yǔ)音聊天?)

對(duì)比Satin & Lyra:雖然這兩個(gè)音頻編解碼器都能夠在低比特率下進(jìn)行操作,并通過(guò)AI提供動(dòng)力,但它們有很大的不同。Lyra僅專注于窄帶,而Satin則致力于超寬帶。 另外,國(guó)內(nèi)音頻領(lǐng)域的知名業(yè)內(nèi)人士指出:“在AI Codec領(lǐng)域中,有兩種方式。一種是 end to end 也就是全AI,所以Lyra屬于全AI結(jié)構(gòu)

。而另一種是hybird結(jié)構(gòu),就是只有部分模塊才使用AI,因此Satin是hybird結(jié)構(gòu)。那么之所以現(xiàn)在才使用AI與音頻編解碼器結(jié)合,是因?yàn)樵谙嗤a率下,使用AI能夠大幅提升音頻質(zhì)量?!?/p>

相關(guān)鏈接: https://mp.weixin.qq.com/s/Y1wceNAuMO7X8Vq3NiJ_GQ https://techcommunity.microsoft.com/t5/microsoft-teams-blog/satin-microsoft-s-latest-ai-powered-audio-codec-for-real-time/ba-p/2141382 https://bloggeek.me/lyra-satin-webrtc-voice-codecs/

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 寬帶
    +關(guān)注

    關(guān)注

    4

    文章

    1053

    瀏覽量

    64420
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7345

    瀏覽量

    94989
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40820

    瀏覽量

    302428
  • 音頻編解碼器
    +關(guān)注

    關(guān)注

    4

    文章

    214

    瀏覽量

    56805

原文標(biāo)題:從Satin到Lyra 為何微軟、谷歌都盯向音頻編解碼器?

文章出處:【微信號(hào):livevideostack,微信公眾號(hào):LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    MAX9880A:低功耗高性能的音頻編解碼器

    MAX9880A:低功耗高性能的音頻編解碼器 在如今的便攜式消費(fèi)電子設(shè)備中,音頻編解碼器的性能和功耗是至關(guān)重要的指標(biāo)。Maxim Integrated的MAX9880A就是一款專為便攜
    的頭像 發(fā)表于 04-04 09:05 ?219次閱讀

    WM8915:超低功耗音頻集線器編解碼器的卓越之選

    WM8915:超低功耗音頻集線器編解碼器的卓越之選 在當(dāng)今的移動(dòng)音頻領(lǐng)域,對(duì)于高質(zhì)量語(yǔ)音和音樂(lè)播放的需求日益增長(zhǎng),而超低功耗的音頻編解碼器
    的頭像 發(fā)表于 03-27 18:05 ?1010次閱讀

    ADAU1372低延遲低功耗編解碼器音頻設(shè)計(jì)的理想之選

    ADAU1372低延遲低功耗編解碼器音頻設(shè)計(jì)的理想之選 在當(dāng)今的電子設(shè)備中,音頻質(zhì)量是用戶體驗(yàn)的關(guān)鍵因素之一。對(duì)于需要高質(zhì)量音頻、低功耗、小尺寸和低延遲的便攜式應(yīng)用來(lái)說(shuō),ADAU13
    的頭像 發(fā)表于 03-23 15:25 ?124次閱讀

    德州儀器PCM3002和PCM3003立體聲音頻編解碼器深度解析

    德州儀器PCM3002和PCM3003立體聲音頻編解碼器深度解析 在音頻處理領(lǐng)域,編解碼器(CODEC)是實(shí)現(xiàn)模擬信號(hào)與數(shù)字信號(hào)相互轉(zhuǎn)換的關(guān)鍵組件。德州儀器(TI)推出的PCM3002
    的頭像 發(fā)表于 03-16 15:50 ?243次閱讀

    TLV320AIC2x系列編解碼器:高性能音頻解決方案解析

    TLV320AIC2x系列編解碼器:高性能音頻解決方案解析 在音頻處理領(lǐng)域,編解碼器(CODEC)的性能直接影響著音頻系統(tǒng)的整體表現(xiàn)。TI的
    的頭像 發(fā)表于 02-04 11:00 ?320次閱讀

    詳解TI的PCM2901/2903立體聲音頻編解碼器

    詳解TI的PCM2901/2903立體聲音頻編解碼器音頻設(shè)備領(lǐng)域,一款性能出色且功能豐富的編解碼器是實(shí)現(xiàn)高質(zhì)量音頻處理的關(guān)鍵。今天我們要
    的頭像 發(fā)表于 02-04 10:30 ?413次閱讀

    深入解析LM4546B AC '97多通道音頻編解碼器

    深入解析LM4546B AC '97多通道音頻編解碼器 在當(dāng)今的電子世界中,音頻編解碼器扮演著至關(guān)重要的角色,尤其是在PC系統(tǒng)、便攜式設(shè)備以及汽車電子等領(lǐng)域。今天,我們要深入探討一款由
    的頭像 發(fā)表于 02-03 10:50 ?312次閱讀

    深入剖析LM4549B:高性能音頻編解碼器的技術(shù)指南

    深入剖析LM4549B:高性能音頻編解碼器的技術(shù)指南 在當(dāng)今的音頻處理領(lǐng)域,高性能的音頻編解碼器對(duì)于實(shí)現(xiàn)出色的
    的頭像 發(fā)表于 02-03 10:50 ?349次閱讀

    TLV320AIC34音頻編解碼器:低功耗設(shè)計(jì)與高性能音頻處理的完美結(jié)合

    TLV320AIC34音頻編解碼器:低功耗設(shè)計(jì)與高性能音頻處理的完美結(jié)合 在當(dāng)今的便攜式音頻和通信設(shè)備領(lǐng)域,低功耗、高性能的音頻
    的頭像 發(fā)表于 02-02 16:30 ?344次閱讀

    探索PCM3168A音頻編解碼器:高性能音頻處理的理想之選

    探索PCM3168A音頻編解碼器:高性能音頻處理的理想之選 在音頻處理領(lǐng)域,一款出色的編解碼器對(duì)于實(shí)現(xiàn)高質(zhì)量
    的頭像 發(fā)表于 02-02 14:35 ?491次閱讀

    解析PCM5310音頻編解碼器:多功能設(shè)計(jì)與性能優(yōu)勢(shì)

    解析PCM5310音頻編解碼器:多功能設(shè)計(jì)與性能優(yōu)勢(shì) 在當(dāng)今數(shù)字化音頻技術(shù)飛速發(fā)展的時(shí)代,音頻編解碼器作為核心組件,對(duì)于實(shí)現(xiàn)高質(zhì)量
    的頭像 發(fā)表于 02-02 11:45 ?420次閱讀

    TLV320AIC3206:超低功耗立體聲音頻編解碼器的卓越之選

    TLV320AIC3206:超低功耗立體聲音頻編解碼器的卓越之選 在當(dāng)今的音頻處理領(lǐng)域,低功耗、高性能的音頻編解碼器是眾多便攜式設(shè)備和
    的頭像 發(fā)表于 01-30 16:00 ?680次閱讀

    探索MAX9860:16位單聲道音頻語(yǔ)音編解碼器的卓越性能與應(yīng)用

    探索MAX9860:16位單聲道音頻語(yǔ)音編解碼器的卓越性能與應(yīng)用 在當(dāng)今的音頻設(shè)備領(lǐng)域,低功耗、高性能的音頻編解碼器需求日益增長(zhǎng)。Maxim
    的頭像 發(fā)表于 01-28 16:10 ?271次閱讀

    德州儀器PCM2904/PCM2906立體聲音頻編解碼器:特性、應(yīng)用與設(shè)計(jì)指南

    德州儀器PCM2904/PCM2906立體聲音頻編解碼器:特性、應(yīng)用與設(shè)計(jì)指南 在當(dāng)今數(shù)字化音頻的時(shí)代,高質(zhì)量的音頻編解碼器對(duì)于各種
    的頭像 發(fā)表于 12-23 15:05 ?682次閱讀

    基于E203 RISC-V的音頻信號(hào)處理系統(tǒng) -CODEC(音頻編解碼器)配置

    CODEC介紹 本設(shè)計(jì)采用的音頻編解碼器是WM8731,該編解碼器可以通過(guò)I2C進(jìn)行寄存配置,可以調(diào)節(jié)主從模式、數(shù)據(jù)位數(shù)可設(shè)置為16bit、24bit、32bit。可以設(shè)置的傳輸模
    發(fā)表于 10-28 06:29
    红原县| 和林格尔县| 宿松县| 栾川县| 衢州市| 焉耆| 襄樊市| 永和县| 遵义县| 阿尔山市| 安多县| 镇江市| 潮安县| 沙河市| 台前县| 隆德县| 额尔古纳市| 忻城县| 古浪县| 大庆市| 周口市| 波密县| 山西省| 丹江口市| 阿勒泰市| 太仓市| 蒙阴县| 商南县| 武安市| 嘉荫县| 长泰县| 汉川市| 临澧县| 潮州市| 甘孜县| 聂拉木县| 行唐县| 尚志市| 睢宁县| 临沭县| 秭归县|