哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI使用音頻剪輯對(duì)與語(yǔ)音匹配的真實(shí)感面部建模

倩倩 ? 來(lái)源:新經(jīng)網(wǎng) ? 2020-04-11 10:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

您是否曾經(jīng)僅僅根據(jù)他們的聲音來(lái)構(gòu)造一個(gè)從未見過(guò)的人的心理形象?人工智能AI)現(xiàn)在可以做到這一點(diǎn),僅使用簡(jiǎn)短的音頻剪輯作為參考即可生成人臉的數(shù)字圖像。

這個(gè)名為“ Speech2Face” 的神經(jīng)網(wǎng)絡(luò)(一種以類似于人腦的方式“思考”的計(jì)算機(jī))經(jīng)過(guò)科學(xué)家培訓(xùn),接受了來(lái)自互聯(lián)網(wǎng)的數(shù)百萬(wàn)個(gè)教育視頻,顯示了100,000多個(gè)不同的人在說(shuō)話。

研究人員在一項(xiàng)新研究中寫道,Speech2Face通過(guò)該數(shù)據(jù)集學(xué)習(xí)了語(yǔ)音提示與人臉某些物理特征之間的關(guān)聯(lián)。然后,AI使用音頻剪輯對(duì)與語(yǔ)音匹配的真實(shí)感面部建模。

值得慶幸的是,人工智能還不能僅僅根據(jù)他們的聲音確切地知道特定的人是什么樣。研究作者報(bào)告說(shuō),神經(jīng)網(wǎng)絡(luò)識(shí)別語(yǔ)音中的某些標(biāo)記,這些標(biāo)記指向性別,年齡和種族,是許多人共有的特征。

科學(xué)家寫道:“因此,該模型只會(huì)產(chǎn)生看上去普通的面孔?!?“它不會(huì)產(chǎn)生特定個(gè)人的圖像?!?/p>

盡管坦率地說(shuō),對(duì)貓的解釋有點(diǎn)讓人恐懼,但AI已經(jīng)證明它可以產(chǎn)生出異常準(zhǔn)確的人臉。

由Speech2Face生成的臉部-均面向正面并具有中性表情-與聲音背后的人并不完全匹配。但是,根據(jù)這項(xiàng)研究,這些圖像通常確實(shí)可以捕捉到正確的年齡范圍,種族和性別。

但是,該算法的解釋遠(yuǎn)非完美。當(dāng)面對(duì)語(yǔ)言變化時(shí),Speech2Face表現(xiàn)出“混合表現(xiàn)”。例如,當(dāng)AI收聽亞洲人講中文的音頻片段時(shí),該程序會(huì)產(chǎn)生亞洲人臉的圖像。然而,據(jù)科學(xué)家報(bào)道,當(dāng)同一個(gè)人用不同的音頻片段講英語(yǔ)時(shí),人工智能產(chǎn)生了白人的面孔。

該算法還顯示出性別偏見,將低音調(diào)的聲音與男性面孔相關(guān)聯(lián),將高音調(diào)的聲音與女性面孔相關(guān)聯(lián)。研究人員寫道,由于訓(xùn)練數(shù)據(jù)集僅代表YouTube上的教育視頻,因此“并不代表整個(gè)世界人口?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)字圖像
    +關(guān)注

    關(guān)注

    2

    文章

    122

    瀏覽量

    19613
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50284

    瀏覽量

    266780
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1240

    瀏覽量

    26258
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    16位PCM音頻DAC AD1856:高性能音頻解決方案

    的純凈度和真實(shí)感。今天,我們就來(lái)詳細(xì)探討一款高性能的16位PCM音頻DAC——AD1856。 文件下載: AD1856.pdf 一、AD1856概述 AD1856是一款單片、16位脈沖編碼調(diào)制(PCM
    的頭像 發(fā)表于 04-14 09:15 ?364次閱讀

    Cadence推出專為新一代語(yǔ)音AI音頻應(yīng)用打造的 Tensilica HiFi iQ DSP

    第六代 HiFi DSP 為基于語(yǔ)音AI 應(yīng)用和最新沉浸式音頻格式帶來(lái)更出色的性能與能效表現(xiàn) 1 中國(guó)上海,2026 年 3 月 19 日 —— 楷登電子(美國(guó) Cadence 公司
    的頭像 發(fā)表于 03-19 10:24 ?2.4w次閱讀

    一文了解語(yǔ)音AI的運(yùn)作方式

    語(yǔ)音 AI 是對(duì)話式 AI 的一個(gè)子集,包括可將人類語(yǔ)音轉(zhuǎn)換為文本的自動(dòng)語(yǔ)音識(shí)別 (ASR) 和文本轉(zhuǎn)語(yǔ)
    的頭像 發(fā)表于 02-27 16:10 ?495次閱讀
    一文了解<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>AI</b>的運(yùn)作方式

    語(yǔ)音跳線:構(gòu)建高效音頻傳輸系統(tǒng)的核心組件

    在會(huì)議系統(tǒng)、錄音棚、廣播電臺(tái)等專業(yè)音頻場(chǎng)景中,語(yǔ)音跳線作為連接麥克風(fēng)、調(diào)音臺(tái)、功放等設(shè)備的“神經(jīng)末梢”,其性能直接影響聲音信號(hào)的保真度與傳輸穩(wěn)定性。本文從技術(shù)原理、應(yīng)用場(chǎng)景、選型要點(diǎn)三個(gè)維度,解析
    的頭像 發(fā)表于 01-19 10:12 ?342次閱讀
    <b class='flag-5'>語(yǔ)音</b>跳線:構(gòu)建高效<b class='flag-5'>音頻</b>傳輸系統(tǒng)的核心組件

    應(yīng)用 I 音頻接口防護(hù)方案

    放電損害,怎么讓產(chǎn)品穩(wěn)定可靠的運(yùn)行,成為我們迫切需要處理的問(wèn)題。兩種信號(hào)的優(yōu)缺點(diǎn)一、模擬信號(hào)優(yōu)點(diǎn):自然真實(shí)感強(qiáng)、實(shí)時(shí)性好、簡(jiǎn)單易用、無(wú)需轉(zhuǎn)換。缺點(diǎn):抗干擾能力弱、
    的頭像 發(fā)表于 12-29 13:37 ?301次閱讀
    應(yīng)用 I <b class='flag-5'>音頻</b>接口防護(hù)方案

    新品 | Module ASR,AI智能離線語(yǔ)音模塊

    ModuleASR是一款基于CI1302芯片設(shè)計(jì)的AI智能離線語(yǔ)音模塊。配備麥克風(fēng)用于清晰音頻采集,并內(nèi)置揚(yáng)聲器提供高質(zhì)量的音頻反饋。同時(shí)支持中途語(yǔ)
    的頭像 發(fā)表于 12-05 18:15 ?898次閱讀
    新品 | Module ASR,<b class='flag-5'>AI</b>智能離線<b class='flag-5'>語(yǔ)音</b>模塊

    深度解析:康謀雙模態(tài)仿真測(cè)試解決方案!

    隨著端到端自動(dòng)駕駛架構(gòu)的興起,傳統(tǒng)基于規(guī)則的仿真測(cè)試正面臨“真實(shí)感不足”與“場(chǎng)景泛化難”的雙重挑戰(zhàn)。本文深入解析康謀推出的雙模態(tài)仿真測(cè)試解決方案:一方面依托aiSim提供確定性的物理級(jí)傳感器建模;另一方面通過(guò)WorldExtractor實(shí)現(xiàn)基于3DGS
    的頭像 發(fā)表于 11-21 17:32 ?9024次閱讀
    深度解析:康謀雙模態(tài)仿真測(cè)試解決方案!

    安信可小智AI語(yǔ)音模組實(shí)測(cè):實(shí)現(xiàn)語(yǔ)音控制關(guān)燈

    以下作品由安信可社區(qū)用戶 zzbinfo 制作 ? 這次評(píng)測(cè)的是安信可科技出品的Ai-WV01-32S的小智AI語(yǔ)音模組。 將從 開箱、配網(wǎng)、語(yǔ)音測(cè)試 ,到最終通過(guò) 串口指令控制 一個(gè)
    的頭像 發(fā)表于 11-19 16:09 ?1323次閱讀
    安信可小智<b class='flag-5'>AI</b><b class='flag-5'>語(yǔ)音</b>模組實(shí)測(cè):實(shí)現(xiàn)<b class='flag-5'>語(yǔ)音</b>控制關(guān)燈

    AI語(yǔ)音模組】自制小智管家?安信可Ai-WV01-32S測(cè)試體驗(yàn)

    項(xiàng)目名:默語(yǔ)小智管家 模組支持: 安信可科技 AI語(yǔ)音模組 作者:安信可論壇用戶 molun 這兩年, AI 硬件又卷起來(lái)了。 ? 語(yǔ)音助手、AI
    的頭像 發(fā)表于 11-19 16:06 ?836次閱讀
    【<b class='flag-5'>AI</b><b class='flag-5'>語(yǔ)音</b>模組】自制小智管家?安信可<b class='flag-5'>Ai</b>-WV01-32S測(cè)試體驗(yàn)

    炬芯科技亮相2025亞洲AI音頻大會(huì)

    近日,2025亞洲AI音頻大會(huì)在深圳成功舉辦,作為中國(guó)行業(yè)現(xiàn)象級(jí)盛會(huì)之一,大會(huì)分享和展示音頻技術(shù)的最新成果。炬芯科技便攜式音頻事業(yè)部產(chǎn)品總監(jiān)張洪波受邀出席,以《全場(chǎng)景
    的頭像 發(fā)表于 09-29 11:36 ?4654次閱讀

    廣州唯創(chuàng)電子混音IC播報(bào)語(yǔ)音芯片:革新音頻應(yīng)用的新力量

    音頻源智能混音,開啟音頻交互新紀(jì)元在智能化浪潮席卷各行各業(yè)的今天,音頻處理技術(shù)正經(jīng)歷著革命性的變革。傳統(tǒng)的單一路徑語(yǔ)音播放已無(wú)法滿足日益復(fù)雜的應(yīng)用場(chǎng)景需求,混音播報(bào)
    的頭像 發(fā)表于 09-24 09:25 ?671次閱讀
    廣州唯創(chuàng)電子混音IC播報(bào)<b class='flag-5'>語(yǔ)音</b>芯片:革新<b class='flag-5'>音頻</b>應(yīng)用的新力量

    唯創(chuàng)知音AI語(yǔ)音交互芯片與模組介紹

    AI語(yǔ)音交互已經(jīng)成為智能產(chǎn)品的基礎(chǔ)配置,比如常見的AI玩具、智能家居、帶AI功能的藍(lán)牙音響,還有汽車的智能車機(jī)和智能穿戴設(shè)備等。唯創(chuàng)知音順應(yīng)市場(chǎng)趨勢(shì)推出了WT2606A系列的
    的頭像 發(fā)表于 09-17 15:51 ?905次閱讀
    唯創(chuàng)知音<b class='flag-5'>AI</b><b class='flag-5'>語(yǔ)音</b>交互芯片與模組介紹

    解鎖高品質(zhì)音頻體驗(yàn):探索音頻質(zhì)量評(píng)估與測(cè)試的科學(xué)之道

    高品質(zhì)音頻的科學(xué)世界!二、音頻質(zhì)量評(píng)估簡(jiǎn)介語(yǔ)音質(zhì)量評(píng)估就是通過(guò)人類或自動(dòng)化的方法評(píng)價(jià)語(yǔ)音質(zhì)量。在實(shí)踐中,有很多主觀和客觀的方法評(píng)價(jià)語(yǔ)音質(zhì)量。
    發(fā)表于 07-22 11:15

    最新人工智能硬件培訓(xùn)AI基礎(chǔ)入門學(xué)習(xí)課程參考2025版(離線AI語(yǔ)音視覺(jué)識(shí)別篇)

    端側(cè)離線 AI 智能硬件作為 AI 技術(shù)的重要載體之一,憑借其無(wú)需依賴網(wǎng)絡(luò)即可實(shí)現(xiàn)智能功能的特性,在一些網(wǎng)絡(luò)條件受限或?qū)?shù)據(jù)隱私有較高要求的場(chǎng)景中,發(fā)揮著不可或缺的作用。本章基于CSK6大模型語(yǔ)音
    發(fā)表于 07-04 11:14

    AI玩具爆發(fā),音頻編解碼器如何滿足語(yǔ)音交互需求

    電子發(fā)燒友網(wǎng)綜合報(bào)道,在AI玩具已經(jīng)開始逐漸爆發(fā)的當(dāng)下,人機(jī)交互已經(jīng)成為標(biāo)配功能,而最重要的便是語(yǔ)音控制。而語(yǔ)音控制的第一步,便需要讓AI玩具聽懂你在說(shuō)什么這就需要用到
    的頭像 發(fā)表于 06-20 01:07 ?7454次閱讀
    延津县| 深泽县| 中阳县| 珲春市| 长泰县| 宣城市| 安徽省| 宿松县| 南通市| 枣强县| 尉犁县| 乐至县| 溧水县| 永胜县| 灵璧县| 宝鸡市| 普格县| 莱州市| 晋中市| 绥阳县| 内黄县| 浑源县| 双柏县| 宁德市| 石嘴山市| 花垣县| 澳门| 中卫市| 卫辉市| 紫阳县| 中阳县| 柘城县| 安康市| 锡林郭勒盟| 三江| 枞阳县| 镇雄县| 大兴区| 文成县| 永州市| 富川|