哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

訊飛超擬人交互API上線

訊飛開(kāi)放平臺(tái) ? 來(lái)源:訊飛開(kāi)放平臺(tái) ? 2025-07-10 15:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

“快點(diǎn)!導(dǎo)航去最近的醫(yī)院!”,當(dāng)你焦急地對(duì)車載助手說(shuō)到。

“好的,正在為您規(guī)劃路線……”,傳統(tǒng)AI在幾秒后,以平淡語(yǔ)氣回應(yīng)。一個(gè)真正AI應(yīng)該迅速回應(yīng),以沉穩(wěn)語(yǔ)氣說(shuō)到:“好的,已為您規(guī)劃最快路線,預(yù)計(jì)12分鐘到達(dá)。請(qǐng)小心駕駛!”

讓AI感知用戶情緒,從冰冷服務(wù)進(jìn)化成為心意相通的助手,這并非存在于《Her》或《鋼鐵俠》等科幻電影。大模型加持的語(yǔ)音交互全新升級(jí),能夠輕松應(yīng)對(duì)多輪對(duì)話,而且實(shí)現(xiàn)情緒響應(yīng)和個(gè)性定制。

2024年8月,科大訊飛發(fā)布了星火極速超擬人交互技術(shù),在響應(yīng)和打斷速度、情緒感知情感共鳴、語(yǔ)音可控表達(dá)、人設(shè)扮演四個(gè)方面實(shí)現(xiàn)巨大突破,讓語(yǔ)音交互速度變得更快,能夠感知你話語(yǔ)里的喜怒哀樂(lè)并用合適的情緒回復(fù),還可根據(jù)需要讓超擬人的聲音變換節(jié)奏、大小,甚至切換不同的角色聲音和性格對(duì)話。

現(xiàn)在超擬人交互API正式上線訊飛開(kāi)放平臺(tái),面向開(kāi)發(fā)者開(kāi)放調(diào)用。通過(guò)接入相應(yīng)的API,開(kāi)發(fā)者無(wú)需從零開(kāi)始搭建復(fù)雜架構(gòu),即可實(shí)現(xiàn)用戶與AI的實(shí)時(shí)語(yǔ)音互動(dòng),構(gòu)建契合業(yè)務(wù)場(chǎng)景的AI實(shí)時(shí)對(duì)話能力,提供高效流暢的溝通體驗(yàn)。從游戲NPC、虛擬助手到智能客服與數(shù)字導(dǎo)游,語(yǔ)音交互的想象邊界正在被重新定義。

01秒級(jí)響應(yīng),雙商在線的超擬人交互

作為人類與AI交流的最主要入口,語(yǔ)音交互已滲透至我們的日常工作生活中:叫音箱播放指定音樂(lè)、讓掃地機(jī)器人定時(shí)工作、對(duì)車載系統(tǒng)喊一句“導(dǎo)航回家”。AI游戲陪玩、AI虛擬陪伴、AI口語(yǔ)陪練等,各種AI應(yīng)用對(duì)語(yǔ)音交互的需求也呈爆發(fā)式增長(zhǎng)。

然而,在實(shí)際使用中,傳統(tǒng)語(yǔ)音交互仍存在明顯痛點(diǎn):

響應(yīng)遲緩:動(dòng)輒數(shù)秒的延遲,打斷對(duì)話節(jié)奏,帶來(lái)強(qiáng)烈的割裂感。

情緒單一: 機(jī)械化的語(yǔ)調(diào),缺乏情感溫度,難以建立真正的連接。

語(yǔ)境缺失: 難以理解言外之意,導(dǎo)致交互中斷或理解錯(cuò)位。

大模型時(shí)代下,當(dāng)我們從技術(shù)層面分析傳統(tǒng)語(yǔ)音交互體驗(yàn)不佳的原因會(huì)發(fā)現(xiàn),傳統(tǒng)語(yǔ)音交互如同一個(gè)需要分布處理的流水線:語(yǔ)音輸入后,先由“語(yǔ)音識(shí)別”車間轉(zhuǎn)成文字,再交由“大模型”車間思考回復(fù)文本,最后由“語(yǔ)音合成”車間將文字朗讀出來(lái)。這個(gè)串聯(lián)過(guò)程不僅步驟繁瑣,且每個(gè)環(huán)節(jié)都存在延遲,累加起來(lái),3秒的響應(yīng)時(shí)間已是常態(tài)。

同時(shí),文本是其中傳遞信息的載體,在語(yǔ)音轉(zhuǎn)文字再轉(zhuǎn)語(yǔ)音的過(guò)程中,語(yǔ)音的很多情感、副語(yǔ)言信息甚至是環(huán)境信息都會(huì)丟失,導(dǎo)致語(yǔ)音交互系統(tǒng)只能針對(duì)語(yǔ)音的文本內(nèi)容進(jìn)行回應(yīng),會(huì)忽略我們?cè)谡Z(yǔ)音中本身真實(shí)的情感、語(yǔ)氣等元素。

在許多關(guān)鍵場(chǎng)景中,延遲意味著無(wú)法用,甚至危險(xiǎn)。如:導(dǎo)航指令若晚幾秒反饋,用戶可能已錯(cuò)過(guò)路口;與智能客服溝通時(shí),頻繁的“空白加載”足以讓用戶不耐煩地掛斷電話。大模型的“聰明”,只有搭配“實(shí)時(shí)”的響應(yīng),才能成為真正有溫度、有價(jià)值的交互智能。正如智能手機(jī)時(shí)代的流暢滑動(dòng)是用戶接受觸屏的關(guān)鍵,「實(shí)時(shí)」是AI接口從“嘗鮮”走向“常用”的門檻。

星火極速超擬人交互則跨文本和音頻模態(tài),采用了統(tǒng)一神經(jīng)網(wǎng)絡(luò)直接實(shí)現(xiàn)語(yǔ)音到語(yǔ)音的端到端建模:

1語(yǔ)音通過(guò)音頻編碼器得到音頻表征后,通過(guò)適配器與文本語(yǔ)義表征進(jìn)行對(duì)齊;

2對(duì)齊完成之后的內(nèi)容輸入多模LLM,預(yù)測(cè)輸出表征;

3經(jīng)過(guò)音頻解碼器后,最終輸出情緒自然、節(jié)奏準(zhǔn)確的合成語(yǔ)音。

星火極速超擬人語(yǔ)音交互技術(shù)框架圖

相比于傳統(tǒng)的交互系統(tǒng),統(tǒng)一的模型大大提升了整體的響應(yīng)和打斷速度,人與AI的交互也從你問(wèn)我答的“微信語(yǔ)音模式”,切換到了實(shí)時(shí)響應(yīng)的“微信通話模式”。

但反應(yīng)迅速只是第一步,沒(méi)有情感的交互依舊是“冷冰冰”的機(jī)器。如何讓語(yǔ)音交互更有溫度?

在星火極速超擬人交互系統(tǒng)中,基于端到端框架之上,融入了多維度語(yǔ)音屬性解耦表征訓(xùn)練,將內(nèi)容、情感、語(yǔ)種、音色、韻律等屬性進(jìn)行解耦,進(jìn)行對(duì)比學(xué)習(xí)和掩碼預(yù)測(cè)。不僅實(shí)現(xiàn)了內(nèi)容識(shí)別更準(zhǔn)、情感等屬性感知度更高,還可以更便捷進(jìn)行定制,方便系統(tǒng)快速落地。

02“快、準(zhǔn)、真”,打造下一代AI語(yǔ)音應(yīng)用

基于語(yǔ)音交互技術(shù)的突破,面向開(kāi)發(fā)者開(kāi)放的超擬人交互API具有三大核心優(yōu)勢(shì):

同時(shí),訊飛開(kāi)放平臺(tái)還為開(kāi)發(fā)者提供了詳細(xì)開(kāi)發(fā)文檔,方便開(kāi)發(fā)者們快速上手并了解超擬人交互API 的各項(xiàng)功能特色、調(diào)用過(guò)程中的常見(jiàn)錯(cuò)誤。

03多場(chǎng)景快速落地,成本低至0.1元/分鐘

超擬人交互API的上線,不僅為開(kāi)發(fā)者提供了一種新的語(yǔ)音應(yīng)用開(kāi)發(fā)范式,降低了開(kāi)發(fā)門檻,也讓開(kāi)發(fā)者能夠更加聚焦應(yīng)用創(chuàng)新和場(chǎng)景落地,以更天馬行空的想象力,創(chuàng)造出更具“生命力”的AI應(yīng)用。

文旅場(chǎng)景

結(jié)合故事演繹和RAG(檢索增強(qiáng)生成),AI可以作為數(shù)字導(dǎo)游為游客介紹景點(diǎn),在特定場(chǎng)景下與游客進(jìn)行角色扮演互動(dòng),讓游客“沉浸于”歷史。

游戲場(chǎng)景

基于角色人設(shè),模型與玩家互動(dòng)時(shí),可以自動(dòng)生成符合該角色價(jià)值觀、人生經(jīng)歷、語(yǔ)氣的對(duì)話,讓虛擬角色栩栩如生。

智能助手場(chǎng)景

可自由設(shè)定AI助理各種不同的人設(shè),并以符合人設(shè)的背景、語(yǔ)氣與用戶互動(dòng),為每個(gè)用戶打造獨(dú)一無(wú)二的AI助理。

智能玩具場(chǎng)景

通過(guò)生動(dòng)復(fù)刻各類IP角色,并以角色特有的性格、口吻與兒童互動(dòng),建立強(qiáng)烈的情感鏈接與代入感。

為進(jìn)一步降低高質(zhì)量語(yǔ)音交互的落地門檻,讓開(kāi)發(fā)者“輕裝上陣”,在API調(diào)用成本上,訊飛開(kāi)放平臺(tái)也提供了極具誠(chéng)意的產(chǎn)品價(jià)格:每分鐘交互成本低至0.1元,這意味著,僅需用一杯咖啡的錢,就能讓?xiě)?yīng)用與用戶“暢聊”數(shù)小時(shí)。

此外,通過(guò)企業(yè)認(rèn)證,開(kāi)發(fā)者還可“解鎖”有效期3個(gè)月,長(zhǎng)達(dá)10小時(shí)的免費(fèi)試用,實(shí)現(xiàn)對(duì)產(chǎn)品的快速驗(yàn)證。

從OpenAI、微軟、谷歌等AI巨頭,到Character AI 的新銳AI創(chuàng)業(yè)公司,語(yǔ)音交互正成為AI應(yīng)用公司最強(qiáng)大的突破口之一。科大訊飛憑借在語(yǔ)音技術(shù)領(lǐng)域持續(xù)二十余年的深耕,在這一賽道上有著強(qiáng)大的技術(shù)實(shí)力和市場(chǎng)競(jìng)爭(zhēng)力。

IDC發(fā)布的報(bào)告顯示,2024年上半年,中國(guó)人工智能語(yǔ)音語(yǔ)義整體市場(chǎng)規(guī)模為 72.3 億元人民幣,同比增長(zhǎng)18%,科大訊飛市場(chǎng)份額在主要廠商中位居第一,持續(xù)引領(lǐng)行業(yè)發(fā)展。

現(xiàn)在,借助訊飛開(kāi)放的超擬人交互API,開(kāi)發(fā)者可以輕松打造真正“能聽(tīng)會(huì)說(shuō)、情感在線”的AI應(yīng)用,提高產(chǎn)品競(jìng)爭(zhēng)力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40908

    瀏覽量

    302486
  • 科大訊飛
    +關(guān)注

    關(guān)注

    19

    文章

    865

    瀏覽量

    63907
  • 交互技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    38

    瀏覽量

    12985

原文標(biāo)題:首次開(kāi)放,訊飛超擬人交互API上線!

文章出處:【微信號(hào):訊飛開(kāi)放平臺(tái),微信公眾號(hào):訊飛開(kāi)放平臺(tái)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    科大桌面智能助理Loomy正式發(fā)布

    Loomy是推出的基于 AstroncClaw 打造的桌面級(jí)助理,主打本地辦公場(chǎng)景Skills,同時(shí)支持用戶自定義的SkillHub,面向全球生態(tài)開(kāi)放共享。
    的頭像 發(fā)表于 03-18 11:03 ?1105次閱讀

    智文產(chǎn)品完成重磅升級(jí)

    2026年伊始,當(dāng)智能體成為人人可用的數(shù)字生產(chǎn)力,智文完成重磅升級(jí)。全新打造的「智能演練」與「AI演示官」,首次實(shí)現(xiàn)“寫(xiě)、練、演”一體化的表達(dá)鏈路,重塑AI PPT全流程,讓每個(gè)觀點(diǎn)都能被從容講述、生動(dòng)傳遞。
    的頭像 發(fā)表于 01-08 16:41 ?955次閱讀

    科大設(shè)立子公司:加碼AI與集成電路業(yè)務(wù)布局

    電子發(fā)燒友網(wǎng)綜合報(bào)道,人工智能領(lǐng)軍企業(yè)科大近日再添新動(dòng)作,正式成立山東沂信息科技有限公司。該公司成立于2025年12月19日,注冊(cè)地位于臨沂市,法定代表人為柳升華,注冊(cè)資本5000萬(wàn)元
    發(fā)表于 12-29 08:53 ?1889次閱讀

    星辰Agent平臺(tái)入選36氪WISE 2025年度焦點(diǎn)產(chǎn)品

    近日,憑借在企業(yè)應(yīng)用落地方面的卓越表現(xiàn),星辰Agent平臺(tái)成功入選“36氪 WISE2025年度焦點(diǎn)產(chǎn)品”。
    的頭像 發(fā)表于 12-17 11:47 ?830次閱讀

    2025科大全球1024開(kāi)發(fā)者節(jié)精彩回顧

    當(dāng)全球產(chǎn)業(yè)格局和競(jìng)爭(zhēng)形態(tài)重塑之時(shí),AI將如何發(fā)展?11月6日,在第八屆世界聲博會(huì)暨2025科大全球1024開(kāi)發(fā)者節(jié)發(fā)布會(huì)上,科大董事長(zhǎng)劉慶峰以《更懂你的AI》為主題,給出了清晰
    的頭像 發(fā)表于 11-10 11:51 ?1114次閱讀
    2025科大<b class='flag-5'>訊</b><b class='flag-5'>飛</b>全球1024開(kāi)發(fā)者節(jié)精彩回顧

    科大發(fā)布星火X1.5及系列AI產(chǎn)品

    11月6日,第八屆世界聲博會(huì)暨2025科大全球1024開(kāi)發(fā)者節(jié)發(fā)布會(huì)上,科大以《更懂你的AI》為主題發(fā)布
    的頭像 發(fā)表于 11-10 11:49 ?1094次閱讀

    教你如何使用API

    。在網(wǎng)絡(luò)環(huán)境中,API使得應(yīng)用程序能夠彼此交互。在軟件或硬件中,API使得不同的組件能夠互相操作。 在編寫(xiě)代碼調(diào)用API之前,你需要了解API
    的頭像 發(fā)表于 11-09 17:48 ?1461次閱讀

    思必馳助力吉利銀河M9首發(fā)擬人情感智能體Eva

    近日,吉利汽車旗下AI科技大六座SUV一吉利銀河M9正式上市,思必馳協(xié)同吉利汽車研究院提供全鏈路語(yǔ)音語(yǔ)言交互技術(shù)及中樞大模型架構(gòu),助力打造擬人的“Eva情感智能體”。
    的頭像 發(fā)表于 10-29 14:07 ?1072次閱讀

    利用蘇寧易購(gòu) API 接口,實(shí)現(xiàn)蘇寧易購(gòu)店鋪線上線下庫(kù)存一體化

    線上商城和線下實(shí)體店的庫(kù)存系統(tǒng)無(wú)縫整合,從而避免缺貨、賣等問(wèn)題,優(yōu)化客戶體驗(yàn)。 第一步:理解蘇寧易購(gòu)API接口的基本框架 蘇寧易購(gòu)API接口基于RESTful架構(gòu),支持多種數(shù)據(jù)交互
    的頭像 發(fā)表于 09-01 16:57 ?868次閱讀
    利用蘇寧易購(gòu) <b class='flag-5'>API</b> 接口,實(shí)現(xiàn)蘇寧易購(gòu)店鋪線<b class='flag-5'>上線</b>下庫(kù)存一體化

    星火X1升級(jí)版正式上線

    今天,基于全國(guó)產(chǎn)算力訓(xùn)練的深度推理大模型——星火X1升級(jí)版正式上線。
    的頭像 發(fā)表于 07-30 14:12 ?2159次閱讀
    <b class='flag-5'>訊</b><b class='flag-5'>飛</b>星火X1升級(jí)版正式<b class='flag-5'>上線</b>

    API如何加速電商新功能上線

    顯著加速新功能上線。本文將逐步解析API如何實(shí)現(xiàn)這一目標(biāo),并提供實(shí)用示例。 1. API的基本概念與作用 API(Application Programming Interface)是
    的頭像 發(fā)表于 07-18 10:21 ?568次閱讀
    <b class='flag-5'>API</b>如何加速電商新功能<b class='flag-5'>上線</b>

    API讓電商“”起來(lái),告別手動(dòng)操作

    ,讓您輕松告別繁瑣的手動(dòng)操作。本文將一步步解析如何利用API實(shí)現(xiàn)電商流程的自動(dòng)化,幫助您的業(yè)務(wù)“”起來(lái)。我們將從基礎(chǔ)概念入手,逐步展示實(shí)際應(yīng)用,并提供一個(gè)簡(jiǎn)單的代碼示例,確保您能快速上手。 什么是API及其在電商中的
    的頭像 發(fā)表于 07-16 10:31 ?534次閱讀
    <b class='flag-5'>API</b>讓電商“<b class='flag-5'>飛</b>”起來(lái),告別手動(dòng)操作

    打破交互困局:科大這樣出手

    十年深耕,科大智能交互如何引領(lǐng)未來(lái)
    的頭像 發(fā)表于 06-17 11:50 ?1305次閱讀
    打破<b class='flag-5'>交互</b>困局:科大<b class='flag-5'>訊</b><b class='flag-5'>飛</b>這樣出手

    星辰Agent開(kāi)發(fā)平臺(tái)發(fā)布

    隨著以星火X1和DeepSeek-R1為代表的深度推理模型實(shí)現(xiàn)階躍式突破,模型自主規(guī)劃使用工具能力得到極大提升。在復(fù)雜任務(wù)拆解、多工具協(xié)同領(lǐng)域,AI Agent正展現(xiàn)出類人的認(rèn)知決策和任務(wù)處理水平,標(biāo)志著AI Agent規(guī)模化應(yīng)用時(shí)代加速到來(lái)。
    的頭像 發(fā)表于 05-06 09:34 ?1707次閱讀

    星火X1全新升級(jí)

    作為當(dāng)前業(yè)界唯一的基于全國(guó)產(chǎn)算力訓(xùn)練的深度推理大模型,星火X1全新升級(jí)啦!
    的頭像 發(fā)表于 04-22 15:37 ?1095次閱讀
    和林格尔县| 瑞丽市| 淅川县| 澄迈县| 团风县| 丽水市| 临江市| 奇台县| 贞丰县| 石城县| 静乐县| 鹤庆县| 宁都县| 微博| 凤冈县| 崇左市| 嘉定区| 酒泉市| 商河县| 威宁| 汉川市| 闻喜县| 浦县| 农安县| 华蓥市| 突泉县| 岳阳市| 峨山| 金门县| 温泉县| 大安市| 米易县| 云林县| 商河县| 六盘水市| 怀远县| 天柱县| 星座| 南丰县| 普定县| 五家渠市|