6月12日,2025科大訊飛智能交互產(chǎn)品升級發(fā)布會在深圳成功舉辦。以“交互領航 智啟新章”為主題,數(shù)百位企業(yè)代表、優(yōu)秀開發(fā)者與AI技術(shù)專家齊聚一堂,共同開啟大模型時代的交互新未來。
AIUI、機器人超腦、虛擬數(shù)字人與訊飛星辰四大開發(fā)平臺率先登場,展示軟硬件協(xié)同優(yōu)化,以技術(shù)創(chuàng)新降低行業(yè)智能化門檻。聚焦辦公、人力與企業(yè)數(shù)字化等剛需場景,現(xiàn)場發(fā)布十大場景化方案,以開箱即用的方式,加速AI技術(shù)從通用能力向垂直場景價值轉(zhuǎn)化。在發(fā)布會現(xiàn)場,100+創(chuàng)新產(chǎn)品零距離開放體驗,從健康理療機器人、兒童陪伴玩具到智能眼鏡,生動展現(xiàn)智能交互的無限潛能。2025 iFLYTEK AI開發(fā)者大賽同場啟航,以技術(shù)平臺之姿匯聚全球創(chuàng)新力量,開啟智能時代的新征程??拼笥嶏w開放平臺總經(jīng)理趙艷軍在現(xiàn)場分享到,大模型浪潮正在推動開發(fā)者高質(zhì)增長,訊飛生態(tài)合作伙伴已突破1152萬,海外開發(fā)者遍布“日韓、新加坡、中東及歐洲”等,構(gòu)建起全球領先的AI開放生態(tài)。立足浪潮之巔,機器人、智能辦公與智能穿戴領域開發(fā)者數(shù)量翻倍增長,數(shù)字人年創(chuàng)作量激增16倍且人均交互頻次提升6.5倍,大模型時代的交互范式正在變遷。
01
自2015年發(fā)布國內(nèi)首個智能人機交互界面以來,AIUI歷經(jīng)十年技術(shù)迭代,以連續(xù)十年的高可靠線上服務保障,實現(xiàn)日均交互量突破3億次,鏈接生態(tài)伙伴20萬+,終端設備數(shù)22.5億,成為全球智能交互領域規(guī)?;涞氐年P(guān)鍵基礎設施。
今天,新一代AIUI交互平臺基座以大模型為引擎,賦予機器情緒識別、創(chuàng)意生成與深度語義理解等類人多模態(tài)能力,為企業(yè)和用戶提供更高效、更具溫度的智能體驗,成為產(chǎn)業(yè)智能化升級的核心支撐。全新升級的AIUI,成為以訊飛星火大模型為核心的全鏈路交互開發(fā)平臺,推動人機關(guān)系從“工具型接口”進化為“類人協(xié)作伙伴”。當然,人機交互遠不止“語音識別 + 大模型”那么簡單,而是一個涵蓋感知、理解、響應與記憶的復雜系統(tǒng)工程。AIUI構(gòu)建了從設備端聲學處理到云端智能理解,再到內(nèi)容響應與定制開發(fā)的完整交互鏈路,實現(xiàn)高效、可規(guī)模化的人機交互,為智能產(chǎn)品提供核心交互能力。
深度優(yōu)化的噪聲拒識與聲紋過濾技術(shù),讓全新的AIUI在嘈雜環(huán)境中精準捕捉有效指令。當用戶遲疑、等待或附和,系統(tǒng)會主動延長拾音時間,徹底解決傳統(tǒng)方案誤觸發(fā)和搶答的痛點。
基于千萬級高情商對話訓練,星火交互大模型在情緒共鳴、耐心傾聽等維度顯著躍升。設備不再被動響應指令,而是化身能感知喜怒哀樂的"共情體":沮喪時給予安慰,興奮時分享快樂,真正成為懂情緒的智能伙伴。
平臺整合4000萬首正版音樂、1200萬小時有聲內(nèi)容及數(shù)十種場景智能體,構(gòu)建“通識+搜索+信源”的智慧引擎。通過意圖理解與聚合搜索,為用戶提供“能搜、能聽、能唱、能看”的立體陪伴。讓AI真正成為懂娛樂、會幫忙、有溫度的生活伙伴,同時大幅提升開發(fā)效率。
用戶可通過AIUI一鍵配置"早教老師"等官方角色,或定制"家庭管家""虛擬閨蜜"等個性身份。系統(tǒng)基于對話歷史能夠存儲用戶的喜好、性格,以及生平的事件,讓交互越來越懂用戶,實現(xiàn)角色與用戶"共同成長的陪伴"。
從設備控制、內(nèi)容點播到知識問答與情感陪伴,一套交互模型無縫覆蓋所有場景。音頻端到端響應僅需1.6秒,真正做到"不搶話、不冷場",以量產(chǎn)語音系統(tǒng)中絕對領先的速度,重塑自然對話新標準。
從基礎平臺能力,到異化場景需求,AIUI通過垂直方案的精細化打磨持續(xù)拉近人機交互距離。
首發(fā)兒童專屬交互方案。當發(fā)音模糊、表達跳躍的“咿呀童語”讓傳統(tǒng)交互系統(tǒng)難以招架,訊飛特別推出7911兒童交互開發(fā)套件,以低算力、低功耗、功能全等特性,賦能智能玩具等產(chǎn)品“聽懂童言、守護童心”,真正成為孩子的成長伙伴。
針對兒童發(fā)音特性訓練的聲學模型,結(jié)合語義糾偏技術(shù),即使吐字不清的跳躍式提問也能精準解析,實現(xiàn)“開口即響應、對話無卡頓、意圖秒理解”的新?代暢快體驗。同時,兒童交互方案專門為兒童打造了寓教于樂的內(nèi)容,融趣味游戲、早教技能、情感陪伴等,培養(yǎng)孩子的語言能力與認知發(fā)展。實時感知情緒的能力,既能夠給予孩子心理疏導,也能觸發(fā)家長預警。當然,通過嚴選兒童故事和音樂信源,構(gòu)建起了綠色健康的數(shù)字成長環(huán)境。
三麥陣列降噪技術(shù)發(fā)布,讓智能眼鏡走進現(xiàn)實。針對嘈雜公共環(huán)境,實現(xiàn)佩戴者與他人聲音精準區(qū)分,支持一對一私密對話。訊飛開放平臺產(chǎn)品經(jīng)理馬士玥現(xiàn)場演示了智能眼鏡的更多實用功能,比如監(jiān)測食物熱量、逛展導覽講解、與國際友人無障礙社交等等。
AIUI構(gòu)建軟硬一體的智能體矩陣。在智能家居領域,AIUI支持語音控制電視、冰箱、空調(diào)等設備,更引入“影視、康養(yǎng)、美食”等垂類智能體,已成功落地海爾電視。在智能辦公場景,訊飛推出AIPC方案,實現(xiàn)本地算力與云端大模型協(xié)同,保障數(shù)據(jù)隱私前提下完成離線文檔生成、數(shù)據(jù)處理等任務,打造“安全高效”的辦公新范式。
平臺通過聯(lián)結(jié)生態(tài)伙伴,打造集硬件、AI交互與業(yè)務場景于一體的完整解決方案,助力機器人在多元場景中加速落地。依托開放生態(tài)體系,平臺攜手硬件廠商與方案商協(xié)同創(chuàng)新,推動智能技術(shù)與實際場景的深度融合。
02
讓機器人聲動相隨
機器人超腦平臺「智慧升級」
訊飛機器人超腦平臺是專為機器人打造的“智能中樞系統(tǒng)”,融合視聽感知交互能力與基于大模型的機器人大腦,構(gòu)建“端-云協(xié)同”的AI架構(gòu)。在端側(cè),平臺提供多模態(tài)降噪、人臉識別、物體檢測、端側(cè)大模型等本地感知與計算能力;在云端,依托語音大模型與具身智能技術(shù),實現(xiàn)“察言觀色”的類人化交互與復雜任務理解。平臺以軟硬一體的形態(tài),面向機器人廠商、個人開發(fā)者等提供標準化AI能力集成方案,成為500家機器人客戶的共同選擇,助力機器人“聽得清、看得懂”。
同時,提供覆蓋多類機器人形態(tài)的專業(yè)交互解決方案:比如面向人形機器人,采用“前四后四+正前方多模態(tài)”陣列,精準捕捉用戶指令;面向四足機器人,通過定制降噪模組,適應復雜地形;面向輪足機器人,搭載環(huán)形6+1麥克風,實現(xiàn)360°聲源定位。結(jié)構(gòu)貼合,加速智能機器人產(chǎn)品落地。聚焦三大關(guān)鍵能力提升,機器人超腦平臺煥新升級:多人多模態(tài)交互:傳統(tǒng)機器人常因環(huán)境噪音或多人同時指令陷入混亂,而超腦平臺通過融合語音、情緒、行為等多維信息,將環(huán)境感知準確率提升至92%。全離線交互套件:在安全敏感的工業(yè)場景,端側(cè)部署的大模型支持離線指令控制與對話,確保無網(wǎng)絡環(huán)境下的可靠響應。敏捷部署方案:“即插即用”的智能語音背包,無需改造硬件本體即可賦予機器人語音交互能力,打通運動控制與業(yè)務邏輯。在訊飛開放平臺產(chǎn)品經(jīng)理丁瑞與宇樹機器人的聯(lián)袂演示中,搭載智能語音背包的G1不僅精準完成賽博太極拳等高難度動作,還展示了彩虹屁生成、撩妹小心機等高階社交技能,從沉默的硬件“秒變”社交達人,展現(xiàn)類人化交互魅力。
同時,具身智能訓練一體機以“采訓推一體化”賦能垂直場景:通過高質(zhì)量數(shù)據(jù)采集與多場景適配,助力物流、倉儲機器人突破“最后一公里”任務拆解瓶頸,復雜任務執(zhí)行成功率超95%。國內(nèi)大多數(shù)智能交互機器人廠商已采用了機器人超腦平臺的軟硬件一體化解決方案。未來,平臺將持續(xù)挑戰(zhàn)具身智能的深水區(qū)——讓機器人不僅“聽懂指令”,更能“主動思考”,以類人級領悟力成為人類的伙伴。正如“訊飛超腦2030計劃”的愿景:懂知識、善學習、能進化,讓機器人走進每個家庭。
03
打造聰明靈動的數(shù)字分身
憑借全棧式虛擬數(shù)字產(chǎn)品和服務,訊飛虛擬人交互平臺已深度賦能媒體、教育、文旅、金融、政務等千行百業(yè),并斬獲信通院L5等級認證。依托業(yè)界領先的多模態(tài)感知與生成技術(shù),平臺實現(xiàn)了數(shù)字人構(gòu)建的"極簡革命":用戶僅需一句話復刻聲音、一張圖生成數(shù)字分身,即可在82種語言場景中構(gòu)建專屬虛擬形象。這種"分鐘級"創(chuàng)建能力徹底打破了技術(shù)壁壘,推動數(shù)字人應用從企業(yè)專屬走向大眾普及。截至目前,平臺已積累超100萬的聲音復刻用戶,超10萬的數(shù)字分身資產(chǎn),真正實現(xiàn)"每人皆可擁有數(shù)字分身"的愿景。發(fā)布會現(xiàn)場,科大訊飛開放平臺總經(jīng)理趙艷軍通過照片與語音生成的數(shù)字分身“小趙”,無縫接管了后續(xù)演示,不會忘詞、不會結(jié)巴、不用學就會多門外語,讓人親身體會了數(shù)字分身的神奇與高效。
為突破傳統(tǒng)數(shù)字人固守屏幕的局限,訊飛平臺發(fā)布移動數(shù)字人解決方案,實現(xiàn)“能說、會動、可感知”的真實互動體驗。在現(xiàn)場演示中,訊飛開放平臺產(chǎn)品經(jīng)理儲佳杞一句話召喚出數(shù)字人“小雨”現(xiàn)身點評發(fā)布會。當被問及“發(fā)布會最大亮點是誰”時,TA風趣回應:“當然是形象出眾、能說會動的本尊我啦!”引發(fā)現(xiàn)場笑聲不斷。面對嘉賓的隨機提問,小雨也展現(xiàn)出流暢自然的對話能力,互動氛圍十足。
該方案以帶移動底座的55寸OLED透明屏為載體,呈現(xiàn)具備高還原度的擬人形象。通過360°聲學定位與多模態(tài)交互技術(shù),系統(tǒng)可精準識別觀眾位置與指令來源;結(jié)合星火大模型與定制知識庫,實現(xiàn)上下文語義理解與智能應答。全流程支持一站式播控與部署,目前已在博物館、營業(yè)廳等場景成功落地,憑借自由移動與沉浸式交互,為公眾導覽和品牌體驗帶來全新升級。當數(shù)字分身開始流暢播報PPT、移動導覽員能自主規(guī)劃路線并與觀眾實時互動時,我們看到的不僅是技術(shù)參數(shù)的提升,更是人工智能向"以人為本"的實質(zhì)性跨越。未來,平臺將持續(xù)深化多模態(tài)認知智能,讓數(shù)字人從工具進化為真正的"智能伙伴",助力千行百業(yè)開啟數(shù)智化新篇章。
04
深度定制你的AI應用
星辰開發(fā)平臺「專業(yè)升級」
隨著大模型進入深度推理時代,模型自主規(guī)劃使用工具能力得到極大提升。在復雜任務拆解、多工具協(xié)同領域,AI Agent正展現(xiàn)出類人的認知決策和任務處理水平。訊飛星辰Agent開發(fā)平臺以開放技術(shù)底座與一站式定制能力,正加速開發(fā)者高效創(chuàng)新。星辰Agent開發(fā)平臺已接入“星火、DeepSeek、Qwen、Llama”等主流大模型,支持企業(yè)靈活調(diào)用自有模型或第三方能力,通過一鍵切換與對比調(diào)試,徹底打破模型選型的“黑箱”困境。以智能效果測評為例,傳統(tǒng)開發(fā)中Prompt設計依賴經(jīng)驗試錯、模型選型缺乏量化依據(jù)的痛點,被“三模同臺競技”的評測模式精準化解——開發(fā)者可直觀對比不同模型在相同任務下的表現(xiàn)差異,快速定位最優(yōu)方案,將試錯成本轉(zhuǎn)化為數(shù)據(jù)驅(qū)動的決策效率?!巴该骰惫ぞ哝溤O計,提升智能體構(gòu)建質(zhì)量,并讓企業(yè)得以享受“高可用、低成本”大模型服務。深圳作為外貿(mào)第一城,報關(guān)是必不可少的業(yè)務,像這樣相對復雜的流程任務以往需要專門獨立開發(fā)。訊飛開放平臺產(chǎn)品經(jīng)理丁瑞現(xiàn)場演示了基于星辰Agent開發(fā)平臺,個人開發(fā)者僅需選擇預置模板并輸入場景化Prompt,即可快速構(gòu)建報關(guān)單識別Agent的全流程。不僅可以識別版面信息,還能對上下文進行整體理解,并進行形式規(guī)范的輸出。
面向企業(yè)級需求,星辰Agent專業(yè)版的推出進一步彰顯訊飛對產(chǎn)業(yè)痛點的回應。通過擴容資源池、強化高階功能,平臺為企業(yè)提供從用量保障到定制化服務的全鏈路支持。尤其在模型與Prompt的協(xié)同優(yōu)化上,專業(yè)版通過結(jié)構(gòu)化數(shù)據(jù)反饋與效果追蹤,將原本模糊的“經(jīng)驗主義”升級為可量化的科學流程。若說Agent平臺解決了“智能體如何高效構(gòu)建”的問題,星辰MaaS平臺則聚焦于“模型如何貼合場景需求”。面對通用大模型在垂直領域的“水土不服”,星辰MaaS平臺通過一站式精調(diào)工具鏈,將行業(yè)數(shù)據(jù)轉(zhuǎn)化為專屬模型的核心競爭力。從集成星火、DeepSeek等多元模型,到提供國產(chǎn)化算力支撐的99.97%服務穩(wěn)定性,平臺不僅降低微調(diào)門檻,更以全生命周期管理確保模型從訓練到推理的無縫銜接。這種“即用即銷”的自主托管模式,讓中小企業(yè)也能擁有媲美大廠的模型迭代能力,讓再小的場景需求也能擁有專屬模型服務。
星辰系列開發(fā)平臺的深層邏輯,是通過MaaS與Agent的協(xié)同,打造“模型精調(diào)-智能體開發(fā)-場景落地”的閉環(huán)生態(tài)。開發(fā)者可基于MaaS訓練垂直模型,轉(zhuǎn)而通過Agent平臺快速封裝為智能體,最終在星辰生態(tài)中完成從技術(shù)到產(chǎn)品的轉(zhuǎn)化。這種“雙輪驅(qū)動”的模式,既滿足了企業(yè)對模型可控性的需求,又保留了智能體的靈活擴展空間,為千行百業(yè)的數(shù)字化升級提供了“乘數(shù)效應”?;赝?023年,訊飛星火助手平臺作為國內(nèi)首批類Agent平臺的探索者,已悄然鋪就星辰生態(tài)的基石。如今,超30萬專業(yè)開發(fā)者的積累,印證了“讓每個人構(gòu)建AI應用”的初心。站在大模型規(guī)?;涞氐墓拯c,訊飛星辰平臺正以開放姿態(tài)串聯(lián)技術(shù)與場景,讓AI應用開發(fā)從“少數(shù)派游戲”變?yōu)椤按蟊妱?chuàng)新”的新范式。
05
十大標桿場景應用方案
為每個人帶來「效能升級」
在人工智能加速重構(gòu)工作模式的當下,科大訊飛以大模型技術(shù)為基座,深度布局辦公、人力資源與企業(yè)數(shù)字化等核心場景,助力企業(yè)與機構(gòu)實現(xiàn)效率躍升與智能化轉(zhuǎn)型。
從內(nèi)容創(chuàng)作到會議紀要,職場辦公更高效
升級后的訊飛智文從PPT工具拓展為智能文檔平臺,支持多類型文檔生成與協(xié)同編輯,結(jié)合AI圖表、文生圖等功能,成為央國企私有化首選。
訊飛繪文基于大模型+RPA技術(shù),為180萬創(chuàng)作者提供“選題→配圖→成文→發(fā)布”一站式智能服務。打造“智能+專業(yè)”的創(chuàng)作新范式,讓內(nèi)容生產(chǎn)更高效、更優(yōu)質(zhì)。星火紀要則依托語音轉(zhuǎn)寫與大模型技術(shù),實現(xiàn)會議全流程智能化:會前材料預審提升識別精度,會中多語種實時轉(zhuǎn)寫準確率超98%,會后自動生成合理度達90%的紀要,徹底解放人工整理負擔。而訊飛繪鏡通過端到端視頻生成能力,整合TTS、音樂素材與多模型優(yōu)勢,將創(chuàng)意一鍵轉(zhuǎn)化為視覺影像,為營銷、培訓等場景提供高效支持。
從招聘初篩到崗位培訓,選才育才更精準
訊飛智聘通過簡歷解析、AI面試與可視化報告,幫助企業(yè)節(jié)省80%初篩成本,其基于歷史數(shù)據(jù)的勝任力模型構(gòu)建能力,顯著提升選才精準度。面向一線崗位培訓的星火陪練,則以5分鐘快速搭建訓練路徑、96%對練準確率的優(yōu)勢,覆蓋汽車、保險等行業(yè)每年超千萬次的實戰(zhàn)演練。通過模擬場景對話與立體化多維分析,顯著提升培訓效果,同時大幅降低培訓成本。
從招投標到展廳講解,加速企業(yè)數(shù)字化
招投標大模型針對千頁級標書文件,實現(xiàn)初稿生成與智能評標,覆蓋度達99%,錯漏減少87%,已在多家央國企落地。星火知識庫基于RAG技術(shù)與大模型推理能力,實現(xiàn)多模文檔解析、知識溯源與深度問答,檢索效率提升200%,復雜問題準確率達85%,為客服、營銷等場景提供決策支持。星火快答則通過虛擬人與多模態(tài)交互,打造展廳智能講解方案,以科技感體驗重塑企業(yè)展示場景。
從行業(yè)深耕到社會賦能,人工智能全域覆蓋
除核心場景外,訊飛技術(shù)持續(xù)輻射更廣泛領域:門店營銷專家通過軟硬件協(xié)同激活線下銷售體系,政務專員覆蓋咨詢、預審全流程提升辦事效率,AI導游與數(shù)字人在文旅場景推動文化傳承,而公共服務領域的透明屏2.0與軌道交通大模型,則以跨語言交互與自動化服務優(yōu)化公共體驗。
06
科幻感爆棚的智能交互展區(qū),訊飛及生態(tài)伙伴攜100+新品驚喜亮相,覆蓋智能穿戴、人形機器人、機械臂、數(shù)字人及AI+娛樂/醫(yī)療/工業(yè)等全場景。在這里,理療機器人可為你“望聞問切”,AI眼鏡輕松實現(xiàn)聽歌聊天、跨國無障礙對話,電視因一句話自動播放節(jié)目,浴室鏡化身燈光管家——交互不止于“能用”,更追求“好用”與“悅己”,可謂一步一驚奇。
當觀眾還沉浸于展區(qū)體驗時,隔壁的「60分鐘極速挑戰(zhàn):喚醒開發(fā)板“童芯大腦”」競技正酣。作為發(fā)布會兒童方案的延伸實踐,選手依托星辰Agent開發(fā)平臺,在極短時間內(nèi)構(gòu)建出具備情緒識別與童趣對話能力的兒童交互Agent,為硬件注入智慧人格。最終,比亞迪電子(國際)有限公司湯院以“兒童聊天多功能助手”摘得桂冠。更大的創(chuàng)新舞臺同步開啟:2025科大訊飛AI開發(fā)者大賽正式啟航!本屆賽事覆蓋36道應用賽與72道算法賽,特設智能座艙交互評測、多模態(tài)虛擬人對話等前沿賽道,以開放的生態(tài)與前沿的賽題,推動人工智能新生代的成長。向新而行,攀登不止!26年堅持人工智能源頭技術(shù)創(chuàng)新,訊飛建成168個語種機器翻譯、60+語種語音交互的技術(shù)長城。通過“星火+硬件+場景”智能交互閉環(huán)生態(tài),將多語種AI透明屏、星火快答等創(chuàng)新成果推向海外,推動中國智造融入全球數(shù)字化轉(zhuǎn)型浪潮。
頂天立地的技術(shù)信仰,持續(xù)引領交互的浪潮。開放共享的生態(tài)理念,讓機器“理解”每一次傾訴,讓AI傳遞每一份溫度。
交互領航,智啟新章。讓我們共同邁進智能交互的新時代!