欧美精品v国产精品v_少妇被粗大的猛进出69影院_捆绑女初捆绑戴上口球调教_小蝌蚪app无限观看污

科大訊飛發(fā)布星火語音同傳大模型,端到端同傳媲美人類專業(yè)譯員

Connor 歐意交易所 2025-01-17 33 0

近日來,社交平臺上的英語密集程度遠超以往,大量TikTok創(chuàng)作者蜂擁進入國內(nèi)的社交App。隨便打開軟件首頁,一個個全是英文內(nèi)容。不少外國人還總是喜歡“懟臉自拍”,舉著手機就是一串英文,讓當下熱衷于網(wǎng)上沖浪的年輕人驚呼,玩手機也成了練習英語聽力。

當下機器翻譯技術的進步,已經(jīng)可以讓不同語言的人們進行交流。但這種交流遠稱不上是流暢。比如,市面上流行的機器翻譯大多數(shù)還是交傳技術,很難實現(xiàn)真正端到端的語音同傳。也就是說,簡單的文字溝通或許還可以借助簡單的翻譯機器來解決,但要無障礙地與外國友人視頻連線、語音通話,當下的機器翻譯還不太能支持。

過去兩年大模型技術的進步讓機器翻譯有了突破口。1月15日,科大訊飛對外發(fā)布了星火語音同傳大模型。這是國內(nèi)首個具備到端到端語音同傳能力的大模型,將機器語音同傳的效果提升至媲美人類專家譯員的水平。

科大訊飛發(fā)布星火語音同傳大模型,端到端同傳媲美人類專業(yè)譯員

和過去慣常采用交傳技術的機器翻譯相比,擁有端到端能力的語音同傳大模型最大的特點是變得“更像人類”了。事實上,它本身就是通過模仿人類同傳譯員的思維鏈路進行訓練而成,具備實時意群理解和切分、上下文語境精準選詞以及碎片化信息重組的能力,這一特性使得星火語音同傳大模型在處理復雜句式和語境時表現(xiàn)出色,能夠迅速準確地傳達原意。

發(fā)布會上,上海外國語大學高級翻譯院院長張愛玲教授專門介紹了過去機器翻譯在同傳領域面臨的問題。比如同傳時延,機器翻譯的速度往往跟不上說話者的語速,翻譯存在較大延遲。

科大訊飛發(fā)布星火語音同傳大模型,端到端同傳媲美人類專業(yè)譯員

展開全文

更關鍵的還在于人類口語交流的復雜性。張愛玲教授介紹,源語發(fā)言,往往會邏輯復雜、層層嵌套,口譯員必須具備超高的信息提取能力,才能在繁雜的線索中鎖定關鍵信息,確保信息的完整和可靠。不同語言的表達方式、音節(jié)長度也不一樣。如果只是機械式地照搬原意,往往無法流暢地跟上口譯速度。

科大訊飛發(fā)布星火語音同傳大模型,端到端同傳媲美人類專業(yè)譯員

也正因此,雖然過去幾年機器翻譯普及迅速,但在同傳領域,機器翻譯相較于人類專業(yè)口譯員仍有不少劣勢。

訊飛研究院研究員亞楠介紹,訊飛10年前就想去做語音同傳,但當時技術難度太大。直到過去兩年大模型技術的突破,他們結(jié)合訊飛在智能語音技術上的獨特算法積累,才終于實現(xiàn)了端到端的語音同傳。

底層技術的不同,讓星火語音同傳大模型實現(xiàn)了對傳統(tǒng)機器翻譯的降維打擊。據(jù)介紹,相較訊飛之前的翻譯技術,星火語音同傳大模型的全場景效果提升30%以上,端到端響應時間最快可以達到平均5s以內(nèi)。和國外最優(yōu)競品的交傳技術相比,訊飛語音同傳在內(nèi)容完整度、信息準確度以及語言質(zhì)量上也都處于領先水平。

不過,如果你只是想當然地認為,在大模型技術的加持下,其他廠商也能實現(xiàn)端到端語音同傳的突破,這就完全低估了智能翻譯的難度。

科大訊飛專門將星火語音同傳大模型與國外的主流大模型進行了對比測試,在長達5H的音視頻測試中,8s時延模式在內(nèi)容完整度、信息準確度等評價維度超過了Gemini2.0、GPT-4o等國外主流大模型。

這背后,離不開科大訊飛多年來的積累。事實上,科大訊飛是國內(nèi)智能翻譯及語音識別領域積累最深、研究時間最長的龍頭企業(yè)。科大訊飛不僅擁有在業(yè)內(nèi)率先通過全國翻譯專業(yè)資格考試的機器翻譯系統(tǒng),且在最近連續(xù)3屆IWSLT國際口語機器翻譯比賽都獲得了冠軍。

和大模型浪潮來臨前各家廠商尚處在同一起跑線上不同,語音識別與翻譯技術更是考驗技術積累與應用經(jīng)驗的領域。

在技術上,科大訊飛多年來圍繞語音及翻譯取得了多項核心專利技術突破,曾多次獲得國家科學技術進步獎一等獎、中國專利金獎等多項榮譽。目前,科大訊飛已累計獲得國內(nèi)外有效專利4000余件。

科大訊飛發(fā)布星火語音同傳大模型,端到端同傳媲美人類專業(yè)譯員

應用層面,國內(nèi)外諸多行業(yè)論壇、國際會議中都有訊飛翻譯的身影,包括進博會、世界人工智能大會、中關村論壇、聯(lián)合國教科文會議等。迄今為止,科大訊飛已累計服務了50多個國家和地區(qū),支撐了40萬場會議,覆蓋全球4億觀眾。

正是這些多年來在語音識別與智能翻譯領域的積累與探索,才讓科大訊飛在大模型技術加持下率先突破了端到端語音同傳的難題。這是其他大模型廠商難以做到,同時也幾乎無法追趕的核心技術突破。

科大訊飛發(fā)布星火語音同傳大模型,端到端同傳媲美人類專業(yè)譯員

更關鍵的是,自然語言交互已成為當下AI智能體應用最廣的交互方式,未來人類與機器的互動將更多的依靠語音進行,科大訊飛過去多年積累的深厚技術有望在人工智能時代進一步釋放。

發(fā)布會上,科大訊飛同時介紹了集成了最新同傳技術的訊飛翻譯機。無論是海外旅游場景中的景點介紹,還是國際展會上的專業(yè)產(chǎn)品介紹,翻譯機能在短時間內(nèi)完成高質(zhì)量的英到中和中到英的雙向同傳任務。

科大訊飛透露,針對語音到語音的同傳場景,訊飛翻譯機將會配置耳機、音箱、麥克風,在2025年推出商務套裝,滿足用戶在不同的商務洽談場景的使用需求。

評論