百度大腦在北京舉行語音能力引擎論壇。百度語音首席架構師賈磊正式提出基于復數CNN網絡的語音增強和語音識別一體化端到端建模技術,該方法拋棄了數字信號處理學科和語音識別學科的各種先驗假設,消除學科間壁壘,直接端到端進行一體化建模。相較于傳統基于數字信號處理的麥克陣列算法,錯誤率降低超過30%。
據悉,這項技術無需任何數字信號處理和語音識別學科的先驗假設,復數CNN網絡內存占用少于200K,可以內置到百度鴻鵠芯片內部。利用進場數據和純粹依靠仿真數據,就可以獲得足量的遠場訓練數據,整個過程是icing原始多麥克信號到識別文字的一個端到端訓練,整個優化過程只有字錯誤率兩集一個優化準則。
百度從2012年起就開始把深度學習用于中文語音搜索,成為全世界最早把深度學習技術落地工業化產品的企業之一。百度大腦目前已開放了云、端、芯包含語音識別、語音合成等全棧語音引擎能力,并廣泛應用于金融、政務、文娛等多種行業和場景。
百度AI技術生態部總經理喻友平表示,百度大腦語音能力引擎的應用規模已達到業界第一,同時一直在積極拓展語音能力引擎生態鏈的建設。
隨著人們生活水平的提高及對家居環境要求的提升,智能家居產品正逐漸從奢侈品轉變為日常生活中的...
工業和信息化部、交通運輸部、住房和城鄉建設部、公安部、自然資源部聯合發布了智能網聯汽車“車...
陳宗年,中國電子科技集團有限公司中電海康集團有限公司董事長、黨委書記。在他的帶領下, 海康...
2024福布斯中國科創人物評選結果重磅發布,本次榜單主要聚焦深耕于人工智能、高端制造等科創...
AI大模型有哪些?據了解,我國已備案的大模型包括百度的“文心一言”、智譜AI的“GLM大模...
劉慶峰,科大訊飛董事長。他是中國智能語音與人工智能產業化的先行者,帶領科大訊飛扭轉了中文語...