神經計算泛指應用人工神經網絡(ANN, Artificial Neural Network)進行的各種智能計算,它能體現人的某些智能特性。 ANN的模型本身就是模擬人腦自身生物神經元及其連接而構造的。盡管由于計算機計算能力至今還不足以完成像人腦(1. 000億左右神經細胞)那樣復奈神經網絡的學習和計算,但它所表現出的能力和潛力已被大家所認同,并在各行各業中大顯身手。其實ANN也是由若干單個神經元互連而成的。每個神經元可以由數學模型模擬。
我們可以把它看成一種映射關系,當一個音頻特征輸入時,通過神經連接強度和激活函數門拘運算來決定這個神經元是否被激活。如果被激活,它就向與它連接的其他神經元發出刺激信號,相反就發出抑制信號。那么復雜一點的網絡。
這里就出現了4個神經元,它們共同形成網絡,對輸入的信號作出反應。于是,所謂的學習就是當某些共性的輸入反復出現時,我們讓ANN給出一個穩定的輸出,代表它對這一組共性輸入已經有所掌握,學術上可以把這稱作聚類分析。
人工神經網絡模型已被應用在語音技術的許多方面。筆者考慮到ANN的統計特性、魯棒性、學習能力、非線性映射能力,所以決定用它來分析一個特定人的聲紋信息,找到和發現其聲紋。
聲紋識別一個特定人需要找到特定人的一組聲紋參數,并且是在開集條件下、限定文本。首先從電視上采錄下一個特定人的音頻波形,,然后進行參數提取,采用240點的分幀,計算基頻及其16階LPCC譜參數,然后把有效的LPCC參數畫出來。
可見特定人的聲紋在這一段采樣中是穩定的。但是哪一個才能真正代表特定人而非他人呢?這里還需要做一些統計和聚類的工作,我們采用ANN技術,用2x2的SOFM(Self Organizing Feature Map)神經網分析過后發現了一種聲紋模式,可以代表特定人的特征,這種特征使得特定人說話時學習過這一特征的神經元十分活躍,于是就把這條線所代表的參數定義為特定人的聲紋。
以后要判定某一種聲音是否是所說的特定人的聲音,用此聲紋模式做比對就可以做出判斷。
根據不同的需要,如何提取有效的研究對象的聲紋、怎樣提取、如何保證準確性、如何處理與去除不相關干擾等都是聲紋識別研究中的難題。另外,聲紋不只是指人的語音特征,它可以是任何物體發出的可聞或不可聞的信號,這就如同海豚可以發出、聽見并且辨認幾海里之外的魚群一樣,因此它的應用領域和前景不可預估。
但是在目前來說聲紋識別技術的應用還達不到一種理想的狀態,因為人有時候感冒,咽喉發炎等一些癥狀可能會使聲音發生變化。在生物識別這個領域中指紋識別技術技術暫時起到一個的作用,經過多年的發展,指紋門禁考勤一體機,指紋門禁一體機,在一些寫字樓到處可見。
下一篇:RFID手持終端要怎么選擇
全年征稿/資訊合作
聯系郵箱:1271141964@qq.com
免責聲明
- 凡本網注明"來源:智能制造網"的所有作品,版權均屬于智能制造網,轉載請必須注明智能制造網,http://zhyifutang.com。違反者本網將追究相關法律責任。
- 企業發布的公司新聞、技術文章、資料下載等內容,如涉及侵權、違規遭投訴的,一律由發布企業自行承擔責任,本網有權刪除內容并追溯責任。
- 本網轉載并注明自其它來源的作品,目的在于傳遞更多信息,并不代表本網贊同其觀點或證實其內容的真實性,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網注明的作品來源,并自負版權等法律責任。
- 如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。
2025成都國際無人系統(機)技術及設備展覽會
展會城市:成都市展會時間:2025-10-10