ディープラーニングに基づく音聲認(rèn)識(shí)技術(shù)
お問(wèn)い合わせ
音響特性から、音聲は言語(yǔ)音、音楽、環(huán)境音の三つに分類されます。
現(xiàn)在主流の音聲認(rèn)識(shí)や聲紋認(rèn)識(shí)技術(shù)は音聲信號(hào)処理に向けたものであり、技術(shù)は比較的成熟しています。
PFU上海グループは長(zhǎng)い間、環(huán)境音のAI認(rèn)識(shí)技術(shù)研究開(kāi)発に取り組んでいます。
特定の音を判別したい応用シーンに対しては、事前に音サンプルを採(cǎi)取して、AIのディープラーニングとトレーニングを行い、
AI環(huán)境音認(rèn)識(shí)エンジンに自ら學(xué)習(xí)させ、最終的には実際の現(xiàn)場(chǎng)で、特定種類の音を認(rèn)識(shí)し、選別することができます。
人工知能の國(guó)際的権威コンテストであるDCASE 2018で総合優(yōu)勝したことがあります(音聲認(rèn)識(shí)領(lǐng)域)。
複雑な環(huán)境の音を判別し分類することができます。
(あらかじめ判別した音聲を?qū)W習(xí)しておく必要があり、1つの音聲につき約200個(gè)の音聲サンプルが必要となります。)
【DCASE2018 Task4 世界1位】
異常音検知
異音を起こすことが難しい場(chǎng)合に、
正常時(shí)の音を?qū)W習(xí)させる事で「普段と異なる音」を検知する技術(shù)です。
【DCASE2020 Task2 世界第6位】
道路の安全と密接に関連する3つの音聲をAI認(rèn)識(shí)します。
音聲のAI認(rèn)識(shí)と映像監(jiān)視による畫像解析を組み合わせ、
従來(lái)の畫像認(rèn)識(shí)だけでは解決できなかった課題を解決します。
以上の六つの機(jī)械音に異常音が含まれるかどうかを予測(cè)し、
計(jì)測(cè)技術(shù)は実際の現(xiàn)場(chǎng)業(yè)務(wù)への適用性が高いです!
ディープラーニングに基づく音聲認(rèn)識(shí)技術(shù)
お問(wèn)い合わせ