Hanwha-Vision-LOGO

Uainishaji wa Sauti wa Hanwha SPS-A100M AI na Utambuzi wa Mwelekeo wa Sauti

Hanwha-Vision-SPS-A100M-AI-Uainishaji-Sauti-na-Ugunduzi-Mwelekeo-Sauti-PRODUCT

Utangulizi

Sauti mara nyingi hupuuzwa lakini chombo chenye nguvu cha ufuatiliaji huku kukiwa na vitisho visivyoonekana. Ingawa mifumo ya kawaida ya ufuatiliaji wa video imelenga katika kunasa kile kinachotokea, mazingira ya usalama ya leo yamebadilika ili kutambua sio tu aina za matukio ya sauti lakini pia vyanzo vyake haswa. Kadiri mipaka ya usalama wa umma na ulinzi wa mali inavyopanuka, teknolojia ya uchanganuzi wa sauti ina uwezo wa kuchangia zaidi ya usaidizi rahisi katika kuzuia uhalifu na kukabiliana na matukio ya haraka.
Katika muktadha huu, teknolojia ya Uainishaji wa Sauti ya Hanwha Vision yenye ujifunzaji wa kina hutoa vitendaji vya akili ambavyo vinatambua kwa usahihi matukio mahususi ya sauti—kama vile mayowe yaliyofundishwa awali na kuvunja vioo—kuanzisha arifa za papo hapo. Zaidi ya hayo, teknolojia ya Utambuzi wa Mwelekeo wa Sauti hutambua eneo la chanzo cha sauti, ikitoa taarifa muhimu kuhusu si tu 'sauti ni nini' bali pia 'mahali ambapo sauti ilitoka.' Teknolojia hizi mbili hufanya kazi kwa ushirikiano ili kuongeza uwezo jumuishi wa ufahamu wa hali, kuweka alama mpya ya mifumo ya usalama ya kizazi kijacho.
Karatasi hii nyeupe inaangazia teknolojia hizi, ikitoa mwongozo wa vitendo kwa utekelezaji bora na matumizi katika mazingira tofauti.

Teknolojia ya Uchambuzi wa Sauti inayotegemea AI

  1. Uainishaji wa Sauti
    Teknolojia ya Uainishaji wa Sauti ya Maono ya Hanwha imejengwa juu ya modeli kuu ya kujifunza kwa kina: Mtandao wa Neural Convolutional (CNN). Teknolojia hii huanza kwa kubadilisha taarifa za sauti dhahania kuwa namna ya kuona inayojulikana kama spectrogram1.
    Sspectrogramu hufanya kama "alama ya vidole" ya akustisk, ikionyesha kwa uwazi muundo wa kipekee wa sauti mahususi. CNN hufaulu katika kujifunza na kutambua kiotomatiki vipengele na mifumo fiche ya akustika ndani ya picha hizi za spectrogramu ambazo mara nyingi ni vigumu kwa sikio la binadamu kuzitofautisha. Utaratibu huu huwezesha utambuzi sahihi na uainishaji wa matukio mbalimbali ya sauti, ikiwa ni pamoja na kupiga kelele, kuvunja vioo, honi za gari na kuteleza kwa matairi.
    Mara sauti inapotambuliwa na kuainishwa, mfumo hutoa data kiotomatiki kutoka kwa mtiririko wa sauti. Kwa kuwa data ya sauti tayari imechakatwa na sampikiongozwa, sauti iliyoainishwa inatolewa kama klipu ya sauti file, kamili na metadata kwa upakuaji rahisi na upyaview.
    Teknolojia hii inapatikana kwenye bidhaa teule za Hanwha Vision.
  2. Utambuzi wa Mwelekeo wa Sauti
    Teknolojia ya Kutambua Mwelekeo wa Sauti ya Hanwha Vision inasaidia jibu la haraka kwa kutambua na kuwafahamisha watumiaji mwelekeo wa tukio maalum la sauti. Teknolojia huamua mwelekeo huu kwa kupima Tofauti ya Wakati wa Kuwasili
    (TDoA) ya mawimbi ya sauti inapofikia maikrofoni nyingi, zilizotenganishwa kimwili.
    Algorithm ya TDoA hufanya kazi kwa kuchanganua tofauti ya awamu katika muda inachukua kwa sauti kufikia kila kipaza sauti, na hivyo kukadiria umbali halisi wa chanzo. Taarifa hii kisha hutumika kukokotoa pembe ya chanzo cha sauti. Kama inavyoonyeshwa kwenye Mchoro 1, mfumo wa maikrofoni nyingi wenye maikrofoni (MIC1,MIC2,MIC3,MIC4) uliopangwa katika mduara unaweza kubainisha tofauti za umbali (d1,d2,d3,d4) kati ya chanzo cha sauti na kila kipaza sauti. Kukokotoa tofauti ya saa ya kuwasili kulingana na tofauti hizi za umbali ndio msingi wa algoriti ya TDoA.

2.1. Uainishaji wa Sauti Teknolojia ya Uainishaji wa Sauti ya Maono ya Hanwha imejengwa juu ya modeli kuu ya kujifunza kwa kina: Mtandao wa Neural Convolutional (CNN). Teknolojia hii huanza kwa kubadilisha taarifa za sauti dhahania kuwa namna ya kuona inayojulikana kama spectrogram1. Sspectrogramu hufanya kama "alama ya vidole" ya akustisk, ikionyesha kwa uwazi mifumo ya kipekee ya sauti mahususi. CNN hufaulu katika kujifunza na kutambua kiotomatiki vipengele na mifumo fiche ya akustika ndani ya picha hizi za spectrogramu ambazo mara nyingi ni vigumu kwa sikio la binadamu kuzitofautisha. Utaratibu huu huwezesha utambuzi sahihi na uainishaji wa matukio mbalimbali ya sauti, ikiwa ni pamoja na kupiga kelele, kuvunja vioo, honi za gari na kuteleza kwa matairi. Mara sauti inapotambuliwa na kuainishwa, mfumo hutoa data kiotomatiki kutoka kwa mtiririko wa sauti. Kwa kuwa data ya sauti tayari imechakatwa na sampikiongozwa, sauti iliyoainishwa inatolewa kama klipu ya sauti file, kamili na metadata kwa upakuaji rahisi na upyaview. Teknolojia hii inapatikana kwenye bidhaa teule za Hanwha Vision. 2.2. Teknolojia ya Utambuzi wa Mwelekeo wa Sauti ya Maono ya Hanwha ya Kutambua Mwelekeo wa Sauti inasaidia jibu la haraka kwa kutambua na kuwaarifu watumiaji mwelekeo wa tukio maalum la sauti. Teknolojia huamua mwelekeo huu kwa kupima Tofauti ya Wakati wa Kuwasili (TDoA) ya mawimbi ya sauti inapofikia maikrofoni nyingi zilizotenganishwa kimwili. Algorithm ya TDoA hufanya kazi kwa kuchanganua tofauti ya awamu katika muda inachukua kwa sauti kufikia kila kipaza sauti, na hivyo kukadiria umbali halisi wa chanzo. Taarifa hii kisha hutumika kukokotoa pembe ya chanzo cha sauti. Kama inavyoonyeshwa kwenye Mchoro 1, mfumo wa maikrofoni nyingi wenye maikrofoni (MIC1,MIC2,MIC3,MIC4) uliopangwa katika mduara unaweza kubainisha tofauti za umbali (d1,d2,d3,d4) kati ya chanzo cha sauti na kila kipaza sauti. Kukokotoa tofauti ya saa ya kuwasili kulingana na tofauti hizi za umbali ndio msingi wa algoriti ya TDoA.Kielelezo cha 2 kinaonyesha tofauti ya wakati (τij) katika kuwasili kwa ishara ya sauti kwenye maikrofoni mbili (mawimbi ya kahawia na bluu). Kwa kupima kwa usahihi tofauti hizi za wakati wa kuwasili, mfumo unaweza kugeuza kwa usahihi mwelekeo wa chanzo cha sauti. Hanwha-Vision-SPS-A100M-AI-Uainishaji-Sauti-na-Ugunduzi-Uelekeo-Sauti (3)

Mchakato wa kugundua mwelekeo wa sauti umegawanywa katika hatua kuu nne:

  1. Mkusanyiko wa Mawimbi: Kusanya mawimbi ya sauti kwa wakati mmoja kupitia maikrofoni nyingi.
  2. Uchakataji wa Mawimbi: Changanua mawimbi yaliyokusanywa kwa kutumia algoriti maalum.
  3. Ukadiriaji wa Mwelekeo: Kadiria mwelekeo wa sauti kulingana na mawimbi yaliyochakatwa.
  4. Pato la Matokeo: Onyesha mwelekeo wa mwisho uliotambuliwa kama pembe ya kuzaa.

Teknolojia hii inapatikana kwenye bidhaa za Hanwha Vision zinazotumia maikrofoni nyingi, kama vile Audio Beacon (SPS-A100M) na kamera fulani zenye vifaa vya Wisenet 9 SoC.

Hanwha-Vision-SPS-A100M-AI-Uainishaji-Sauti-na-Ugunduzi-Uelekeo-Sauti (4)

Ufungaji na Mazingira: Mwongozo wa Utendaji Bora

Ufanisi wa Suluhisho la Sauti la Hanwha Vision la AI linafungamana kwa karibu na mazingira yake ya usakinishaji. Kwa kuzingatia kikamilifu pointi zifuatazo, unaweza kuongeza uwezo wa mfumo na kuhakikisha utendaji thabiti.

Kuchagua Mahali Bora pa Kusakinisha
Kwa utendakazi unaotegemewa wa Uainishaji wa Sauti na Utambuaji Mwelekeo, masharti yafuatayo yanapendekezwa:
Uainishaji wa Sauti: Mfumo hufanya kazi kwa uhakika zaidi wakati umbali kati ya bidhaa na chanzo cha sauti ni angalau 2m. Umbali huu unategemea urefu wa chanzo cha sauti. Ikiwa umbali uko karibu sana (ndani ya 2m), hata sauti inayoonekana kuwa ya chini kabisa kama vile kupiga makofi inaweza kuwa kubwa kupita kiasi, na hivyo kusababisha matokeo chanya. Ufungaji wa dari katika mpangilio wa ndani ni njia bora ya uainishaji wa sauti kwani hupunguza uakisi wa akustisk na kuruhusu ugunduzi wa sauti sawa katika eneo zima.

Hanwha-Vision-SPS-A100M-AI-Uainishaji-Sauti-na-Ugunduzi-Uelekeo-Sauti (5)Utambuzi wa Mwelekeo wa Sauti: Kwa utambuzi sahihi wa mwelekeo, nafasi ya chini ya angalau 6.0m kwa upana na 6.0m urefu inapendekezwa. Hii inapunguza athari za uakisi wa sauti na urejeshaji na kuhakikisha nafasi ya kutosha ya uchanganuzi wa mawimbi kati ya maikrofoni nyingi. Hanwha-Vision-SPS-A100M-AI-Uainishaji-Sauti-na-Ugunduzi-Uelekeo-Sauti (6)

Kudumisha Umbali Sahihi na Pembe ya Tukio: Umbali na pembe kati ya chanzo cha sauti cha tukio na bidhaa ni muhimu kwa usahihi wa kutambua. Ikiwa pembe ya tukio la sauti ya tukio ni kubwa mno (inazidi 20 ∘) au umbali ni mfupi sana, usahihi wa kutambua unaweza kupungua. Jedwali hapa chini linatoa umbali wa chini unaopendekezwa kulingana na urefu wa usakinishaji wa bidhaa.

Urefu wa Ufungaji wa Bidhaa Umbali wa Chini wa Kugundua Mwelekeo
2.3m ≥ 2.2m
2.5m ≥ 2.7m
2.7m ≥ 3.3m
2.9m ≥ 3.8m
3.1m ≥ 4.4m
3.3m ≥ 4.9m
3.5m ≥ 5.5m
3.8m ≥ 6.3m
4m ≥ 6.9m
5m ≥ 9.6m

Kuhakikisha Njia Wazi ya Sauti: Vikwazo vya kimwili kama vile kuta, kioo, au mapazia mazito kati ya chanzo cha sauti na bidhaa vinaweza kudhoofisha au kupotosha mawimbi. Ili kufikia utendaji wa juu, hakikisha njia ya wazi, ya moja kwa moja ya sauti.

Uchambuzi wa Mazingira kwa Utambuzi na Uainishaji Bora wa Sauti
Kwa utambuzi sahihi na uainishaji wa sauti, zingatia hali zifuatazo za akustika na mambo yanayozunguka mazingira.

Aina ya Sauti Kiwango cha dB Umbali Uliotabiriwa
Kupiga kelele >70dB 2m ~ 20m
Kupasuka kwa glasi, Pembe za Gari, Kuteleza kwa Matairi >80dB 2m ~ 16m

Kwa mfanoample, sauti ya kupiga kelele inaweza kuainishwa kwa usahihi na kutambuliwa kwa mwelekeo wakati sauti yake iko juu ya 70dB. Sauti ya tukio lazima pia iwe kubwa zaidi kuliko kelele ya chinichini inayozunguka (inapendekezwa: angalau 30dB zaidi). Kwa kipimo na uainishaji sahihi, kelele ya chinichini haipaswi kuzidi 60dB, ambayo inahakikisha tofauti ya wazi kati ya tukio na kelele iliyoko.
Kwa kuwa kelele iliyoko inaweza kuathiri utendakazi, ni mazoezi mazuri kuchanganua yafuatayo mapema:

  • Mazingira ya Nje: Jihadharini na kelele za asili (upepo, mvua, ngurumo) na sauti za bandia (trafiki, athari, mitikisiko ya gari). Katika mazingira yasiyotabirika, uchambuzi wa kina unaweza kukusaidia kuchagua eneo bora la usakinishaji.
  • Mazingira ya Ndani: Miakisi ya sauti na urejeshaji sauti inaweza kuwa muhimu kulingana na nyenzo (kuta, dari, sakafu) na saizi ya chumba. Milio ambayo ni sawa na tukio lengwa, kama vile puto ikitokea au kisanduku kizito kikidondoshwa, zinaweza kusababisha urejesho unaopelekea kengele za uwongo. Ufungaji unapaswa kuzingatia mali ya acoustic ya nafasi ya ndani.

Inasanidi Vizingiti vya Uainishaji wa Sauti dB
Ili kuboresha kipengele cha Uainishaji wa Sauti, unaweza kusanidi kiwango cha juu cha dB ili kuendana na mazingira yako mahususi.

  • Katika mazingira yenye kelele, weka kizingiti juu zaidi ili kupunguza kengele za uwongo.
  • Katika mazingira tulivu ambapo matukio ni madogo, weka kizingiti chini ili kuepuka kukosa arifa muhimu.
  • Baada ya kuangalia wastani wa kelele ya chinichini dB, inashauriwa kuweka kizingiti angalau 55dB zaidi ya wastani huo.

Hanwha-Vision-SPS-A100M-AI-Uainishaji-Sauti-na-Ugunduzi-Uelekeo-Sauti (7)Kama inavyoonyeshwa kwenye Mchoro 6, kiwango cha juu cha dB kinaweza kurekebishwa kwa njia angavu kwa kutumia kitelezi au sehemu ya kuingiza nambari, na kuathiri moja kwa moja ugunduzi wa wakati halisi. Grafu inaonekana inawakilisha mabadiliko katika dB ya sauti baada ya muda (mstari mweusi) na kizingiti kilichosanidiwa (mstari wa kijivu), na kuifanya iwe rahisi kuona tukio la sauti (kilele cha machungwa) kinapozidi kizingiti.

Urekebishaji wa Mwelekeo wa Sauti na Usanidi wa Mfumo
Bidhaa za Hanwha Vision hutoa matukio kama klipu za sauti, zinazojumuisha uainishaji wa sauti na matokeo ya kutambua mwelekeo.

Hanwha-Vision-SPS-A100M-AI-Uainishaji-Sauti-na-Ugunduzi-Uelekeo-Sauti (1)Kama inavyoonyeshwa kwenye Mchoro wa 7, matokeo ya uainishaji wa sauti yanaonyeshwa kwa ikoni ya angavu chini, pamoja na matokeo ya kutambua mwelekeo wa sauti. 'Elekeo (N+301.8∘)' inamaanisha chanzo cha sauti kinapatikana 301.8∘ kisaa kutoka Kaskazini (N).
Thamani inayoandamana ya 'Confidence (0.74)' inaonyesha kiwango cha kujiamini cha 74%. Hii, pamoja na kiwango cha shinikizo la sauti (52dB), husaidia watumiaji kutathmini hali kwa usahihi na kujibu haraka.
Taarifa za mwelekeo wa sauti za mfumo zinaweza kupotoka kutoka Kaskazini mwa kweli baada ya muda au kutokana na usakinishaji. Kwa kuwa maelezo sahihi ya mwelekeo ni muhimu, ni muhimu kurekebisha sehemu ya marejeleo ya Kaskazini inavyohitajika. Hii inaweza kufanywa kwa kutumia moja ya njia tatu:

  1. Sakinisha bidhaa ili kukabili Kaskazini mwa kweli kama dira inavyoonyesha.
  2. Katika menyu ya bidhaa, nenda kwenye [Mfumo] > [Maelezo ya Bidhaa] > [Hali ya Kupachika] na uingize moja kwa moja pembe iliyopimwa kisaa kutoka kwa dira ya Kaskazini hadi sehemu ya marejeleo ya kamera.
  3. Tumia kipengele cha dira kilichojumuishwa kwenye zana ya Usakinishaji ya Wisenet kwa usanidi wa awali unaofaa zaidi na sahihi.

 Vidokezo vya Mazingira Changamano ya Kusikika

  • Mazingira Changamano ya Acoustic: Katika mazingira yenye sauti nyingi kwa wakati mmoja, muundo wa AI unaweza kuziainisha kama sauti moja au kuziweka vibaya. Hili ni jambo la asili; uchambuzi wa kina wa taarifa iliyotolewa na mfumo itasaidia kuhakikisha ufahamu sahihi wa hali.
    Uchambuzi wa Mazingira kwa Kengele Sahihi: Muundo wa uainishaji wa sauti unaweza kutoa kengele kwa sauti zinazofanana na sauti za matukio lakini haziko katika kategoria za uainishaji—kama vile msuguano wa vitu vya metali, miito ya wanyama, ala za muziki, au kelele nyingine za ghafla, zenye nguvu. Kuelewa tabia hii ya mfano inakuwezesha kutarajia na kujiandaa kwa kengele kutoka kwa sauti hizi za kipekee, kwa ufanisi kupunguza machafuko yasiyo ya lazima.

Hitimisho

Kwa kuvuka mipaka ya uchunguzi wa kuona, Suluhisho la Sauti la Hanwha Vision la AI huunda mfumo wa maonyo wa mapema wa kina ambao huchanganua sauti kwa akili.
Karatasi hii nyeupe hutumika kama mwongozo wa vitendo, kukuwezesha kutekeleza na kuboresha teknolojia kwa mazingira yako mahususi—kutoka usakinishaji wa awali hadi urekebishaji kwa utendakazi wa kilele.
Changamoto za usalama zinapoendelea kubadilika, Dira ya Hanwha inasalia kujitolea kuendeleza uwezo wake wa uchanganuzi wa sauti, kuhakikisha usalama ulio thabiti zaidi, bora na thabiti katika hali yoyote.

Maono ya Hanwha

  • 13488 Hanwha Vision R&D Center,
  • 6 Pangyo-ro 319-gil, Bundang-gu, Seongnam-si, Gyeonggi-do, Korea www.HanwhaVision.com
  • Hakimiliki ⓒ 2025 Maono ya Hanwha. Haki zote zimehifadhiwa.

Nyaraka / Rasilimali

Uainishaji wa Sauti wa Hanwha SPS-A100M AI na Utambuzi wa Mwelekeo wa Sauti [pdf] Mwongozo wa Mmiliki
Uainishaji wa Sauti wa SPS-A100M AI na Utambuzi wa Mwelekeo wa Sauti, SPS-A100M, Uainishaji wa Sauti wa AI na Utambuzi wa Mwelekeo wa Sauti, Uainishaji na Utambuzi wa Mwelekeo wa Sauti, Utambuzi wa Mwelekeo wa Sauti, Utambuzi wa Mwelekeo, Utambuzi.

Marejeleo

Acha maoni

Barua pepe yako haitachapishwa. Sehemu zinazohitajika zimetiwa alama *