Ustawienie rozpoznawania Emerson Axp1620

Emerson Axp1620 to komputerowy system rozpoznawania mowy, który może być używany do szybkiego i precyzyjnego rozpoznawania mowy. System ten może być używany do rozpoznawania języków naturalnych, a także do rozpoznawania głosu. Emerson Axp1620 ma wbudowany algorytm uczenia maszynowego, który umożliwia mu szybkie i skuteczne rozpoznawanie różnych głosów. System ten może być również używany do rozpoznawania kontekstu, co czyni go bardzo przydatnym w wielu różnych zastosowaniach. Emerson Axp1620 posiada również wiele różnych narzędzi do analizy dźwięku, co czyni go bardzo przydatnym narzędziem do rozpoznawania mowy.

Ostatnia aktualizacja: Ustawienie rozpoznawania Emerson Axp1620

Jan T. Grusznic


Od kilku lat obserwujemy większą liczbę wdrożeń systemów do czytania tablic rejestracyjnych. Zastosowania mają różny charakter: od systemów parkingowych w galeriach handlowych, przez systemy kontroli dostępu zapewniające wjazd tylko wybranym pojazdom czy systemy płatności bezgotówkowych na stacjach paliw (np. Circle K w Norwegii), po systemy pomiarów odcinkowych (mierzące wartość średniej prędkości pojazdu) lub walidacji opłacenia przejazdu autostradami (system eToll).

Skróty LPR i ANPR są używane w tekście naprzemiennie
i oznaczają tę samą funkcjonalność:
LPR – Licence Plate Recognition
– Rozpoznawanie tablic rejestracyjnych,
ANPR – Automatic Number Plate Recognition
– Automatyczne rozpoznawanie tablic rejestracyjnych

Wykorzystanie numerów rejestracyjnych jako identyfikatora stało się powszechne w wielu systemach pomimo niejednolitej interpretacji przepisów o ochronie danych1. Wynika to z faktu, że tablice rejestracyjne dzięki standaryzacji2 stanowią bardzo dobry, unikalny i powtarzalny kod referencyjny.

ANPR w głównej mierze sprowadza się do przechwytywania obrazu tablicy rejestracyjnej o odpowiedniej jakości oraz procesu popularnie zwanego OCR (Optical Character Recognition – optyczne rozpoznawanie znaków), które służą do odczytywania i rozpoznawania znaków alfanumerycznych, za co, jak zaznacza Marcin Walczuk z firmy BCS, odpowiadają obecnie niemal wyłącznie kamery. Chociaż nie każdy system ANPR to „czysty” OCR, oprócz odczytu numerów tablic rejestracyjnych systemy LPR mogą również rozpoznawać markę, model, kolor i typ pojazdu (! ), tzw. MMR (Make and Model Recognition), także za pomocą algorytmów uruchamianych bezpośrednio w kamerach.

Wyzwania ANPR

Skuteczne działanie ANPR wymaga spełnienia kilku wymagań, aby obraz w każdych warunkach operacyjnych, oświetleniowych, atmosferycznych i środowiskowych miał wystarczającą jakość do poprawnej analizy. Duża prędkość, silne światło z reflektorów pojazdów padające wprost na kamerę, skrajne oświetlenie (słabe w nocy, bardzo jasne w dzień), odbicia świateł i bezpośrednie odblaski słoneczne, a także zmienna pogoda zawsze stanowią wyzwanie dla instalacji, których celem jest poprawny odczyt tablic rejestracyjnych (rys. 1).

Rys. 1. Wyzwania systemów do sczytywania tablic rejestracyjnych
Źródło: Raytec White-Paper, Lighting for Intelligent Transport Systems (ITS) Part 1: Lighting for LPR/ ANPR Systems, version 2)

W świecie analityków powszechny jest skrót GIGO (Garbage In = Garbage Out), co dosłownie oznacza śmieci na wejściu = śmieci na wyjściu. Chodzi o to, że pomimo poprawności działania algorytmów przetwarzających dane otrzymywane wyniki będą niepoprawne, jeśli dane są słabej jakości. Maksyma ta odnosi się szczególnie do oprogramowania, w którym nie przewidziano procedury weryfikacji danych wejściowych. O zasadzie GIGO trzeba pamiętać szczególnie w przypadku stosowania prostych narzędzi, niezabezpieczonych przed śmieciowymi danymi, tym bardziej że – na co wskazuje Tomasz Kozłowski z firmy squareTec – trendem jest zbieranie i analizowanie danych z wielu kamer rozsianych na dużym obszarze. Liczą się wydajne przechowywanie i przeszukiwanie danych z zastosowaniem scenariuszy dostosowanych do konkretnych wymagań klientów, oparte na standardach świata IoT w połączeniu ze środowiskami big data.

Prędkość

Aby uchwycić szczegóły szybko poruszających się obiektów, trzeba w sposób istotny skrócić czas naświetlania. W fotografii sportowej, np. piłka nożna lub wyścigi samochodowe, prędkość migawki w aparatach fotograficznych jest często ustawiana na 1/8000 s (czyli czas naświetlania trwa tylko 0, 125 ms = 125 µs). Dzięki temu możemy podziwiać emocje i wysiłek na twarzach biegnących zawodników albo detale bolidów F1 pędzących z prędkością 300 km/h.

Korzyścią z zastosowania szybszej migawki (krótszego czasu otwarcia) jest lepsze uchwycenie detali obiektów w ruchu, co można porównać na ujęciach kręcącego się wiatraczka widocznych na rys. 2. Jedyne ujęcie, na którym wiatrak nie wydaje się w ogóle rozmazany, wykonano z zastosowaniem naświetlania z prędkością migawki 1/500 s (czyli 2 ms = 2000 µs). Ta wartość migawki, jako minimalna, jest zalecana w przypadku typowych (czytaj parkingowych) zastosowań LPR. Jednakże krótszy czas naświetlania (szybsza migawka) oznacza, że do przetwornika obrazu w kamerze dociera mniejsza ilość użytecznego światła.

Rys. 2. Efekty zastosowania krótszego czasu otwarcia migawki
Źródło: https://macro-click. com

Seria zdjęć widocznych na rys. 3 pokazuje wpływ czasu otwarcia migawki na ilość światła docierającego do przetwornika: im krótszy czas naświetlania, tym ciemniejszy staje się obraz. Kamery ANPR (jak zresztą pozostałe pracujące w typowych systemach dozoru wizyjnego) niedobór oświetlenia kompensują elektronicznym wzmocnieniem sygnału, które po przekroczeniu pewnej wartości znacząco obniża jakość odczytu tablic rejestracyjnych (z powodu nadmiernego zaszumienia obrazu).

Rys. 3. Efekt zmiany czasu otwarcia migawki przy stałych pozostałych parametrach naświetlania
Źródło: https://www. bhphotovideo. com

Wróćmy jednak do prędkości ruchu i efektu rozmycia w typowym zastosowaniu LPR: samochód jadący z prędkością v = 60 km/h pokonuje dystans ponad 16, 6 m w ciągu 1 sekundy. Ten pojazd obserwowany przez kamerę ustawioną pod kątem 30˚ względem kierunku jego ruchu (rys. 4) porusza się z prędkością vv:

vV = v sin 30˚ = 60 km/h • ½ = 30 km/h

czyli dwa razy wolniej.

Rys. 4. Relatywna prędkość pojazdu względem kąta obserwacji
Źródło: https://vidilabs. com

Przy czasie otwarcia migawki wynoszącym 1/25 s pojazd przemieszcza się o 33 cm (rozmycie na przetworniku: 83 piksele3) za każdym razem, gdy migawka aparatu jest otwarta, co daje obraz bardzo rozmyty. Przy czasie otwarcia migawki 1/500 s samochód przemieszcza się tylko o 1, 6 cm (rozmycie na przetworniku 4 piksele), co przekłada się na wyraźny obraz.

Szumy i AGC

Co do zasady wielu producentów algorytmów LPR i MMR zaleca ustawienie wzmocnienia w kamerze na jak najniższym poziomie, aby zapewnić jak najlepszy obraz do analizy. Obniżenie maksymalnej wartości AGC pomaga znacznie zredukować szumy w materiale wizyjnym, ale jednocześnie ma wpływ na zmniejszenie ogólnej jasności obrazu. Zwykle zaleca się ustawienie AGC na poziomie od 1/3 do 1/2 maksymalnego ustawienia (nie więcej niż 24 dB).

Kontrast

Systemy rozpoznawania znaków na obrazie bazują na kontraście. Im jest wyższy, tym lepiej dla algorytmu. Zatem zwiększenie poziomu gamma przekłada się (przynajmniej teoretycznie) na wzrost kontrastu pomiędzy skrajnymi czarnymi a białymi elementami obrazu – i jest to dokładnie to, czego w wielu przypadkach potrzebują systemy ANPR.
W praktyce zwiększanie kontrastu należy jednak wykonywać bardzo ostrożnie, jego nadmiar bowiem może skutkować błędami w odczycie (wyższy poziom gamma uwidacznia szum w obrazie). Wyższy kontrast nie jest zalecany w aplikacjach MMR, ponieważ zmniejsza dynamikę obrazu i w efekcie wiele kolorów jest próbkowanych niewłaściwie, np. srebrny jako biały.

Zwiększenie kontrastu jest również możliwe dzięki zastosowaniu wąskopasmowych filtrów optycznych. Jest to rozwiązanie dość powszechnie stosowane w kamerach typu „wszystko-w-jednym” przeznaczonych do LPR, gdyż pomaga znacznie zredukować efekt lśnienia powodowany przez reflektory pojazdu czy słońce. Filtry te przepuszczają tylko określony zakres pasma promieniowania4, zatem wymagają stosowania właściwego oświetlenia pracującego w określonym zakresie (rys. 5 i rys. 6).

Rys. 5. Wykres pokazujący procentową wartość transmisji promieniowania podczerwonego dla filtra BN850 używanego w systemach ANPR
Źródło: https://midopt. com
Rys. 6. Przykład zdjęcia uzyskanego z kamery ANPR wyposażonej w wąskopasmowy filtr bliskiej podczerwieni
Źródło: https://www. diligentvision. co. uk

Nie dla WDR

Choć logika podpowiada, że WDR wydaje się idealnym rozwiązaniem do przechwytywania tablic rejestracyjnych przemieszczających się pojazdów ze względu na możliwość kompensacji silnego oświetlenia, to niestety nie sprawdza się w tym scenariuszu.
Oczywiście wszystko zależy od warunków, w jakich kamera obserwuje pojazd – z jaką prędkością się on porusza, jak jest oświetlony. Większość dostępnych kamer z opcją WDR, by stworzyć obraz o wysokiej dynamice, prowadzi system wielokrotnego naświetlania, co w przypadku kamer przetwarzających 25 obrazów/s musi ograniczać zakres czasu migawki. A to w przypadku szybko przemieszczających się obiektów nie pozostanie bez wpływu na czytelność szczegółów. Z tego m. in. powodu zaleca się wyłączenie funkcji WDR.

Należy pamiętać, że zakres dynamiki zależy od dolnego i górnego poziomu oświetlenia w scenie. Zatem gdy jedynymi źródłami światła są reflektory pojazdu na czarnym, matowym asfalcie, efekt może być daleki od zadowalającego5.

Głębia ostrości

W tradycyjnych zastosowaniach dozoru wizyjnego obiektywy są ustawiane z maksymalnie otwartą przysłoną (niski f-stop), co pozwala zmaksymalizować ilość światła docierającego do przetwornika obrazu kamery, zwłaszcza w warunkach nocnych. To z kolei powoduje jednak zmniejszenie głębi ostrości. Jednocześnie im wyższy f-stop, tym mniej światła przechodzi przez obiektyw, ale zwiększa się głębia ostrości. W przypadku zastosowania tradycyjnych kamer z przetwornikami o wielkości ok. 1/3” i ogniskowej do 9 mm problem głębi ostrości jest pomijalny.

W typowych aplikacjach dla pojazdów oddalonych o ok. 5 m od kamery ANPR ostrość jest utrzymywana w najgorszym przypadku w zakresie od 3 do 15, 5 m dla f/1. 0. Przy wykorzystaniu dłuższych ogniskowych warto przewidzieć możliwość domknięcia przysłony, by zwiększyć głębię ostrości.

Przykład: ogniskowa 22 mm, przetwornik obrazu 1/3” – dla pojazdu odległego o 10 m głębia ostrości dla przysłony:

  • f/1. 0 wyniesie niecałe 5 m (od 8, 15 do 12, 9 m),
  • f/2. 0 spowoduje wydłużenie głębi do nieco ponad 11 m (od 6, 9 do 18, 3 m),
  • z kolei do f/2. 8 do ponad 20 m (od 6, 1 do 27, 9 m),
  • a do f/4. 0 zakres głębi ostrości wyniesie aż ponad 102 m (od 5, 3 do 107, 6 m)6.

Możliwość sterowania przysłoną nie jest dostępna we wszystkich kamerach ANPR. Do tego niezbędny jest w kamerze układ sterujący silnikiem krokowym, zarządzający przysłoną w obiektywie – rozwiązanie powszechnie znane jako P-iris (precision iris – precyzyjna przysłona).

Zmiana wartości przysłony znacząco wpływa na ilość światła docierającego do przetwornika obrazu. Jasność jest bowiem proporcjonalna do kwadratu wielkości przysłony. Po przejściu z przysłony f/1. 0 na przysłonę f/4. 0 ilość dostępnego światła zmniejszy się nie 4x, lecz 16x. Jeśli do tego doliczymy migawkę pracującą z prędkością 1/500 s (20x szybszą niż standardowa 1/25 s), będzie to oznaczać, że konfiguracja kamery z parametrami naświetlania f/4. 0 i 1/500 s wymaga 320 razy więcej światła w stosunku do parametrów początkowych (f/1. 0 i 1/25 s), aby utrzymać ten sam poziom oświetlenia7. – Dlatego – jak zaznacza Andrzej Hamryszczak z firmy VCN – ponieważ zależy nam na perfekcyjnym działaniu przez całą dobę, oświetlacz jest stałym elementem systemu. Najczęściej zintegrowanym z kamerą, jednak nie wszędzie jest to optymalne rozwiązanie.

Światło

Aby zapewnić wysoką jakość obrazu, system musi być w stanie poradzić sobie z szerokim zakresem warunków oświetleniowych. Nieuzbrojona kamera przeznaczona do typowego dozoru wizyjnego po prostu nie poradzi sobie z tymi zmiennymi warunkami. Aby pokonać tę trudność, system musi zapewniać niezawodny i stały poziom oświetlenia. Promienniki podczerwieni są najczęściej stosowane w aplikacjach ANPR.

W przypadku aplikacji uwzględniających MMR wymagane jest użycie światła białego, aby uzyskać dodatkowe informacje, np. o kolorze pojazdu. W takich scenariuszach należy tak wykonać instalację i dobrać takie oświetlenie, aby nie oślepiało osób znajdujących się w pojeździe.

Łukasz Lik z firmy Hikvision zdradza, że najwięcej kamer ANPR sprzedaliśmy do najprostszych systemów, czyli wjazd/wyjazd. Jednocześnie dodaje, że widoczne jest coraz większe zainteresowanie kamerami bardziej zaawansowanymi, stosowanymi w dużych miastach oraz na drogach szybkiego ruchu, co potwierdza liczba wdrożeń oraz mnogość przeprowadzanych testów naszych urządzeń.

W rozwiązaniach zarządzających ruchem (np. ITS), gdzie prędkość pojazdów jest znacznie większa aniżeli w systemach parkingowych, powszechną praktyką jest wykorzystanie oświetlenia błyskowego, co przekłada się na większą moc chwilową promiennika, mniejsze zużycie energii i mniejszy efekt iluminacji. Ponieważ błysk trwa na ogół tyle samo co czas naświetlania, uzyskuje się dużo lepszy efekt oświetlenia tablicy rejestracyjnej w ruchu w porównaniu z oświetleniem pracującym w trybie ciągłym.

Instalacja

Tablice rejestracyjne dopuszczone na terenie Unii Europejskiej i krajach WNP są retrorefleksyjne. Oznacza to, że światło odbite powraca w kierunku jego źródła. Wykorzystując rozwiązana ANPR, można uzyskać czytelny obraz tablic rejestracyjnych, natomiast w typowych zastosowaniach kamer dozoru wizyjnego są one często prześwietlone. Dlatego tak ważna jest lokalizacja kamery i źródła światła. Oba urządzenia powinny być umieszczone blisko siebie i pod kątem nie większym niż 30 stopni w stosunku do płaszczyzny tablicy. W przeciwnym razie korzyści płynące z retrorefleksyjności zostaną utracone.

Na rynku dostępnych jest wiele zintegrowanych kamer ANPR typu „wszystko-w-jednym”. Takie rozwiązanie upraszcza specyfikację, instalację i na ogół jest tańsze. Jak zauważa Bogumił Szymanek z firmy Axis Communications, rozwój technologii software’owych i hardware’owych pozwala zminimalizować konieczność stosowania zewnętrznych oświetlaczy podczerwieni. Rekomendowane przez nas kamery to w 90% modele z wbudowanym oświetlaczem. Trzeba jednak pamiętać, że takie rozwiązanie charakteryzuje się mniejszą elastycznością i jest ograniczone do konkretnej aplikacji. Serwisowanie i konserwacja są potencjalnie droższe i bardziej wymagające: jeśli jedna część systemu ulegnie awarii, całe urządzenie staje się bezużyteczne.

Alternatywnie tego typu rozwiązanie można stworzyć samodzielnie z wykorzystaniem oddzielnych komponentów. Pozwoli spełnić określone wymagania, wyższą elastyczność, możliwość wykorzystania najlepszych w swojej klasie urządzeń. Nie bez znaczenia są też możliwość integracji z większą liczbą rozwiązań firm trzecich, spełnienie wymagań potrzebnych do funkcjonowania bardziej wymagających aplikacji i większa kontrola nad całym systemem. Serwisowanie, konserwacja i modernizacja są łatwiejsze, ponieważ poszczególne komponenty systemu mogą być wymienialne.

Takie rozwiązania ma też wady, m. nabycie i połączenie oddzielnych komponentów jest trudniejsze, a koszty instalacji również są wyższe (choć warto je porównać z całkowitym kosztem życia systemu).

1) https://kancelaria-szip. pl/strefa-wiedzy/artykul/numer-rejestracyjny-a-dane-osobowe-rozbiezne-stanowiska-nsa-i-puodo/ (2/2/2022)
2) Chodzi o standaryzację dla kraju lub regionu. Różne tablice rejestracyjne na całym świecie różnią się materiałem, z którego są wytworzone, rozmiarem, kolorem liter i tła, czcionką czy sposobem odbijania padającego nań światła
3) Zakładając gęstość pikseli na poziomie 250 pikseli/m, minimalnych wymagań dla odczytu tablicy rejestracyjnej dla większości systemów ANPR
4) Na ogół: 730-750 nm albo 840-860 nm, albo 930-950 nm
5)  „WDR w praktyce”, Systemy Alarmowe nr 4, lipiec-sierpień 2013
6)  Obliczenia w oparciu o kalkulator głębi ostrości dostępny na stronie: http://www. dofmaster. com
7)  AGC const.

Jan T. Grusznic
z-ca red. naczelnego „a&s Polska”. Z branżą wizyjnych systemów zabezpieczeń związany
od 2004 r. Ma bogate doświadczenie w zakresie projektowania i wdrażania rozwiązań dozoru wizyjnego w aplikacjach o rozproszonej strukturze i skomplikowanej dystrybucji sygnałów. Ceniony diagnosta zintegrowanych systemów wspomagających bezpieczeństwo.

Zobacz inne artykuły tego autora:
Na układy nie ma rady. Kryzys w dostawach mikroprocesorów
Przyszłość VSS = Kamera Zdefiniowana Programowo
Więcej mocy z PoE! O standardzie IEEE802. 3bt

Automatyczny system rozpoznawania numerów rejestracyjnych znajduje zastosowanie najczęściej jako:

  • automatyczne otwarcie szlabanu dla pojazdu upoważnionego (funkcjonowanie w ramach kontroli dostępu),
  • prowadzenie statystyk odwiedzających (po rozpoznaniu tablicy i przypisaniu jej do regionu – powiatu, miasta, województwa),
  • informowanie służb o pojawieniu się na parkingu pojazdu skradzionego lub poszukiwanego (rozwiązanie wykorzystywane często na parkingach przed lotniskami),
  • ewidencja czasu wjazdu na parking i opuszczenia parkingu,
  • poprawa komfortu użytkowania systemów parkingowych i zwiększenie płynności ruchu przez automatyczne otwarcie szlabanu dla pojazdów, których kierowcy posiadają bilet opłacony,
  • analiza czasu przejazdu (w ramach współpracy z innymi elementami systemów Smart City).

Po kilku latach zebranych doświadczeń możemy stwierdzić z pełną odpowiedzialnością, że osiągnęliśmy najwyższy poziom rozpoznawania numerów rejestracyjnych. Stosowana przez nas nowoczesna technologia, niezawodne kamery i systemy do odczytu tablic rejestracyjnych, sprawiają, że jesteśmy potentatem w tej dziedzinie. Ponadto, z nami zamontujesz szlabany i wiele innych, przydatnych elementów służących do ochrony parkingów, placów czy terenów inwestycyjnych. Przekonaj się, dlaczego automatyka parkingowa to doskonałe rozwiązanie, nie nadwyrężające budżetu.

Aby skonfigurować ustawienia podłączonego urządzenia audio, np. zestawu słuchawkowego, wybierz pozycję (Ustawienia) > [Urządzenia] > [Urządzenia audio].

Urządzenie wejściowe

Służy do ustawienia używanego urządzenia wejściowego dźwięku.

Urządzenie wyjściowe

Służy do ustawiania używanego urządzenia wyjściowego dźwięku.

Wyreguluj poziom mikrofonu

Istnieje możliwość zmiany poziomu głośności dźwiękowego sygnału wejściowego zestawu słuchawkowego lub mikrofonu z wejściem USB do prowadzenia rozmów głosowych lub do transmisji.
Ustawienie to jest wyłączone, jeśli gracz korzysta z funkcji rozpoznawania głosu.

Regulacja głośności (słuchawki)

Służy do regulacji głośności za pomocą przycisku „w lewo” lub przycisku „w prawo” kontrolera.

Wyjście na słuchawki

Służy do konfigurowania ustawień wyjścia do zestawu słuchawkowego lub innego urządzenia audio. Można też określić, czy urządzenie będzie odbierać cały dźwięk, czy tylko czat głosowy. Domyślne ustawienie to [Czat głosowy].

Głośność samosłyszalności

Ta opcja pozwala ustawić głośność głosu słyszanego za pośrednictwem zestawu słuchawkowego. To ustawienie nie jest dostępne w odniesieniu do wszystkich zestawów słuchawkowych.

Automatycznie przełączaj urządzenie wyjściowe

Po podłączeniu urządzenia audio, na przykład zestawu słuchawkowego, zaznacz pole wyboru pozwalające automatycznie przełączać urządzenia wyjściowe. Wyczyść zaznaczenie, aby wyłączyć tę funkcję.

Informacje

  • Słuchanie dźwięku o wysokiej głośności może spowodować utratę słuchu.
  • Początkowe ustawienie zbyt dużej głośności może wygenerować niespodziewanie głośne dźwięki i uszkodzić słuch.
  • Do początku strony
  • Poprzedni
  • Następny
Ustawienie rozpoznawania Emerson Axp1620

Bezpośredni link do pobrania Ustawienie rozpoznawania Emerson Axp1620

Starannie wybrane archiwa oprogramowania - tylko najlepsze! Sprawdzone pod kątem złośliwego oprogramowania, reklam i wirusów

Ostatnia aktualizacja Ustawienie rozpoznawania Emerson Axp1620