ARM

Silnik ARM jest oprogramowaniem realizującym automatyczne rozpoznawanie mowy ciągłej dla języka polskiego. Jest to rozwiązanie bazujące na ukrytych modelach Markova (HMM), wykorzystujące dedykowane statystyczne modele akustyczne i lingwistyczne.

Wyniki rozpoznania mowy zawierają:

  • tekstowy zapis wypowiedzi w postaci sekwencji wyrazów,
  • podział wypowiedzi na segmenty,
  • znaczniki czasowe wskazujące początek i koniec wypowiedzi poszczególnych wyrazów,
  • miarę wiarygodności rozpoznania poszczególnych wyrazów,
  • zbiór alternatywnych hipotez.

Silnik ARM wykorzystywany jest w implementowanych przez nas rozwiązaniach – aplikacji Airnote oraz w systemie TIN. Może on zostać również zintegrowany z systemami użytkownika w formie usługi realizującej rozpoznawanie mowy. Taką rolę silnik ARM pełni w:

  • systemie do analizy programów telewizyjnych CAST działającym na Wydziale Dziennikarstwa i Nauk Politycznych UAM,
  • systemie EMMA wspierającym działalność biało-wywiadowczą,
  • systemie Press Service Media Monitoring,
  • platformie automatyzacji awaryjnych infolinii zgłoszeniowych IVA.

Możliwe jest dostosowanie silnika do wskazanej dziedziny zastosowania poprzez adaptację modeli akustycznych i językowych na podstawie zbioru nagrań oraz korpusu tekstowego dostarczonego przez użytkownika. Użytkownik może również określić reguły, według których rozpoznany tekst zostanie przetworzony do postaci prezentowanej jako rezultat końcowy.


Usługa rozpoznawania mowy może działać lokalnie w sieci wewnętrznej użytkownika. Rozpoznawanie mowy nie wymaga komunikacji z żadnymi usługami zewnętrznymi zapewniając tym samym poufność przetwarzanych danych.


Silnik ARM powstał w ramach projektu ZSKM. Dalszy jego rozwój realizowany był w ramach projektu ARM-1. Jest to rozwiązanie działające w systemie Windows.

wiadomości