Przewidywanie liniowe z mieszanym wzbudzeniem - Mixed-excitation linear prediction

Przewidywanie liniowe z mieszanym wzbudzeniem ( MELP ) to standard kodowania mowy Departamentu Obrony Stanów Zjednoczonych używany głównie w zastosowaniach wojskowych i komunikacji satelitarnej , bezpiecznym głosie i bezpiecznych urządzeniach radiowych. Jego standaryzacja i późniejszy rozwój były prowadzone i wspierane przez NSA i NATO.

Historia

Pierwotny MELP został wynaleziony przez Alana McCree około 1995 roku, kiedy był absolwentem Center for Signal and Image Processing (CSIP) w Georgia Tech, a oryginalne patenty związane z MELP wygasły. Ten początkowy koder mowy został znormalizowany w 1997 roku i był znany jako MIL-STD-3005. Przewyższał inne kandydujące wokodery w konkursie US DoD, w tym: (a) Selektywny koder harmoniczny częstotliwości (FSHC), (b) Zaawansowane wzbudzenie wielopasmowe (AMBE), (c) Wzmocnione wzbudzenie wielopasmowe (EMBE), (d) Sinusoida Transform Coder (STC) i (e) Subband LPC Coder (SBC). Ze względu na mniejszą złożoność niż koder Waveform Interpolative (WI), wokoder MELP wygrał konkurs DoD i został wybrany dla MIL-STD- 3005.

MIL-STD-3005

W latach 1998-2001 nowy vocoder oparty na MELP został stworzony z połową szybkości (tj. 1200 bit / s), a znaczące ulepszenia zostały dodane do MIL-STD-3005 przez SignalCom (później przejęty przez Microsoft ), Compandent i AT&T Corporation , która obejmowała (a) dodatkowy nowy wokoder o połowie szybkości (tj. 1200 bitów / s), (b) znacznie ulepszone kodowanie (analiza), (c) znacznie ulepszone dekodowanie (synteza), (d) przetwarzanie wstępne szumów w celu usunięcia szum tła, (e) transkodowanie pomiędzy strumieniami bitów 2400 bit / s i 1200 bit / s oraz (f) nowy filtr końcowy. To dość znaczące osiągnięcie miało na celu stworzenie nowego kodera o połowę niższej szybkości i zapewnienie jego interoperacyjności ze starym standardem MELP. Ten ulepszony MELP (znany również jako MELPe) został przyjęty jako nowy MIL-STD-3005 w 2001 roku w postaci załączników i uzupełnień wykonanych w stosunku do oryginalnego MIL-STD-3005, zapewniając taką samą jakość jak stary MELP 2400 bit / s za połowę stawki. Jedną z największych zalet nowego MELPe 2400 bit / s jest to, że ma ten sam format bitów co MELP, a zatem może współpracować ze starszymi systemami MELP, ale zapewnia lepszą jakość na obu końcach. MELPe zapewnia znacznie lepszą jakość niż wszystkie starsze standardy wojskowe, zwłaszcza w hałaśliwym otoczeniu, takim jak pole bitwy, pojazdy i samoloty.

STANAG-4591 (NATO)

W 2002 roku, po szeroko zakrojonych konkurencjach i testach, amerykański DoD MELPe 2400 i 1200 bit / s został przyjęty również jako standard NATO , znany jako STANAG -4591. Pomiary wyników testów NATO obejmowały zrozumiałość głosu, jakość głosu, rozpoznawanie mówcy, zależność językową, zależność głośnika, 10 środowisk hałasu akustycznego, kanał transmisji poniżej 1% BER, tandem z wykorzystaniem wokodera CVSD 16 kb / s, mowę szeptaną i implementację w czasie rzeczywistym. Dane testowe obejmowały ponad 36 000 plików lub 500 godzin wypowiedzi w różnych warunkach i językach. W ramach testów NATO pod kątem nowego standardu NATO, MELPe został przetestowany z innymi kandydatami, takimi jak francuski HSX (Harmonic Stochastic eXcitation) i turecki SB-LPC (Split-Band Linear Predictive Coding), a także stary bezpieczny głos standardy, takie jak FS1015 LPC-10e (2,4 kbit / s), FS1016 CELP (4,8 kbit / s) i CVSD (16 kbit / s). Następnie MELPe wygrał również konkurs NATO, przewyższając jakość wszystkich innych kandydatów, a także jakość wszystkich starych bezpiecznych standardów głosowych (CVSD, CELP i LPC-10e ). W konkursie NATO stwierdzono, że MELPe znacznie poprawił wydajność (pod względem jakości mowy, zrozumiałości i odporności na szum), jednocześnie zmniejszając wymagania dotyczące przepustowości. Testy NATO obejmowały również testy interoperacyjności, wykorzystywały ponad 200 godzin danych mowy i zostały przeprowadzone przez 3 laboratoria testowe na całym świecie. Compandent Inc, w ramach projektów opartych na MELPe realizowanych dla NSA i NATO , dostarczył NSA i NATO specjalną platformę testową znaną jako urządzenie MELCODER , która zapewniła złoty punkt odniesienia dla wdrażania MELPe w czasie rzeczywistym. Niedrogie urządzenia terminala danych FLEXI-232 (DTE) firmy Compandent , które są oparte na złotej referencji MELCODER , są bardzo popularne i szeroko stosowane do oceny i testowania MELPe w czasie rzeczywistym, w różnych kanałach i sieciach oraz w warunkach terenowych. .

W 2005 r. Do standardu NATO STANAG-4591 dodano nową odmianę MELPe o szybkości 600 bit / s, wyprodukowaną przez Thales Group ( Francja ) (bez szeroko zakrojonej konkurencji i testów przeprowadzanych dla MELPe 2400/1200 bit / s).

300 bit / s MELP

W 2010 roku MIT Lincoln Labs, Compandent , BBN i General Dynamics opracowały również dla DARPA urządzenie MELP 300 bit / s. Jego jakość była lepsza niż MELPe 600 bit / s, ale jego algorytmiczne opóźnienie było dłuższe.

Wdrożenia

MELPe został wdrożony w wielu aplikacjach, w tym w bezpiecznych urządzeniach radiowych, komunikacji satelitarnej, VoIP i telefonii komórkowej. W takich zastosowaniach wymagana jest dodatkowa wiedza do zwalczania błędów kanałów, utraty pakietów i utraty synchronizacji. Taka wiedza wymaga zrozumienia wrażliwości bitów MELPe na błędy. MELPe 2400 bit / si 1200 bit / s zawiera bit synchronizacji, który jest przydatny w komunikacji szeregowej.

Poziom kompresji

MELPe jest przeznaczony do kompresji mowy. Biorąc pod uwagę wejście audio próbkowane z częstotliwością 8 kHz, kodek MELPe zapewnia następujące współczynniki kompresji w strumieniu danych μ-Law G.711 64 kbit / s, pomijając wpływ narzutu protokołu:

Szybkość transmisji Współczynnik kompresji w porównaniu z G.711 Rozmiar ładunku Interwał ładunku
2400 bitów / s 26,7 X 54 bity 22,5 ms
1200 bitów / s 53,3 X 81 bitów 67,5 ms
600 bitów / s 106,7 X 54 bity 90 ms

Ogólnie kodowanie mowy obejmuje kompromis różnych aspektów, w tym przepływność, jakość mowy, opóźnienie (rozmiar ramki i wyprzedzanie), złożoność obliczeniowa, odporność na różne głośniki i języki, odporność na różne szumy tła, odporność na błędy kanału, a także odzyskiwanie stanu kodeka w obliczu utraty pakietów. Ponieważ niższe szybkości MELPe (600 i 1200 bitów / s) są nadzbiórami szybkości 2400 bitów / s, złożoność algorytmu (np. W MIPS) jest mniej więcej taka sama dla wszystkich szybkości. Niższe szybkości używają zwiększonych ramek i wyprzedzenia, a także rozmiaru książki kodowej, dlatego wymagają więcej pamięci.

Prawa własności intelektualnej

MELPe (i / lub jego pochodne) podlega licencji IPR od następujących firm, Texas Instruments (algorytm / kod źródłowy 2400 bit / s MELP), Microsoft (transkoder 1200 bit / s), Thales Group (szybkość 600 bit / s) , Compandent i AT&T (Noise Pre-Processor NPP).

Zobacz też

Bibliografia

  1. ^ A Mixed Excitation LPC Vocoder Model for Low Bit Rate Speech Coding, Alan V. McCree, Thomas P. Barnweell, 1995 w IEEE Trans. Przetwarzanie mowy i dźwięku (oryginalny MELP)
  2. ^ Konwersja analogowo-cyfrowa głosu przez 2400 bitów / sekundę mieszanej prognozy liniowej wzbudzenia (MELP), US DoD (MIL_STD-3005, oryginalny MELP)
  3. ^ MR Bielefeld, LM Supplee, „Opracowanie programu testowego dla procesu wyboru wokodera DoD 2400 bps”, Acoustics Speech and Signal Processing 1996. ICASSP-96. Materiały konferencyjne. Międzynarodowa konferencja IEEE 1996, vol. 2, s. 1141–1144 t. 2, 1996.
  4. ^ LM Supplee, RP Cohn, JS Collura, AV McCree, „MELP: the new Federal Standard at 2400 bps”, Acoustics Speech and Signal Processing 1997. ICASSP-97. Międzynarodowa konferencja IEEE 1997, vol. 2, strony 1591-1594, tom 2, 1997.
  5. ^ INTEROPERACYJNY WĄSKOPASMOWY KODER GŁOSOWY NATO 1200 I 2400 BIT / S, STANAG-4591, NATO
  6. ^ MELPe VARIATION FOR 600 BIT / S WĄSKOPASMOWY KODER GŁOSOWY NATO, STANAG-4591, NATO
  7. ^ Alan McCree, „Skalowalna struktura wokodera fonetycznego wykorzystująca łączną predykcyjną kwantyzację wektorową parametrów MELP”, w Proc. IEEE Int. Conf. Acoust., Speech, Signal Processing, 2006, s. I 705–708, Tuluza, Francja