MPEG-4 - MPEG-4

MPEG-4 to metoda definiowania kompresji danych cyfrowych audio i wizualnych (AV). Został wprowadzony pod koniec 1998 roku i wyznaczył standard dla grupy formatów kodowania audio i wideo oraz powiązanej technologii uzgodnionej przez Grupę Ekspertów ds. Filmów ISO / IEC (MPEG) ( ISO/IEC JTC1 /SC29/WG11) w ramach formalnego standardu ISO/IEC 14496 – Kodowanie obiektów audiowizualnych . Zastosowania MPEG-4 to kompresję danych AV dla internetowego wideo i CD dystrybucji, głosu ( telefon , wideofon ) oraz transmisji telewizyjnych aplikacji. Standard MPEG-4 został opracowany przez grupę kierowaną przez Touradja Ebrahimiego (późniejszego prezesa JPEG ) i Fernando Pereirę.

Tło

MPEG-4 absorbuje wiele funkcji MPEG-1 i MPEG-2 oraz innych pokrewnych standardów, dodając nowe funkcje, takie jak (rozszerzona) obsługa VRML dla renderowania 3D, zorientowane obiektowo pliki kompozytowe (w tym obiekty audio, wideo i VRML), wsparcie dla zewnętrznie określonego Digital Rights Management oraz różnego rodzaju interaktywności. AAC (Advanced Audio Coding) został ustandaryzowany jako dodatek do MPEG-2 (jako część 7) przed wydaniem MPEG-4.

MPEG-4 jest wciąż rozwijającym się standardem i jest podzielony na kilka części. Firmy promujące kompatybilność z MPEG-4 nie zawsze jasno określają poziom kompatybilności „części”, do którego się odnoszą. Kluczowe elementy, o których należy pamiętać, to MPEG-4 Part 2 (w tym Advanced Simple Profile, używany przez kodeki takie jak DivX , Xvid , Nero Digital i 3ivx oraz QuickTime 6) oraz MPEG-4 part 10 (MPEG-4 AVC/ H .264 lub Advanced Video Coding, używany przez koder x264 , Nero Digital AVC, QuickTime 7 i nośniki wideo w wysokiej rozdzielczości, takie jak Blu-ray Disc ).

Większość funkcji zawartych w MPEG-4 pozostawia się indywidualnym programistom, którzy decydują, czy je wdrożyć. Oznacza to, że prawdopodobnie nie ma pełnej implementacji całego zestawu standardów MPEG-4. Aby temu zaradzić, standard zawiera pojęcie „profili” i „poziomów”, co pozwala na zdefiniowanie określonego zestawu możliwości w sposób odpowiedni dla podzbioru aplikacji.

Początkowo MPEG-4 był przeznaczony głównie do komunikacji wideo o niskiej przepływności ; jednak jego zakres jako standardu kodowania multimedialnego został później rozszerzony. MPEG-4 jest wydajny przy różnych szybkościach transmisji, od kilku kilobitów na sekundę do dziesiątek megabitów na sekundę. MPEG-4 zapewnia następujące funkcje:

  • Poprawiona wydajność kodowania w porównaniu z MPEG-2
  • Możliwość kodowania mieszanych danych multimedialnych (wideo, audio, mowa)
  • Odporność na błędy umożliwiająca niezawodną transmisję
  • Możliwość interakcji ze sceną audiowizualną generowaną w odbiorniku

Przegląd

MPEG-4 zapewnia szereg technologii dla programistów, różnych dostawców usług i użytkowników końcowych:

  • MPEG-4 umożliwia różnym twórcom oprogramowania i sprzętu tworzenie obiektów multimedialnych o lepszych zdolnościach adaptacyjnych i elastyczności w celu poprawy jakości takich usług i technologii jak telewizja cyfrowa, grafika animowana , sieć WWW i ich rozszerzenia.
  • Dostawcy sieci danych mogą używać formatu MPEG-4 w celu zapewnienia przejrzystości danych. Za pomocą standardowych procedur dane MPEG-4 mogą być interpretowane i przekształcane na inne typy sygnałów kompatybilne z dowolną dostępną siecią.
  • Format MPEG-4 zapewnia użytkownikom końcowym szeroki zakres interakcji z różnymi animowanymi obiektami.
  • Znormalizowana sygnalizacja zarządzania prawami cyfrowymi , znana w społeczności MPEG jako zarządzanie i ochrona własności intelektualnej (IPMP).

Format MPEG-4 może pełnić różne funkcje, między innymi:

  • Multipleksuje i synchronizuje dane związane z obiektami medialnymi w taki sposób, aby mogły być efektywnie przesyłane dalej kanałami sieciowymi.
  • Interakcja ze sceną audiowizualną, która powstaje z boku odbiornika.

Profile i poziomy

MPEG-4 zapewnia duży i bogaty zestaw narzędzi do kodowania. Podzbiory zestawów narzędzi MPEG-4 zostały udostępnione do użytku w określonych aplikacjach. Te podzbiory, zwane „Profilami”, ograniczają rozmiar zestawu narzędzi, który dekoder musi zaimplementować. Aby ograniczyć złożoność obliczeniową, dla każdego Profilu ustawiany jest jeden lub więcej „Poziomów”. Połączenie profilu i poziomu umożliwia:

  • Konstruktor kodeków do implementacji tylko podzbioru wymaganego standardu, przy jednoczesnym zachowaniu współpracy z innymi urządzeniami MPEG-4, które implementują tę samą kombinację.
  • Sprawdzanie, czy urządzenia MPEG-4 są zgodne ze standardem określanym jako test zgodności .

Części MPEG-4

MPEG-4 składa się z kilku standardów — zwanych „częściami” — w tym następujących (każda część obejmuje pewien aspekt całej specyfikacji):

Części MPEG-4
Część Numer Pierwsza publiczna data wydania (pierwsze wydanie) Data ostatniej publikacji (ostatnie wydanie) Ostatnia poprawka Tytuł Opis
Część 1 ISO/IEC 14496-1 1999 2010 2014 Systemy Opisuje synchronizację i multipleksację wideo i audio. Na przykład format pliku MPEG-4 wersja 1 (przestarzały przez wersję 2 zdefiniowaną w MPEG-4 część 14). Funkcjonalność stosu protokołów transportowych do przesyłania i/lub przechowywania zawartości zgodnej z normą ISO/IEC 14496 nie mieści się w zakresie 14496-1 i uwzględniany jest tylko interfejs do tej warstwy (DMIF). Informacje o transporcie zawartości MPEG-4 są zdefiniowane np. w Strumieniu transportowym MPEG-2 , profilach audio-wideo RTP i innych.
Część 2 ISO/IEC 14496-2 1999 2004 2009 Wizualny Format kompresji danych wizualnych (wideo, nieruchome tekstury, obrazy syntetyczne itp.). Jednym z wielu „profili” w części 2 jest Advanced Simple Profile (ASP) .
Część 3 ISO/IEC 14496-3 1999 2009 2017 Audio Zestaw formatów kompresji do percepcyjnego kodowania sygnałów audio, w tym niektóre odmiany zaawansowanego kodowania dźwięku (AAC), a także inne formaty i narzędzia do kodowania dźwięku/mowy (takie jak bezstratne kodowanie dźwięku (ALS), skalowalne kodowanie bezstratne (SLS), Dźwięk strukturalny , interfejs zamiany tekstu na mowę (TTSI), HVXC , CELP i inne)
Część 4 ISO/IEC 14496-4 2000 2004 2016 Testy zgodności Opisuje procedury testowania zgodności z innymi częściami normy.
Część 5 ISO/IEC 14496-5 2000 2001 2017 Oprogramowanie referencyjne Udostępnia oprogramowanie referencyjne do demonstrowania i wyjaśniania innych części normy.
Część 6 ISO/IEC 14496-6 1999 2000 Dostarczanie Multimedia Integration Framework (DMIF)
Część 7 ISO/IEC TR 14496-7 2002 2004 Zoptymalizowane oprogramowanie referencyjne do kodowania obiektów audiowizualnych Podaje przykłady, jak tworzyć ulepszone implementacje (np. w odniesieniu do Części 5).
Część 8 ISO/IEC 14496-8 2004 2004 Przenoszenie treści ISO/IEC 14496 przez sieci IP Określa metodę przenoszenia zawartości MPEG-4 w sieciach IP . Zawiera również wytyczne dotyczące projektowania formatów ładunku RTP , zasad użytkowania SDP do transportu informacji związanych z normą ISO/IEC 14496-1, definicji typu MIME , analizy bezpieczeństwa RTP i multiemisji .
Część 9 ISO/IEC TR 14496-9 2004 2009 Referencyjny opis sprzętu Zawiera projekty sprzętu do demonstrowania sposobu implementacji innych części standardu.
Część 10 ISO/IEC 14496-10 2003 2014 2016 Zaawansowane kodowanie wideo (AVC) Format kompresji sygnałów wideo technicznie identyczny ze standardem ITU-T H.264 .
Część 11 ISO/IEC 14496-11 2005 2015 Opis sceny i silnik aplikacji Może być używany do bogatej, interaktywnej zawartości z wieloma profilami, w tym wersjami 2D i 3D. MPEG-4 Part 11 poprawiony MPEG-4 Part 1 – ISO/IEC 14496-1:2001 i dwie poprawki do MPEG-4 Part 1. Opisuje opis poziomu systemu silnika aplikacji (dostawa, cykl życia, format i zachowanie pobieranego aplikacje z kodem bajtowym Java ) i Binary Format for Scene (BIFS) oraz Extensible MPEG-4 Textual (XMT)  – tekstowa reprezentacja treści multimedialnych MPEG-4 przy użyciu XML itp. (znany również jako BIFS, XMT , MPEG-J. MPEG-J został zdefiniowany w MPEG-4 część 21)
Część 12 ISO/IEC 14496-12 2004 2015 2017 Bazowy format plików multimedialnych ISO Format pliku do przechowywania treści multimedialnych opartych na czasie. Jest to ogólny format stanowiący podstawę wielu innych, bardziej specyficznych formatów plików (np. 3GP , Motion JPEG 2000 , MPEG-4 Part 14 ). Pod względem technicznym jest identyczny z normą ISO/IEC 15444-12 ( system kodowania obrazu JPEG 2000 – część 12).
Część 13 ISO/IEC 14496-13 2004 2004 Rozszerzenia do zarządzania i ochrony własności intelektualnej (IPMP) MPEG-4 Part 13 poprawił poprawkę do MPEG-4 Part 1 – ISO/IEC 14496-1:2001/Amd 3:2004. Określa wspólne przetwarzanie zarządzania i ochrony własności intelektualnej (IPMP), składnię i semantykę przenoszenia narzędzi IPMP w strumieniu bitów, przenoszenie informacji IPMP, wzajemne uwierzytelnianie narzędzi IPMP, listę organów rejestracyjnych wymaganych do obsługi zmienionych specyfikacji (np. CISAC ) itp. Zostało to zdefiniowane ze względu na brak współdziałania różnych mechanizmów ochronnych (różnych systemów DRM) do ochrony i dystrybucji treści cyfrowych chronionych prawem autorskim, takich jak muzyka czy wideo.
Część 14 ISO/IEC 14496-14 2003 2003 2010 Format pliku MP4 Jest również znany jako „format pliku MPEG-4 w wersji 2”. Wyznaczony format pliku kontenera dla zawartości MPEG-4, który jest oparty na części 12. Zmienia i całkowicie zastępuje klauzulę 13 normy ISO/IEC 14496-1 (MPEG-4 część 1: Systemy), w której format pliku MPEG-4 został wcześniej określony.
Część 15 ISO/IEC 14496-15 2004 2017 2020 Część 15: Przenoszenie wideo strukturalnego jednostki warstwy abstrakcji sieci (NAL) w podstawowym formacie pliku multimedialnego ISO Do przechowywania wideo z części 10. Format pliku jest oparty na części 12, ale umożliwia również przechowywanie w innych formatach plików.
Część 16 ISO/IEC 14496-16 2004 2011 2016 Rozszerzenie ram animacji (AFX) Określa model MPEG-4 Animation Framework eXtension (AFX) do reprezentacji zawartości grafiki 3D. MPEG-4 został rozszerzony o syntetyczne obiekty wyższego poziomu do określania geometrii, tekstury, animacji i dedykowanych algorytmów kompresji.
Część 17 ISO/IEC 14496-17 2006 2006 Strumieniowy format tekstu Format napisów Timed Text
Część 18 ISO/IEC 14496-18 2004 2004 2014 Kompresja czcionek i przesyłanie strumieniowe Dla otwartego formatu czcionki zdefiniowanego w części 22.
Część 19 ISO/IEC 14496-19 2004 2004 Zsyntetyzowany strumień tekstur Strumienie zsyntetyzowanych tekstur są używane do tworzenia syntetycznych klipów wideo o bardzo niskiej przepływności.
Część 20 ISO/IEC 14496-20 2006 2008 2010 Lekka reprezentacja sceny aplikacji (LASeR) i prosty format agregacji (SAF) Wymagania LASeR (wydajność kompresji, kod i zużycie pamięci) są spełniane przez budowanie na istniejącym formacie Scalable Vector Graphics (SVG) zdefiniowanym przez konsorcjum World Wide Web.
Część 21 ISO/IEC 14496-21 2006 2006 Rozszerzenia struktury graficznej MPEG-J (GFX) Opisuje lekkie środowisko programistyczne dla zaawansowanych interaktywnych aplikacji multimedialnych — platformę, która łączy podzbiór standardowego środowiska aplikacji Java (MPEG-J) z interfejsem API Java . (na etapie "FCD" w lipcu 2005, FDIS styczeń 2006, opublikowana jako norma ISO 22.11.2006).
Część 22 ISO/IEC 14496-22 2007 2015 2017 Otwórz format czcionki OFFS opiera się na specyfikacji formatu czcionki OpenType w wersji 1.4 i jest technicznie równoważna tej specyfikacji. Osiągnął etap "CD" w lipcu 2005 roku, opublikowany jako norma ISO w 2007 roku
Część 23 ISO/IEC 14496-23 2008 2008 Symboliczna Reprezentacja Muzyki (SMR) Osiągnięty etap „FCD” w październiku 2006, opublikowany jako norma ISO 28.01.2008
Część 24 ISO/IEC TR 14496-24 2008 2008 Interakcja audio i systemów Opisuje pożądane wspólne zachowanie formatu plików MPEG-4 i dźwięku MPEG-4.
Część 25 ISO/IEC 14496-25 2009 2011 Model kompresji grafiki 3D Definiuje model łączenia narzędzi kompresji grafiki 3D zdefiniowanych w standardach MPEG-4 z prymitywami graficznymi zdefiniowanymi w dowolnym innym standardzie lub specyfikacji.
Część 26 ISO/IEC 14496-26 2010 2010 2016 Zgodność dźwięku
Część 27 ISO/IEC 14496-27 2009 2009 2015 Zgodność grafiki 3D Zgodność grafiki 3D podsumowuje wymagania, łączy je z charakterystykami i określa, w jaki sposób można testować zgodność z nimi. Podano wytyczne dotyczące konstruowania testów w celu weryfikacji zgodności dekodera.
Część 28 ISO/IEC 14496-28 2012 2012 Reprezentacja czcionki kompozytowej
Część 29 ISO/IEC 14496-29 2014 2015 Kodowanie wideo w sieci Tekst części 29 pochodzi z części 10 - ISO/IEC 14496-10. Internetowe kodowanie wideo to technologia zgodna z profilem ograniczonej linii bazowej normy ISO/IEC 14496-10 (podzbiór określony w załączniku A dla ograniczonych linii bazowych jest specyfikacją normatywną, podczas gdy wszystkie pozostałe części mają charakter informacyjny).
Część 30 ISO/IEC 14496-30 2014 2014 Czasowy tekst i inne nakładki wizualne w podstawowym formacie plików multimedialnych ISO Opisuje przenoszenie niektórych form czasowych strumieni tekstu i napisów w plikach w oparciu o ISO/IEC 14496-12 - W3C Timed Text Markup Language 1.0, W3C WebVTT (Web Video Text Tracks). Dokumentacja tych formularzy nie wyklucza innej definicji przewozu czasowego tekstu lub napisów; patrz na przykład 3GPP Timed Text (3GPP TS 26.245).
Część 31 ISO/IEC 14496-31 W przygotowaniu (2018-05) Kodowanie wideo dla przeglądarek Kodowanie wideo dla przeglądarek (VCB) - technologia kompresji wideo przeznaczona do użytku w przeglądarce WWW
Część 32 ISO/IEC CD 14496-32 W budowie Oprogramowanie zgodności i odniesienia
Część 33 ISO/IEC FDIS 14496-33 W budowie Internetowe kodowanie wideo

Profile są również definiowane w ramach poszczególnych „części”, więc implementacja części zwykle nie jest implementacją całej części.

MPEG-1 , MPEG-2 , MPEG-7 i MPEG-21 to inne zestawy standardów MPEG.

Poziomy MPEG-4

Niskie poziomy profilu są częścią ograniczeń kodowania/dekodowania wideo MPEG-4 i są kompatybilne ze starszym standardem ITU H.261, również kompatybilne z wcześniejszymi standardami telewizji analogowej do nadawania i nagrywania (takimi jak NTSC lub PAL). Profil ASP na najwyższym poziomie jest odpowiedni dla większości zwykłych nośników DVD i odtwarzaczy lub dla wielu witryn wideo online, ale nie dla nagrań Blu-ray lub treści wideo HD online.

Profil Poziom Maks.
bufor
Maks.
szybkość transmisji
Maks.
opóźnienie
Maks. Rozmiar
wiceprezesa
Maks. Rozmiar
VOP
Maks. szybkość
dekodera
Maks. rozmiar ramki
@ maks.
szybkość transmisji
@ 30 Hz @ 25 Hz @ 24 Hz @ 15 Hz @ 12,5 Hz
SP L0 160 64 2,50 2048 99 1485 QCIF (176×144)
L0b 320 128
L1 160 64 128×96 144×96 160×96
L2 640 128 5,00 4096 396 5940 256×192 304×192, 288×208 304×208 CIF (352×288)
L3 384 1,66 8192 11 880 CIF (352×288)
L4a 1280 4000 0,32 16 384 1200 36 000 VGA (640×480)
L5 1,792 8000 0,22 1620 40 500 D1 NTSC (720×480) D1 PAL (720×576)
L6 3968 12.000 0,33 3600 108 000 720p (1280x720)
ŻMIJA L0 160 128 1,25 2048 99 2970 QCIF (176×144)
L1
L2 640 384 1,66 4096 396 5940 256×192 304×192, 288×208 304×208 CIF (352×288)
L3 768 0,86 11 880 CIF (352×288)
L3b 1,040 1500 0,69
L4 1280 3000 0,43 8192 792 23760 352×576, 704×288
L5 1,792 8000 0,22 16 384 1620 48 600 720×576
Jednostki kbit kbit/s sekundy bity makrobloki makrobloki/s piksele

Bardziej zaawansowane profile dla multimediów HD zostały zdefiniowane później w profilu AVC, który jest funkcjonalnie identyczny ze standardem ITU H.264, ale jest teraz również zintegrowany z MPEG-4 Part 10 ( lista znajduje się w sekcji H.264/MPEG-4 AVC zdefiniowanych poziomów w tym profilu AVC).

Koncesjonowanie

MPEG-4 zawiera opatentowane technologie, których użycie wymaga licencji w krajach uznających patenty algorytmów oprogramowania . Ponad dwadzieścia firm twierdzi, że posiada patenty na MPEG-4. MPEG LA licencjonuje patenty wymagane dla MPEG-4 Part 2 Visual od wielu firm (audio jest licencjonowane oddzielnie) i wymienia wszystkich swoich licencjodawców i licencjobiorców na stronie. Nowe licencje na patenty systemu MPEG-4 są w trakcie opracowywania i nie są oferowane żadne nowe licencje, podczas gdy posiadacze starej licencji na system MPEG-4 są nadal objęci warunkami tej licencji dla wymienionych patentów ( MPEG LA – Lista patentów ).

Większość patentów wykorzystywanych do formatu MPEG-4 Visual należy do trzech japońskich firm: Mitsubishi Electric (255 patentów), Hitachi (206 patentów) i Panasonic (200 patentów).

Zobacz też

Bibliografia

Zewnętrzne linki