MPEG-4 - MPEG-4
MPEG-4 to metoda definiowania kompresji danych cyfrowych audio i wizualnych (AV). Został wprowadzony pod koniec 1998 roku i wyznaczył standard dla grupy formatów kodowania audio i wideo oraz powiązanej technologii uzgodnionej przez Grupę Ekspertów ds. Filmów ISO / IEC (MPEG) ( ISO/IEC JTC1 /SC29/WG11) w ramach formalnego standardu ISO/IEC 14496 – Kodowanie obiektów audiowizualnych . Zastosowania MPEG-4 to kompresję danych AV dla internetowego wideo i CD dystrybucji, głosu ( telefon , wideofon ) oraz transmisji telewizyjnych aplikacji. Standard MPEG-4 został opracowany przez grupę kierowaną przez Touradja Ebrahimiego (późniejszego prezesa JPEG ) i Fernando Pereirę.
Tło
MPEG-4 absorbuje wiele funkcji MPEG-1 i MPEG-2 oraz innych pokrewnych standardów, dodając nowe funkcje, takie jak (rozszerzona) obsługa VRML dla renderowania 3D, zorientowane obiektowo pliki kompozytowe (w tym obiekty audio, wideo i VRML), wsparcie dla zewnętrznie określonego Digital Rights Management oraz różnego rodzaju interaktywności. AAC (Advanced Audio Coding) został ustandaryzowany jako dodatek do MPEG-2 (jako część 7) przed wydaniem MPEG-4.
MPEG-4 jest wciąż rozwijającym się standardem i jest podzielony na kilka części. Firmy promujące kompatybilność z MPEG-4 nie zawsze jasno określają poziom kompatybilności „części”, do którego się odnoszą. Kluczowe elementy, o których należy pamiętać, to MPEG-4 Part 2 (w tym Advanced Simple Profile, używany przez kodeki takie jak DivX , Xvid , Nero Digital i 3ivx oraz QuickTime 6) oraz MPEG-4 part 10 (MPEG-4 AVC/ H .264 lub Advanced Video Coding, używany przez koder x264 , Nero Digital AVC, QuickTime 7 i nośniki wideo w wysokiej rozdzielczości, takie jak Blu-ray Disc ).
Większość funkcji zawartych w MPEG-4 pozostawia się indywidualnym programistom, którzy decydują, czy je wdrożyć. Oznacza to, że prawdopodobnie nie ma pełnej implementacji całego zestawu standardów MPEG-4. Aby temu zaradzić, standard zawiera pojęcie „profili” i „poziomów”, co pozwala na zdefiniowanie określonego zestawu możliwości w sposób odpowiedni dla podzbioru aplikacji.
Początkowo MPEG-4 był przeznaczony głównie do komunikacji wideo o niskiej przepływności ; jednak jego zakres jako standardu kodowania multimedialnego został później rozszerzony. MPEG-4 jest wydajny przy różnych szybkościach transmisji, od kilku kilobitów na sekundę do dziesiątek megabitów na sekundę. MPEG-4 zapewnia następujące funkcje:
- Poprawiona wydajność kodowania w porównaniu z MPEG-2
- Możliwość kodowania mieszanych danych multimedialnych (wideo, audio, mowa)
- Odporność na błędy umożliwiająca niezawodną transmisję
- Możliwość interakcji ze sceną audiowizualną generowaną w odbiorniku
Przegląd
MPEG-4 zapewnia szereg technologii dla programistów, różnych dostawców usług i użytkowników końcowych:
- MPEG-4 umożliwia różnym twórcom oprogramowania i sprzętu tworzenie obiektów multimedialnych o lepszych zdolnościach adaptacyjnych i elastyczności w celu poprawy jakości takich usług i technologii jak telewizja cyfrowa, grafika animowana , sieć WWW i ich rozszerzenia.
- Dostawcy sieci danych mogą używać formatu MPEG-4 w celu zapewnienia przejrzystości danych. Za pomocą standardowych procedur dane MPEG-4 mogą być interpretowane i przekształcane na inne typy sygnałów kompatybilne z dowolną dostępną siecią.
- Format MPEG-4 zapewnia użytkownikom końcowym szeroki zakres interakcji z różnymi animowanymi obiektami.
- Znormalizowana sygnalizacja zarządzania prawami cyfrowymi , znana w społeczności MPEG jako zarządzanie i ochrona własności intelektualnej (IPMP).
Format MPEG-4 może pełnić różne funkcje, między innymi:
- Multipleksuje i synchronizuje dane związane z obiektami medialnymi w taki sposób, aby mogły być efektywnie przesyłane dalej kanałami sieciowymi.
- Interakcja ze sceną audiowizualną, która powstaje z boku odbiornika.
Profile i poziomy
MPEG-4 zapewnia duży i bogaty zestaw narzędzi do kodowania. Podzbiory zestawów narzędzi MPEG-4 zostały udostępnione do użytku w określonych aplikacjach. Te podzbiory, zwane „Profilami”, ograniczają rozmiar zestawu narzędzi, który dekoder musi zaimplementować. Aby ograniczyć złożoność obliczeniową, dla każdego Profilu ustawiany jest jeden lub więcej „Poziomów”. Połączenie profilu i poziomu umożliwia:
- Konstruktor kodeków do implementacji tylko podzbioru wymaganego standardu, przy jednoczesnym zachowaniu współpracy z innymi urządzeniami MPEG-4, które implementują tę samą kombinację.
- Sprawdzanie, czy urządzenia MPEG-4 są zgodne ze standardem określanym jako test zgodności .
Części MPEG-4
MPEG-4 składa się z kilku standardów — zwanych „częściami” — w tym następujących (każda część obejmuje pewien aspekt całej specyfikacji):
Część | Numer | Pierwsza publiczna data wydania (pierwsze wydanie) | Data ostatniej publikacji (ostatnie wydanie) | Ostatnia poprawka | Tytuł | Opis |
---|---|---|---|---|---|---|
Część 1 | ISO/IEC 14496-1 | 1999 | 2010 | 2014 | Systemy | Opisuje synchronizację i multipleksację wideo i audio. Na przykład format pliku MPEG-4 wersja 1 (przestarzały przez wersję 2 zdefiniowaną w MPEG-4 część 14). Funkcjonalność stosu protokołów transportowych do przesyłania i/lub przechowywania zawartości zgodnej z normą ISO/IEC 14496 nie mieści się w zakresie 14496-1 i uwzględniany jest tylko interfejs do tej warstwy (DMIF). Informacje o transporcie zawartości MPEG-4 są zdefiniowane np. w Strumieniu transportowym MPEG-2 , profilach audio-wideo RTP i innych. |
Część 2 | ISO/IEC 14496-2 | 1999 | 2004 | 2009 | Wizualny | Format kompresji danych wizualnych (wideo, nieruchome tekstury, obrazy syntetyczne itp.). Jednym z wielu „profili” w części 2 jest Advanced Simple Profile (ASP) . |
Część 3 | ISO/IEC 14496-3 | 1999 | 2009 | 2017 | Audio | Zestaw formatów kompresji do percepcyjnego kodowania sygnałów audio, w tym niektóre odmiany zaawansowanego kodowania dźwięku (AAC), a także inne formaty i narzędzia do kodowania dźwięku/mowy (takie jak bezstratne kodowanie dźwięku (ALS), skalowalne kodowanie bezstratne (SLS), Dźwięk strukturalny , interfejs zamiany tekstu na mowę (TTSI), HVXC , CELP i inne) |
Część 4 | ISO/IEC 14496-4 | 2000 | 2004 | 2016 | Testy zgodności | Opisuje procedury testowania zgodności z innymi częściami normy. |
Część 5 | ISO/IEC 14496-5 | 2000 | 2001 | 2017 | Oprogramowanie referencyjne | Udostępnia oprogramowanie referencyjne do demonstrowania i wyjaśniania innych części normy. |
Część 6 | ISO/IEC 14496-6 | 1999 | 2000 | Dostarczanie Multimedia Integration Framework (DMIF) | ||
Część 7 | ISO/IEC TR 14496-7 | 2002 | 2004 | Zoptymalizowane oprogramowanie referencyjne do kodowania obiektów audiowizualnych | Podaje przykłady, jak tworzyć ulepszone implementacje (np. w odniesieniu do Części 5). | |
Część 8 | ISO/IEC 14496-8 | 2004 | 2004 | Przenoszenie treści ISO/IEC 14496 przez sieci IP | Określa metodę przenoszenia zawartości MPEG-4 w sieciach IP . Zawiera również wytyczne dotyczące projektowania formatów ładunku RTP , zasad użytkowania SDP do transportu informacji związanych z normą ISO/IEC 14496-1, definicji typu MIME , analizy bezpieczeństwa RTP i multiemisji . | |
Część 9 | ISO/IEC TR 14496-9 | 2004 | 2009 | Referencyjny opis sprzętu | Zawiera projekty sprzętu do demonstrowania sposobu implementacji innych części standardu. | |
Część 10 | ISO/IEC 14496-10 | 2003 | 2014 | 2016 | Zaawansowane kodowanie wideo (AVC) | Format kompresji sygnałów wideo technicznie identyczny ze standardem ITU-T H.264 . |
Część 11 | ISO/IEC 14496-11 | 2005 | 2015 | Opis sceny i silnik aplikacji | Może być używany do bogatej, interaktywnej zawartości z wieloma profilami, w tym wersjami 2D i 3D. MPEG-4 Part 11 poprawiony MPEG-4 Part 1 – ISO/IEC 14496-1:2001 i dwie poprawki do MPEG-4 Part 1. Opisuje opis poziomu systemu silnika aplikacji (dostawa, cykl życia, format i zachowanie pobieranego aplikacje z kodem bajtowym Java ) i Binary Format for Scene (BIFS) oraz Extensible MPEG-4 Textual (XMT) – tekstowa reprezentacja treści multimedialnych MPEG-4 przy użyciu XML itp. (znany również jako BIFS, XMT , MPEG-J. MPEG-J został zdefiniowany w MPEG-4 część 21) | |
Część 12 | ISO/IEC 14496-12 | 2004 | 2015 | 2017 | Bazowy format plików multimedialnych ISO | Format pliku do przechowywania treści multimedialnych opartych na czasie. Jest to ogólny format stanowiący podstawę wielu innych, bardziej specyficznych formatów plików (np. 3GP , Motion JPEG 2000 , MPEG-4 Part 14 ). Pod względem technicznym jest identyczny z normą ISO/IEC 15444-12 ( system kodowania obrazu JPEG 2000 – część 12). |
Część 13 | ISO/IEC 14496-13 | 2004 | 2004 | Rozszerzenia do zarządzania i ochrony własności intelektualnej (IPMP) | MPEG-4 Part 13 poprawił poprawkę do MPEG-4 Part 1 – ISO/IEC 14496-1:2001/Amd 3:2004. Określa wspólne przetwarzanie zarządzania i ochrony własności intelektualnej (IPMP), składnię i semantykę przenoszenia narzędzi IPMP w strumieniu bitów, przenoszenie informacji IPMP, wzajemne uwierzytelnianie narzędzi IPMP, listę organów rejestracyjnych wymaganych do obsługi zmienionych specyfikacji (np. CISAC ) itp. Zostało to zdefiniowane ze względu na brak współdziałania różnych mechanizmów ochronnych (różnych systemów DRM) do ochrony i dystrybucji treści cyfrowych chronionych prawem autorskim, takich jak muzyka czy wideo. | |
Część 14 | ISO/IEC 14496-14 | 2003 | 2003 | 2010 | Format pliku MP4 | Jest również znany jako „format pliku MPEG-4 w wersji 2”. Wyznaczony format pliku kontenera dla zawartości MPEG-4, który jest oparty na części 12. Zmienia i całkowicie zastępuje klauzulę 13 normy ISO/IEC 14496-1 (MPEG-4 część 1: Systemy), w której format pliku MPEG-4 został wcześniej określony. |
Część 15 | ISO/IEC 14496-15 | 2004 | 2017 | 2020 | Część 15: Przenoszenie wideo strukturalnego jednostki warstwy abstrakcji sieci (NAL) w podstawowym formacie pliku multimedialnego ISO | Do przechowywania wideo z części 10. Format pliku jest oparty na części 12, ale umożliwia również przechowywanie w innych formatach plików. |
Część 16 | ISO/IEC 14496-16 | 2004 | 2011 | 2016 | Rozszerzenie ram animacji (AFX) | Określa model MPEG-4 Animation Framework eXtension (AFX) do reprezentacji zawartości grafiki 3D. MPEG-4 został rozszerzony o syntetyczne obiekty wyższego poziomu do określania geometrii, tekstury, animacji i dedykowanych algorytmów kompresji. |
Część 17 | ISO/IEC 14496-17 | 2006 | 2006 | Strumieniowy format tekstu | Format napisów Timed Text | |
Część 18 | ISO/IEC 14496-18 | 2004 | 2004 | 2014 | Kompresja czcionek i przesyłanie strumieniowe | Dla otwartego formatu czcionki zdefiniowanego w części 22. |
Część 19 | ISO/IEC 14496-19 | 2004 | 2004 | Zsyntetyzowany strumień tekstur | Strumienie zsyntetyzowanych tekstur są używane do tworzenia syntetycznych klipów wideo o bardzo niskiej przepływności. | |
Część 20 | ISO/IEC 14496-20 | 2006 | 2008 | 2010 | Lekka reprezentacja sceny aplikacji (LASeR) i prosty format agregacji (SAF) | Wymagania LASeR (wydajność kompresji, kod i zużycie pamięci) są spełniane przez budowanie na istniejącym formacie Scalable Vector Graphics (SVG) zdefiniowanym przez konsorcjum World Wide Web. |
Część 21 | ISO/IEC 14496-21 | 2006 | 2006 | Rozszerzenia struktury graficznej MPEG-J (GFX) | Opisuje lekkie środowisko programistyczne dla zaawansowanych interaktywnych aplikacji multimedialnych — platformę, która łączy podzbiór standardowego środowiska aplikacji Java (MPEG-J) z interfejsem API Java . (na etapie "FCD" w lipcu 2005, FDIS styczeń 2006, opublikowana jako norma ISO 22.11.2006). | |
Część 22 | ISO/IEC 14496-22 | 2007 | 2015 | 2017 | Otwórz format czcionki | OFFS opiera się na specyfikacji formatu czcionki OpenType w wersji 1.4 i jest technicznie równoważna tej specyfikacji. Osiągnął etap "CD" w lipcu 2005 roku, opublikowany jako norma ISO w 2007 roku |
Część 23 | ISO/IEC 14496-23 | 2008 | 2008 | Symboliczna Reprezentacja Muzyki (SMR) | Osiągnięty etap „FCD” w październiku 2006, opublikowany jako norma ISO 28.01.2008 | |
Część 24 | ISO/IEC TR 14496-24 | 2008 | 2008 | Interakcja audio i systemów | Opisuje pożądane wspólne zachowanie formatu plików MPEG-4 i dźwięku MPEG-4. | |
Część 25 | ISO/IEC 14496-25 | 2009 | 2011 | Model kompresji grafiki 3D | Definiuje model łączenia narzędzi kompresji grafiki 3D zdefiniowanych w standardach MPEG-4 z prymitywami graficznymi zdefiniowanymi w dowolnym innym standardzie lub specyfikacji. | |
Część 26 | ISO/IEC 14496-26 | 2010 | 2010 | 2016 | Zgodność dźwięku | |
Część 27 | ISO/IEC 14496-27 | 2009 | 2009 | 2015 | Zgodność grafiki 3D | Zgodność grafiki 3D podsumowuje wymagania, łączy je z charakterystykami i określa, w jaki sposób można testować zgodność z nimi. Podano wytyczne dotyczące konstruowania testów w celu weryfikacji zgodności dekodera. |
Część 28 | ISO/IEC 14496-28 | 2012 | 2012 | Reprezentacja czcionki kompozytowej | ||
Część 29 | ISO/IEC 14496-29 | 2014 | 2015 | Kodowanie wideo w sieci | Tekst części 29 pochodzi z części 10 - ISO/IEC 14496-10. Internetowe kodowanie wideo to technologia zgodna z profilem ograniczonej linii bazowej normy ISO/IEC 14496-10 (podzbiór określony w załączniku A dla ograniczonych linii bazowych jest specyfikacją normatywną, podczas gdy wszystkie pozostałe części mają charakter informacyjny). | |
Część 30 | ISO/IEC 14496-30 | 2014 | 2014 | Czasowy tekst i inne nakładki wizualne w podstawowym formacie plików multimedialnych ISO | Opisuje przenoszenie niektórych form czasowych strumieni tekstu i napisów w plikach w oparciu o ISO/IEC 14496-12 - W3C Timed Text Markup Language 1.0, W3C WebVTT (Web Video Text Tracks). Dokumentacja tych formularzy nie wyklucza innej definicji przewozu czasowego tekstu lub napisów; patrz na przykład 3GPP Timed Text (3GPP TS 26.245). | |
Część 31 | ISO/IEC 14496-31 | W przygotowaniu (2018-05) | Kodowanie wideo dla przeglądarek | Kodowanie wideo dla przeglądarek (VCB) - technologia kompresji wideo przeznaczona do użytku w przeglądarce WWW | ||
Część 32 | ISO/IEC CD 14496-32 | W budowie | Oprogramowanie zgodności i odniesienia | |||
Część 33 | ISO/IEC FDIS 14496-33 | W budowie | Internetowe kodowanie wideo |
Profile są również definiowane w ramach poszczególnych „części”, więc implementacja części zwykle nie jest implementacją całej części.
MPEG-1 , MPEG-2 , MPEG-7 i MPEG-21 to inne zestawy standardów MPEG.
Poziomy MPEG-4
Niskie poziomy profilu są częścią ograniczeń kodowania/dekodowania wideo MPEG-4 i są kompatybilne ze starszym standardem ITU H.261, również kompatybilne z wcześniejszymi standardami telewizji analogowej do nadawania i nagrywania (takimi jak NTSC lub PAL). Profil ASP na najwyższym poziomie jest odpowiedni dla większości zwykłych nośników DVD i odtwarzaczy lub dla wielu witryn wideo online, ale nie dla nagrań Blu-ray lub treści wideo HD online.
Profil | Poziom | Maks. bufor |
Maks. szybkość transmisji |
Maks. opóźnienie |
Maks. Rozmiar
wiceprezesa |
Maks. Rozmiar
VOP |
Maks. szybkość
dekodera |
Maks. rozmiar ramki | ||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
@ maks. szybkość transmisji |
@ 30 Hz | @ 25 Hz | @ 24 Hz | @ 15 Hz | @ 12,5 Hz | |||||||
SP | L0 | 160 | 64 | 2,50 | 2048 | 99 | 1485 | — | QCIF (176×144) | |||
L0b | 320 | 128 | ||||||||||
L1 | 160 | 64 | 128×96 | 144×96 | 160×96 | |||||||
L2 | 640 | 128 | 5,00 | 4096 | 396 | 5940 | 256×192 | 304×192, 288×208 | 304×208 | CIF (352×288) | ||
L3 | 384 | 1,66 | 8192 | 11 880 | CIF (352×288) | |||||||
L4a | 1280 | 4000 | 0,32 | 16 384 | 1200 | 36 000 | VGA (640×480) | |||||
L5 | 1,792 | 8000 | 0,22 | 1620 | 40 500 | D1 NTSC (720×480) | D1 PAL (720×576) | |||||
L6 | 3968 | 12.000 | 0,33 | 3600 | 108 000 | 720p (1280x720) | ||||||
ŻMIJA | L0 | 160 | 128 | 1,25 | 2048 | 99 | 2970 | QCIF (176×144) | ||||
L1 | ||||||||||||
L2 | 640 | 384 | 1,66 | 4096 | 396 | 5940 | 256×192 | 304×192, 288×208 | 304×208 | CIF (352×288) | ||
L3 | 768 | 0,86 | 11 880 | CIF (352×288) | ||||||||
L3b | 1,040 | 1500 | 0,69 | |||||||||
L4 | 1280 | 3000 | 0,43 | 8192 | 792 | 23760 | 352×576, 704×288 | |||||
L5 | 1,792 | 8000 | 0,22 | 16 384 | 1620 | 48 600 | 720×576 | |||||
Jednostki | kbit | kbit/s | sekundy | bity | makrobloki | makrobloki/s | piksele |
Bardziej zaawansowane profile dla multimediów HD zostały zdefiniowane później w profilu AVC, który jest funkcjonalnie identyczny ze standardem ITU H.264, ale jest teraz również zintegrowany z MPEG-4 Part 10 ( lista znajduje się w sekcji H.264/MPEG-4 AVC zdefiniowanych poziomów w tym profilu AVC).
Koncesjonowanie
MPEG-4 zawiera opatentowane technologie, których użycie wymaga licencji w krajach uznających patenty algorytmów oprogramowania . Ponad dwadzieścia firm twierdzi, że posiada patenty na MPEG-4. MPEG LA licencjonuje patenty wymagane dla MPEG-4 Part 2 Visual od wielu firm (audio jest licencjonowane oddzielnie) i wymienia wszystkich swoich licencjodawców i licencjobiorców na stronie. Nowe licencje na patenty systemu MPEG-4 są w trakcie opracowywania i nie są oferowane żadne nowe licencje, podczas gdy posiadacze starej licencji na system MPEG-4 są nadal objęci warunkami tej licencji dla wymienionych patentów ( MPEG LA – Lista patentów ).
Większość patentów wykorzystywanych do formatu MPEG-4 Visual należy do trzech japońskich firm: Mitsubishi Electric (255 patentów), Hitachi (206 patentów) i Panasonic (200 patentów).
Zobacz też
Bibliografia
Zewnętrzne linki
- Przegląd standardu MPEG-4 na oficjalnej stronie MPEG
- MPEG Industry Forum (MPEGIF) Strona MPEG-4 pod adresem archive.today (archiwum 22.10.2012)
- MPEG Industry Forum (MPEGIF) Biała księga MPEG-4 w archiwum internetowym Biblioteki Kongresu (zarchiwizowane 08.01.2010)
- JM MPEG-4 AVC/kod referencyjny H.264
- OpenIPMP: Projekt Open Source DRM dla MPEG-4