Przeskocz do treści

Delta mi!

Bestiariusz informatyczny

Formaty danych, dokumentów, multimediów

Tomasz Idziaszek

o artykule ...

  • Publikacja w Delcie: luty 2018
  • Publikacja elektroniczna: 1 lutego 2018
  • Wersja do druku [application/pdf]: (34 KB)

Po długiej przerwie wracamy z przeglądem informatycznej terminologii. Trzeci odcinek bestiariusza dotyczyć będzie akronimów związanych z formatami danych dla dokumentów i multimediów.

obrazek

Najprostszy rodzaj informacji, które możemy zapisać w pamięci komputera, to po prostu dane numeryczne lub tekstowe. Powstały w latach 60. standard kodowania znaków za pomocą ciągów bitów zwany ASCII (American Standard Code for Information Interchange) do dziś stanowi podstawę bardziej skomplikowanych kodowań, takich jak UTF-8 (Unicode Transformation Format 8-bit). W pliku tekstowym można przechować też bardziej strukturalne dane, np. tabelę z arkusza kalkulacyjnego możemy zapisać w formacie tekstowym CSV (Comma-Separated Values), w którym jeden wiersz pliku odpowiada jednemu wierszowi tabeli, a poszczególne komórki oddzielone są przecinkami. Inne popularne formaty tekstowe, które z kolei strukturalizują dane w formie drzewiastej, to XML (Extensible Markup Language) oraz JSON (JavaScript Object Notation).

Format tekstowy ma tę zaletę, że jest zwykle prosty i czytelny dla człowieka. Nie nadaje się jednak do przechowywania danych takich, jak zdjęcia czy nagrania dźwiękowe, dla których używamy formatów nietekstowych (binarnych). Obecnie najbardziej rozpowszechnionymi formatami plików graficznych są JPEG (Joint Photographic Experts Group) dla zdjęć oraz PNG (Portable Network Graphics) dla pozostałych grafik rastrowych. Aby zmniejszyć rozmiar plików, wykorzystuje się w nich różne algorytmy kompresji, począwszy od prostej techniki skracania długich fragmentów zawierających te same ciągi bitów RLE (Run-Length Encoding), aż po skomplikowane algorytmy fraktalne. Co ciekawe, format PNG został stworzony, aby zastąpić popularny w Internecie format GIF (Graphics Interchange Format), który, niestety, obarczony był patentem na wykorzystywany w nim algorytm kompresji słownikowej LZW (Lempel-Ziv-Welch).

Przykładami formatów do grafiki wektorowej (w której obraz opisuje się za pomocą krzywych matematycznych, a nie tablicy pikseli) jest tekstowy format SVG (Scalable Vector Graphics) oraz swego czasu bardzo popularny format internetowych animacji SWF (ShockWave Flash). Wektorowe dane są również wykorzystywane w plikach z krojami pisma, np. TTF (TrueType Font). Z kolei w branży wydawniczej DTP (DeskTop Publishing) standardem dla grafik jest format TIFF (Tagged Image File Format), natomiast do opisu stron publikacji używa się języka programowania PS (PostScript) lub powszechnego formatu do wymiany dokumentów PDF (Portable Document Format).

Formaty plików dźwiękowych i filmowych również mają swoje akronimy. Dla dźwięku są to przykładowo MP3 (MPEG |−1 Audio Layer III), AAC (Advanced Audio Coding) i format kompresji bezstratnej FLAC (Free Lossless Audio Codec). Formaty wideo standaryzowane w ramach grupy MPEG (Moving Picture Experts Group) mają tak urocze nazwy jak H.264/AVC (Advanced Video Coding) lub H.265/HEVC (High Efficiency Video Coding). Z kolei standard do przesyłania danych pomiędzy cyfrowymi instrumentami muzycznymi a komputerem MIDI (Musical Instrument Digital Interface) dał też nazwę zapomnianym już plikom muzycznym zawierającym jedynie odpowiednik zapisu nutowego.

Duże rozmiary danych multimedialnych spowodowały konieczność wynalezienia dla nich odpowiednio pojemnych nośników. Były to CD-ROM (Compact Disc Read-Only Memory), a później DVD (początkowo Digital Video Disc, obecnie Digital Versatile Disc), ostatecznie oba zastąpione cyfrową dystrybucją w Internecie. W dobie nieskrępowanej wymiany informacji producenci filmów i gier próbują zabezpieczyć swoje cyfrowe produkty przed kopiowaniem za pomocą różnego rodzaju mechanizmów znanych pod ogólną nazwą DRM (Digital Rights Management); dla przykładu jedną z metod szyfrowania stosowaną na płytach DVD jest CSS (Content Scramble System). Z kolei transmisja cyfrowych multimediów między urządzeniami korzysta z interfejsu HDMI (High-Definition Multimedia Interface).

Chęć przesyłania nietekstowych danych pocztą elektroniczną spowodowała konieczność standaryzacji listy formatów danych. Taką rolę spełnił MIME (Multipurpose Internet Mail Extensions), obecnie wykorzystywany również przez inne protokoły internetowe.