Biznes Ludzie Pieniądze

Jak snobizm i piractwo uratowały MP3

Wojciech Orliński
18.07.2011 , aktualizacja: 23.07.2011 19:06
A A A Drukuj
W roku 1998 twórcy MP3 przestraszyli się, że ich wynalazek przyczyni się do zagłady ludzkości. W tym roku w rankingu słów najczęściej wypisywanych w wyszukiwarkach "mp3" wysunęło się na pierwsze miejsce, spychając na drugie "sex".
Odtwarzacze MP3/MP4
Zdjęcie: materiały prasowe, Shuterstock
Odtwarzacze MP3/MP4
W pierwszej części opisywaliśmy, jak niemieccy naukowcy zabrali się do prac nad tym, co dziś nazywamy MP3. Opowieść urwaliśmy latem 1991 - gdy dokładnie 20 lat temu projekt zawisnął na włosku...

Instytut Fraunhoffera to wprawdzie organizacja typu non profit, ale nie może przynosić strat. Projekty bez komercyjnej przyszłości są likwidowane, by zaoszczędzić pieniądze na rozwijanie czegoś, co zainteresuje biznes lub przemysł.

Rozwijanie MP3 miałoby sens tylko wtedy, gdyby ten sposób kodowania dźwięku stał się powszechnie przyjętym standardem, dzięki czemu Instytut mógłby zarabiać na udostępnianiu swoich patentów. Tak się stało w rzeczywistości. Do tego warunkiem było jednak powodzenie prezentacji zaplanowanej na jesień 1991 na forum międzynarodowej organizacji standardów ISO w Hanowerze.

Latem 1991 Karlheinz Brandenburg, główny twórca algorytmu MP3, miał już gotowe jego założenia teoretyczne - ale prototypowe urządzenia, budowane zgodnie z tymi założeniami przez inżyniera Haralda Poppa z wykorzystaniem bardzo wtedy nowoczesnych procesorów Motorola 56000, działały źle.

- To było tak, jakbyśmy zmarnowali całe pięć lat poszukiwań - wspomina Brandenburg - dźwięk był nieczysty, pełen obcych szumów i trzasków. Brzmiało to gorzej od pierwszych eksperymentów z początków pracy nad moim doktoratem. Wiedzieliśmy, że gdzieś musi być błąd, ale nie mieliśmy pojęcia gdzie.

- Skąd wiedzieliście, że nie ma go w samym algorytmie? - pytam. - Przecież jeśli doświadczenie przeczy teorii, odrzuca się teorię.

Profesor kręci głową z uśmiechem, jakby usłyszał niemądrą odpowiedź od studenta.

- To tak nie działa. Gdyby odrzucić tą teorię, trzeba by odrzucić całą psychoakustykę. Ta teoria nie miała prawa być błędna. Błąd musiał być gdzieś w doświadczeniu i na szukaniu go spędziliśmy całe lato i wczesną jesień 1991. Na szczęście znaleźliśmy błąd w sam raz, żeby zdążyć na prezentację w Hanowerze.

Pierwszym podejrzanym wydawały się konstrukcje budowane przez Poppa. Może szumy i trzaski powodował jakiś zły układ? Ale wymieniano jeden na drugi, a zły efekt się powtarzał. To nie mogła być przyczyna.

Dr Bernhard Grill, jeden ze współpracowników ekipy, zaczął się wpatrywać w kod wynikowy kompilatora. Dla programisty to wyraz desperacji.

Chodzi o to, że komputery "myślą" zerami i jedynkami. Programiści rzadko z tym mają do czynienia, piszą swoje programy w specjalnych "językach programowania", takich jak Fortran, Pascal albo C. Specjalny program, nazywany kompilatorem, zamienia napisany przez człowieka "kod źródłowy" np. w języku C na "kod wynikowy", zawierający zera i jedynki.

Dla człowieka te zera i jedynki są niezrozumiałe, choć oczywiście doświadczony programista może o sobie powiedzieć jak jeden z bohaterów filmu "Matrix": "Dla innych to niezrozumiałe, a ja tu widzę blondynki, brunetki, rude...".

Grill pracował nad oprogramowaniem dźwiękowym, więc w zerach i jedynkach widział, metaforycznie mówiąc, nutki na pięciolinii. I wpatrując się w ten kod, odkrył błąd: procesor 56000 był tak nowy, że kompilator był zbyt słabo przetestowany. Co jakiś czas pewien bit przybierał losową wartość - był zerem lub jedynką wybraną całkiem od czapy.

Dla zainteresowanych informatyką dokładniejsze wyjaśnienie: losowy był najmniejszy bit w konwersji 24-bitowych liczb zmiennoprzecinkowych (56000 miał arytmetykę stałoprzecinkową - rzecz się dzieje w czasach, w których trzeba było dokupować tzw. koprocesor arytmetyczny, jeśli się robiło na komputerze dużo obliczeń). Dlatego zresztą nikt tego wcześniej nie zauważył, większość programów działała zupełnie normalnie.

Nie było czasu czekać na nowy kompilator - naukowcy poprawili kod ręcznie. I jesienią 1991 z głośników zabrzmiał krystalicznie czysty głos Susan Vega śpiewającej a capella piosenkę "Tom's Diner".

***

Dlaczego właśnie ta? - pytam.

- Piosenka była dość popularna, kiedy kończyłem doktorat - wyjaśnia prof. Brandenburg. - Wciąż ją można było wtedy usłyszeć w radiu. Przeczytałem w czasopiśmie "High Fidelity", że używają jej sprzedawcy zestawów stereo z górnej półki do sprawdzania, czy zestaw jest wart swojej ceny. Od razu zrozumiałem dlaczego: Vega ma wyjątkowo bogaty głos, w którym słychać wszystkie harmoniczne częstotliwości. Zrobiłem eksperyment na swoim komputerze i rzeczywiście, komputer się zapchał, kodując jej głos.

Jak to, "zapchał?"

- Proszę to sobie wyobrazić tak: normalnie w chwili próbkowania komputer zapisuje stan dźwięku i mówi "chodźmy dalej". W przypadku głosu Susan Vega woła: chwileczkę, jeszcze nie skończyłem notować, dajcie mi więcej czasu! Mówiąc bardziej fachowo, porcja kilobitów, która miała wystarczyć na całą sekundę - kończy się nam na przykład po pół sekundy. Dlatego włączyłem płytę z tą piosenką do zestawu "najtrudniejszych przypadków", na którym testowałem kolejne algorytmy. Ponadto testowałem je na innych wykonawcach, których po prostu lubię, jak Pink Floyd, Jimi Hendrix czy Tracy Chapman.

Podziel się

  • Kup licencję
  • Ocena:

    • słabe
    • nic specjalnego
    • dobre
    • bardzo dobre
    • znakomite

    42 głosy