В якому форматі краще слухати музику. Три кити lossy


Розібратися в цифрових аудіоформатах зовсім не просто. Зробити однозначний висновок, в якому саме форматі краще слухати музику, і того складніше. Якщо подивитися порівняльну таблицю аудіоформатів в «Вікіпедії», в очах почне рябіти від стовпчиків мовчазних цифр. Спробуємо розібратися, що за цим стоїть.


Відразу обмовимося, що стаття говорить ТІЛЬКИ про загальні характеристики і не буде включати в себе деякі подробиці. Спробуємо узагальнити вже так чи інакше відомий досвід.

Є аналог і цифра.

Аналог - добре, але недовговічне і незручно. Тому аналогові носії, незважаючи на високі продажі вінілу, не повернуться.

Аудіоціфра може бути трьох основних типів:

  • у форматі, що не використовує стиск;
  • у форматі, що використовує стиснення без втрат (lossless);
  • у форматі, що використовує стиснення з втратами (lossy).

На перший погляд, більш перспективні формати, що використовують стиснення без втрат. Це не завжди так. Формати без стиснення не мають будь-якого сенсу, крім зберігання майстер-записів, необхідних при створенні аудіоконтенту. Вони легше піддаються відновленню. Для зберігання і прослуховування домашніх записів зайві.

З безлічі параметрів цифрового аудіо користувача в першу чергу повинні хвилювати частота дискретизації (точність оцифровки аналогового сигналу за часом), розрядність (точність оцифровки за амплітудою - гучності), бітрейт (кількість інформації яка міститься у файлі в перерахунку на секунду).

Сьогодні поговоримо про lossy.

Для стислого звуку дуже важливо поняття психоакустичної моделі - уявлення вчених та інженерів про те, як людина сприймає звук. Вухо сприймає весь спектр акустичних хвиль, які надходять до нього. Однак обробляє сигнали мозок.
Довідкова величина чутного людиною діапазону становить від 16 Гц до 20 кГц, але одночасно чути і усвідомлювати всі звуки, що надходять він не здатний.
Слух дискретний, і його звукова сприйнятливість нелінійна.

Сучасні психоакустические моделі досить точно оцінюють людський слух і постійно поліпшуються. На ділі, незважаючи на запевнення любителів музики, музикантів і аудиофилов, для середньостатистичного нетренованого слуху первісний вигляд MP3 в максимальній якості став гранично сприйманим. Винятки є, їх не може не бути. Але вони не завжди легко помітні при сліпому прослуховуванні.

Формати, що використовують психоакустические моделі стиснення

Таких форматів для стиснення аудіо з втратами досить багато. Найбільш поширені сьогодні наступні.

OGG (Vorbis)

Взагалі, файл з розширенням *.ogg є «контейнером»: всередині можуть знаходитися декілька звукових записів з власними тегами і характеристиками. Найчастіше збережені в ньому файли стискаються кодеком Ogg Vorbis, хоча можуть використовуватися й інші, у тому числі MP3 або FLAC.

У якості його основних переваг варто назвати великий діапазон можливих параметрів при кодуванні: частота дискретизації звуку може досягати 192 кГц, розрядність - 32 біта. За замовчуванням OGG використовує змінний бітрейт (хоча при відображенні властивостей це не вказується), який може досягати 1000 кбіт/с.

MP3

На відміну від вільного OGG, MP3 розроблений дуже важливим для сучасної акустики Товариством Фраунгофера - об'єднанням інститутів прикладних досліджень Німеччини. У середовищі аудиофилов, до речі, це вкрай шановна контора, щоправда, визнаватися вони в цьому не люблять. Але за їх розробками пильно стежать.

На відміну від OGG, може володіти як змінним (VBR), так і постійним бітрейтом (CBR). До речі, саме завдяки MP3 виявилося, що не всякий запис може бути якісно кодований із змінним бітрейтом (причини дивіться вище, алгоритми кодування і їх результати в даному випадку можуть бути різні при кодуванні одного і того ж джерела).

Через похилий вік MP3 має значні обмеження: розрядність може бути 16-24 біта, частота дискретизації виражається тільки в дискретних значеннях (8, 11,025, 12, 16, 22,05, 24, 32, 44,1, 48), бітрейт обмежений 320 кбіт/с. До того ж у звичайній версії MP3 число каналів обмежена двома.

AAC

Ті ж граблі, тільки в профіль. Теж розробка Товариства Фраунгофера. Пізніша і використовує іншу психоакустичної модель, більш сучасну. Загальнодоступна інформація дозволяє зробити висновок: так, їм вдалося поліпшити власне творіння.

Навіть якщо спиратися на найпростіші цифри, AAC - більш гнучкий формат. Розрядність файлів, отриманих за допомогою цієї розробки, становить від 16 до 24, частота дискретизації теж при бажанні дозволить не втратити звукової картини і лежить в діапазоні 8-192 кГц. Потік даних взагалі наближається до 512 кбіт / с, при тому що максимальне число каналів AAC-файлів сягає 48.

Який формат варто назвати однозначно кращим

Якщо врахувати, що AAC - переосмислений через десяток років MP3, то вибір на його користь. При бажанні має сенс порівнювати тільки MP3 і OGG. Давайте подивимося на картинки, зроблені шановним Андрієм Аспідовим з ixbt.com:


На графіках - хороший AudioCD, стислий OGG зі змінним бітрейтом 350 кбіт / с і MP3 з використанням Lame. Чим нижче розташовується графік, тим ближче звучання до оригіналу. Виходить дуже цікава картина. Незважаючи на те, що MP3 володіє явно зрізаними високими частотами, на відміну від OGG, в якому видно завал нижче 2 кГц.


Частотно-часовий розподіл звуку говорить про не менш цікаві речі. При постійному бітрейті 320 кбіт/с MP3 майже збігається з оригінальною записом. Здається, тепер все встає на свої місця. Але... Насправді все ще більше заплутується.

Навіщо взагалі користуватися lossy, коли є доступний lossless

Здоровий глузд.

Справа в тому, що більша частина аналогових записів не містить тієї кількості інформації, яке необхідно було б зберігати у високоякісних форматах. Не варто забувати, що рідною частотою дискретизації для CD є 44,1 кГц, квантування - всього 16 біт.

Попередні графіки непогано демонструють високу точність передачі MP3. Але ж для аудіокасети, магнітної стрічки (якщо, звичайно, це не майстер-тейп) характеристики AudioCD недосяжні. Та й для масового студійного обладнання можливість запису аналогового звуку, відповідного AudioCD, з'явилася відносно недавно. Немає ніякого сенсу оцифровувати під FLAC (і тим більше в WAV) концертний запис або пластинку з доцифрових часів. Вони не містять тих спектрів і тієї кількості інформації, які можуть зберігати контейнери без стиснення.

Що змінилося сьогодні

Рідкісний звукорежисер робить цифровий майстер-запис (з яким потім проводиться розмноження на фізичні носії), використовуючи сучасні технології на повну котушку. Тому шанс того, що 24-бітний трек насправді всього лише 16-бітний, вкрай високий.

Аналоговий високоякісний запис на високоякісному обладнанні сьогодні зустріти ще складніше - якщо тільки у фанатів подібного звучання. Таким, наприклад, є Джек Уайт, екс-лідер групи White Stripes. При цьому частина його записів відноситься до варіацій lo-fi, і шукати там позамежні звукові характеристики доріжки стає своєрідним задоволенням для гурманів.

Якщо уявити собі ідеальне джерело звуку, то тільки тренований слух або прослуховування на якісному аудіообладнання дозволить знайти стислий файл. І вже спираючись на це (і не забуваючи про сприйняття), варто зробити наступний висновок:
Необхідним і достатнім для середньоцінового обладнання є AAC, за відсутності якого (і за відсутності початкових кодів, які можна кодувати в AAC) - MP3 з постійним бітрейтом 320 кбіт / с, створений за допомогою кодека Lame 3.93 (рекомендовані ключі при декодуванні: -cbr -b320 -q0 -k -ms).
Виняток становлять записи, спочатку отримані у високій якості, скажімо, записані на DVD-Audio, SACD, або записи, спочатку зібрані в DSD (або аналогічному форматі) з високим бітрейтом.

Хоча деякі особливості у lossless є. І про них ми розповімо наступного разу.

Джерело статті.

Немає коментарів:

Дописати коментар

Related Posts Plugin for WordPress, Blogger...