О цифровых аудио форматах

omel · 14.10.2010, 10:54

История развития цифровых аудио форматов уходит своими корнями в далекое прошлое.
Когда по нашему шарику, еще тепленькому, ходили мамонты, а затем слоны... Но, как говориться, "повезло с ушами - да характер вспыльчивый". А если серьезно, то книжка с толковым описанием форматов занимает примерно 200 листов текста с множеством графиков и картинок… невеселых

Попробуем разобраться на пальцах. Одним из основных параметров в цифровой записи является частота дискретизации сигналов (Fs). По теореме Котельникова частота выборки должна быть вдвое выше записываемой полосы и в 1985 году было предложено три стандартных частоты выборки (дискретизации), которые в зависимости от полосы записи распределились так:
- 32кГц, 48кГц- DAT (Digital Audio Tape);
- 44,1кГц - компакт–диск.

Разница в частотах объясняется тем, что на заре рождения форматов бытовало мнение, что разнесением частот и соответственно несовместимостью форматов можно бороться с пиратством. Чтобы, например, нельзя было с компакт диска сделать прямую перезапись на DAT. Время расставило все по местам – стало понятным, что совместимость форматов приносит больше прибыли, чем борьба с пиратством, но неразбериха была узаконена. Позже появился более современный PCM формат - DVD – Audio, который благодаря подтянувшейся технологии изготовления чипов смог позволить себе повышенные частоты выборок 48 (удвоенные 96 или учетверенные 192) кГц.

Если с точки зрения полосы сигнала информативна частота дискретизации – то за динамический диапазон и нелинейные искажения несут персональную ответственность число битов в кадре (frame), величина которого кратна 16. Цифра 16 – тоже исторически сложившаяся величина и отражала уровень развития схемотехники на время появление стандарта. Введение дополнительного количества битов (до 24) заставил кадр расположиться на двух стульях, и теперь он занимает 2*16=32 бита. Избыточное количество битов в кадре (32-24=8) маскируется или другими словами, «выбрасывается в пропасть».
Но вернемся к процессу записи (для удобства остановимся на двух основных). Оцифровка сигнала осуществляется с применением параллельного кода (PCM – Pulse Code Modulation), и последовательного (DSD - Direct Stream Digital) кода и в таком виде пишется на носитель (в нашем случае компакт – диск).
Ремарка: шикарный способ фазовой модуляции для кодировки звука, но дальше Hi-Fi стерео в видеомагнитофонах продолжения пока не имеет, надеюсь пока.

Оба стандарта довольно «пожилые». И если стандарт ИКМ например у всех на слуху, особенно у телефонистов, то второй, не что иное, как ШИМ – модуляция. Последнее согреет душу всем разработчикам импульсных источников вторичного электропитания. Просто у них задача обратная - не создавать синусоиду, а подавлять.
Иллюстрация ШИМ–кодера приведена внизу и у многих вызовет ностальгию воспоминаниями об усилителях, работающих в классе “D” и полевых транзисторах на которых (и только) можно было реализовать этот принцип. Но об этом чуть позже.

Многие мастер - копии записаны именно в последовательном коде, что немаловажно. Поэтому фирма SONY, которая является одновременно звукозаписывающим концерном и владельцем (вместе с “PHILIPS”) авторских прав на стандарт CD предложила уйти от преобразования в параллельный код и предложила развивать формат DSD, который имеет ряд неоспоримых схемотехнических преимуществ перед PCM – преобразованием. Линейка этой техники получила название SACD (Super Audio CD).
В чем перспектива этих форматов?

Понятно, что PCM может двигаться в двух направлениях:
-увеличение количества битов (что и видим в спецификациях до 24, что близко к теоретическому максимальному динамическому диапазону);
- увеличение частоты выборки до 192кГц;
Что собственно и сделано в формате DVD –Audio, который, по сути, и не является новым стандартом, а всего лишь развитием PCM.
Какие плюсы имеет DVD –Audio?
Начнем со стандартных уже 24 бит.
Реализовать увеличение динамического диапазона за счет увеличения числа битов, довольно сложно начиная уже с момента записи.

Слабо представляю себе, сколько может стоить студия звукозаписи со 100дБ динамическим диапазоном. Да и писаться в ней сможет только английская королева с Майклом Джексоном и сэром Полом.
Другое дело частота дискретизации. Ее повышение требует всего лишь смены парка звукозаписывающей техники в части оцифровки сигнала, что в принципе несложно. Размеры файлов при этом возрастаю примерно в 4 раза. Так ведь эту емкость перекрывает DVD диск, стоимость которого не намного выше стандартного компакт – диска, поэтому непонятно почему так тяжело «подымается» этот формат. А ведь плюсы увеличения Fs заметно ощутимы.

"Виновник" появления цифровой записи Котельников был прав говоря об достаточности удвоенной частоты выборки для процесса перевода «аналог – цифра», но обратный процесс «цифра – аналог» на краю полосы (22кГц) требует не 2 – кратной, а изначально 8 кратной выборки.

2-кратное (44кГц) же преобразование вносит дикие искажения в высокочастотный сигнал. А «исправляются» эти искажения при помощи цифровой фильтрации методом многократной (8 и даже 16 раз) передискретизации. Отсюда и желание многих разработчиков от нее избавиться. Но сделать этого корректно в рамках частоты 44кГц, как по мне, вряд ли возможно, потому, как не хватает начальной информации.

К сожалению, на этапе воспроизведения при повышенном разрешении не все так гладко.
Отвечать требованиям стандарта 24*192 и бюджетным ограничениям можно только применяя Дельта-сигма преобразование. При этом в плеерах применяются недорогие чипы, поскольку работает принцип: «в спецификации написано 24*192 – что тебе еще надо?».

Если же идти путем построения тракта по принципу R-2R, (который отвечает требованиям качественного звуковоспроизведения) то стоимость только микросхем цифрового тракта заметно превысит бюджет среднеценового DVD изделия в целом. И получается, замкнутый круг: формат не развивается, потому, что нет покупательского спроса (моды), а спроса нет, потому, что парк DVD - плееров и фонотека, мягко говоря, не соответствуют возможностям самого DVD – Audio и как следствие, не дают прибавки в качестве и вызывают законный вопрос: «А ради чего, собственно?».

omel · 14.10.2010, 10:59

Частота дискретизации 44 кГц - это много или мало?
Чем компьютерный WT-синтезатор отличается от обычного клавишного?
Можно ли компьютерной картой заменить профессиональную студию?

Принцип представления звука в цифровой форме предполагает уничтожение какой-то части информации в нем. Исходная, непрерывная кривая, описывающая амплитуду звуковой волны, подвергается дискретизации - разбиению на отдельные интервалы (отсчеты), внутри которых амплитуда считается постоянной; таким образом фиксируются временные характеристики волны. Затем эти мгновенные значения амплитуды еще раз разбиваются на конечное число значений - теперь уже по самой величине амплитуды - и выбирается наиболее близкое из этих дискретных значений; так фиксируются амплитудные характеристики. Если говорить по отношению к графику (осциллограмме) звуковой волны, то можно сказать, что на него накладывается некая сетка - крупная или мелкая, которая определяет точность преобразования волны в цифровую форму. Мелкость временной сетки - частота дискретизации - определяет прежде всего частотный диапазон преобразуемого звука.

В идеальных условиях для передачи сигнала с верхней частотой F достаточно частоты дискретизации 2F, в реальных же, приходится выбирать некоторый запас. Точность же представления самих значений амплитуды - разрядность отсчетов - определяет в первую очередь уровень шумов и искажений, вносимых при преобразовании. Естественно - снова для идеального случая, поскольку шумы и искажения вносятся и другими участками схемы. В начале 80-х, когда разрабатывалась система "компакт-диск", ориентированная для бытового применения, по результатам экспертных оценок была выбрана частота дискретизации 44.1 кГц и разрядность отсчета 16 бит (65536 фиксированных уровней амплитуды).
Этих параметров достаточно для точной передачи сигналов с частотой до 22 кГц, в которые вносится дополнительный шум на уровне примерно -96 дБ. На уровне бытовой аппаратуры конца 70-х эти параметры выглядели довольно заманчиво - тем более, что акустических систем, способных более-менее точно передать звук с такими параметрами, тогда практически не существовало. В студийной работе использовалась та же разрядность отсчета при частоте дискретизации 48 кГц, что в то время считалось вполне достаточным. За прошедшее время ситуация сильно изменилась - значительно возросло качество передачи звука в студийных и бытовых системах, снова вошли в моду ламповые усилители и схемы, когда-то признанные неэффективными, но вносящие в звук меньше искажений, чем новые, и многие стали жаловаться на характерный "цифровой" призвук в музыке на компакт-дисках, причиной которого явилась недостаточные разрядность отсчетов и прежде всего - частота дискретизации. Дело в том, что при оцифровке сигнала с частотой дискретизации F необходимо полностью удалить все его составляющие с частотами выше F/2.

Обычные аналоговые проигрыватели и усилители, для которых гарантировалась передача диапазона до 20 кГц, на самом деле не вырезали из сигнала более высоких частотных составляющих - их амплитуда просто постепенно спадала, и у качественных аппаратов этот спад был более пологим, а звук - более естественным и прозрачным. Однако при глубоком подавлении высших частот - даже тех, что неслышимы сами по себе - общая звуковая картина меняется достаточно заметно для хорошей аппаратуры и тренированного слуха. Таким образом, весьма высокие еще для начала 90-х параметры цифрового звука "16 бит/44.1 кГц" сейчас могут считаться лишь минимально допустимыми для понятий "качественный звук" и "Hi-Fi". В студийной работе происходит переход на стандарт "24 бита/96 кГц", который по теоретически достижимому качеству пока заметно перекрывает возможности существующих звуковых систем.

Внутри стандарта "компакт-диск", ограниченного своими 16 разрядами и 44.1 кГц частоты дискретизации, используется преобразование цифрового звука под большую частоту дискретизации и разрядность с последующей интерполяцией промежуточных значений. Само по себе это не улучшает качества звука, однако позволяет заметно снизить погрешности, возникающие из-за неидеальности ЦАП, фильтров и прочих элементов тракта. В обычной же компьютерной звуковой карте уже при простых записи-воспроизведении трудно достичь даже качества хорошего проигрывателя компакт-дисков, не говоря уже о том, чтобы полностью "вычерпать" потенциальные характеристики внедряемых сейчас более высоких частот и разрядностей. Происходит это потому, что компьютерная карта во многом является зависимым устройством, получая питание от источника компьютера и находясь под влиянием разнообразных помех и наводок от прочих компьютерных компонент. Подавляющее большинство карт имеют совмещенные на одном кристалле ЦАП и АЦП, что снижает их помехозащищенность.

Более "грамотное" проектирование звуковой карты - введение корректирующих и помехоподавляющих цепей, стабилизации питания, вынос чувствительных компонент за пределы компьютера - сразу же резко увеличивает ее стоимость, что снижает объемы продаж и еще более поднимает продажную цену, которая уже начинает приближаться к цене младших моделей студийных аппаратов. Покупка "фирменных" компьютеров со сниженным уровнем помех также плачевно сказывается на общей выгоде. Примерно такая же картина складывается с параметрами компьютерных WT-синтезаторов: к недостаткам собственно в качестве звука добавляется ограниченность тех или иных возможностей, которые в автономных профессиональных аппаратах представлены более полно. Нередко богатые аппаратные возможности синтезатора не поддерживаются должным образом его программным обеспечением, а для пользователя-музыканта это равнозначно их отсутствию. Чрезвычайно скудна документация, часто не освещающая до конца всех возможностей - особенно в сравнении с пухлыми томами описаний профессиональных инструментов.

Таким образом, возникает парадокс: главное преимущество компьютерных карт - их сравнительно низкая стоимость по отношению к возможностям - с лихвой компенсируется явно недостаточными по сегодняшним меркам качеством звука, аппаратных возможностей по его обработке, уровнем программного обеспечения. К тому же многие серьезные производители - Roland, Ensoniq, Yamaha - вполне умышленно ограничивают качество и возможности выпускаемых ими компьютерных карт по сравнению с самостоятельными изделиями. Поэтому у пользователей - прежде всего музыкантов - возникает справедливый вопрос: оправдывает ли себя идея использования компьютера, или же в ней больше от рекламных трюков на популярном нынче направлении?

Ответ прост: в современном процессе работы со звуком и музыкой без компьютера не обойтись - кроме известных направлений чисто акустической музыки, исполняемой "живьем". Другое дело - нужно правильно определить место компьютера в этом процессе. Было бы неверно полагать, что можно полностью заменить профессиональную студию с кучей серьезной и дорогой аппаратуры и звукоинженеров одним недорогим бытовым компьютером с недорогой же звуковой картой. Однако с их помощью можно начать делать то, что традиционно делалось только в "серьезных" студийных условиях - у себя дома или в небольшой любительской студии.

Можно изучить и освоить возможности синтезатора, эффект-процессора, приемы воздействия на звук для получения желаемой его динамики и окраски, научиться записывать, создавать и использовать собственные звучания, подготавливать и сводить фонограммы. Для любителя и даже профессионала, не требующего сверхвысокого качества звука, даже этого может оказаться вполне достаточно, а остальные довольно скоро почувствуют ограниченность простой конфигурации - и весьма легко смогут заменить ее на более сложную и качественную, причем чаще всего - с гораздо меньшими потерями, чем при работе только с самостоятельными аппаратами.

Вначале это может быть замена на более серьезную и качественную звуковую карту, затем - на автономные устройства с компьютерным управлением. Важно то, что при помощи компьютера нужным с программным обеспечением можно "выжать досуха" практически любой аппарат, для управления которым с его собственной панели просто-напросто не хватает рук. Кроме этого, многие профессиональные музыканты пользуются компьютерными картами для создания так называемых "домашних заготовок" - как и многие писатели, архитекторы или модельеры.

В условиях дороговизны аренды студийного времени нередко оказывается более выгодным спокойно подготовить дома "черновик", не обращая особого внимания на несоответствие уровня шумов, прозрачность звука и натуральности имитации традиционных инструментов студийным канонам, а затем уже принести его в студию, где опытные специалисты быстро подберут аналогичные режимы работы "серьезной" аппаратуры, которая исполнит то же самое с "настоящим студийным качеством". Такой подход позволяет наиболее оптимально организовать разделение труда, оставив музыканту работу собственно над музыкой, а звукоинженеру - над ее сведением и записью.

Мне часто приходится консультировать музыкантов и звукорежиссеров - как любителей, так и профессионалов - в вопросах применения компьютеров в их работе. И нередко приходится сталкиваться и с непонятным желанием получить все "в одном флаконе", соединив принципиально несовместимые требования, и с разочарованием от того, что не получится, купив недорогой компьютер, сразу же приступить к выпуску у себя дома компакт-дисков мирового класса. Однако мне еще не приходилось видеть человека, который, хотя бы наполовину разобравшись в звуковых возможностях компьютера, после этого смог бы отказаться от его использования. В этом и состоит правильный подход: не заменить одним инструментом все остальные, а применить его там, где ему самое место - только в этом случае достигается наибольший эффект от вложения и средств, и усилий, и времени.

omel · 14.10.2010, 11:21

Разнообразие цифровых аудио форматов

WAV, МР3, MP3 Pro,
Apple AIFF, RAW, WMA, ATRAC, Ogg Vorbis

WAV

Он является основным аудио форматом для многих и многих систем воспроизведения цифрового звука и используется как стандартный формат звуковых файлов в персональных компьютерах. К тому же, он имеет солидный набор спецификаций, изрядно пополнившийся за последнее время. Его полное название - Microsoft RIFF/WAVE - Resource Interchange File Format/Wave - формат файлов передачи ресурсов/волновая форма, и создан он был инженерами Microsoft и Intel. В свою очередь, WAV расшифровывается как Waveform Audio File Format.

Apple AIFF

Этот тип файлов является стандартным для систем Apple Macintosh и систем обработки звука, построенных на его основе. Apple AIFF расшифровывается как Audio Interchange File Format - формат файла обмена звуком, он в чем-то схож с WAV. Его особенностью является то, что он позволяет размещать вместе со звуковой волной дополнительную информацию, в частности, самплы WaveTable (примеры звучания инструментов вместе с параметрами синтезатора), что улучшает качество итогового результата. Хотя в настоящее время компьютеры Apple способны воспроизводить файлы практически любых форматов, в том числе и МР3.

RAW

Да, это не только формат изображения, в котором пишут фотографии некоторые цифровые камеры. На самом деле, RAW является т.н. «чистой оцифровкой», в которой не содержится заголовка и находится лишь последовательность отсчетов звуковой волны. Обычно оцифровка хранится в 16-разрядном формате.

МР3

Самый популярный формат сжатия на сегодняшний день – это МР3. Формат МР3 (MPEG Layer 3) был разработан, после ряда промежуточных форматов, институтом Фраунхофера в Германии. Вообще то, формат .МР3 основан на обмане человеческого уха. После некоторых исследований выяснилось, что человеческому слуху свойственно адаптироваться к появлению новых звуков, что выражается в повышении порога слышимости. Поэтому одни звуки способны маскировать (то есть, делать субъективно неслышимыми) другие. Вот и в этом формате часть звуков, которые, как считает соответствующая теория, делаются неслышимыми, просто убираются из общего звучания. После чего получившийся «полуфабрикат» кодируется по методу Хоффмана. Обязательно следует учитывать то, что в формате МР3 программы, сжимающие звук из оригинального, не являются стандартизированными, то есть каждый грамотный программист может реализовать свою схему сжатия. А стандартам подчиняются только декодеры, что приводит к тому, что качество воспроизведения формата МР3 далеко не всегда зависит от плеера, проигрывающего этот файл. В связи с разными способностями и пристрастиями реализаторов различных кодеров, одни из них лучше справляются с симфонической музыкой, другие - с роком и металлом, третьи - с рэпом и рэйвом и так далее.

JointStereo, являющийся одной из особенностей МР3, означает, что вместо кодирования стерео как двух независимых каналов производится кодирование т.н. центрального канала и разницы, отличающей его от исходных стереоканалов. Довольно много составляющих звука в стереоканалах одинаковы, и их кодирование в общем канале позволяет высвободить дополнительную полосу для более подробного кодирования разницы, что приводит к некоторому улучшению качества.

Обязательно следует упомянуть и о Variable Bit Rate, или VBR. Это означает, что кодер изменяет степень сжатия «на лету», в зависимости от характера звука. Такой подход приводит к уменьшению итогового размера файла или, при увеличении требований к качеству, при том же размере файла позволяет добиться лучшего звучания.

MP3 Pro

Появившийся в 2001 году кодек MP3 Pro был создан компанией Coding Technologies совместно с Thomson Multimedia. В его основе лежит МР3, и в результате он получился полностью совместимым с MP3 назад и лишь частично вперед. В нем используется технология SBR (Spectral Band Replication), за счет чего кодек обеспечивает хорошее качество на низких битрейтах. Однако качество кодирования на средних и высоких скоростях передачи данных уступает качеству почти всех других кодеков. В итоге MP3 Pro применяется больше для трансляций в интернете и демонстраций фрагментов новых музыкальных композиций.

WMA

Кодек WMA, или Microsoft Windows Media Audio, является серьезной альтернативой МР3. Файлы этого формата имеют расширения .WMA и .ASF, обладают явным преимуществом перед МР3 на низких скоростях потока данных (битрейтах) и теряют его при увеличении скорости подачи информации на кодек.

На основе WMA разработан стандарт WMA DRM, реализующий близкую сердцу звукозаписывающих компаний защиту от копирования. Файлы, созданные на основе этого формата, можно записывать на устройства воспроизведения, типа МР3-флэш-плееров, однако скопировать их оттуда нельзя.

ATRAC

ATRAC (Adaptive TRansform Acoustic Coding - акустическое кодирование адаптивным преобразованием) базируется на стереофоническом звуковом формате с 16-разрядным квантованием и частотой дискретизации 44.1 кГц. При сжатии каждый кадр делится на 52 частотные полосы, результирующая скорость потока - 292 кбит/с (сжатие 1:5). Применяется в системе MiniDisk.

Ogg Vorbis

Формат Ogg Vorbis - относительно новый универсальный формат записи звука с потерями данных. Он принадлежит к тому же типу форматов аудиосжатия, что и МР3 и WMA, а психоакустическая модель, описывающая особенности человеческого слуха, в соответствии с которыми производится сжатие, по принципам действия близка к МР3. Радикальным же отличием этого формата стала математическая обработка и практическая реализация этой модели. В этом формате пороговая максимальная частота оцифровки не 44 кГц как в MP3, а 48, что теоретически улучшает качество звука. Также следует отметить, что теоретическое число каналов не ограничено двумя, как обычно, а достигает 255. Файлы, закодированные в этом формате, меньше таких же файлов в МР3. Распространение формата сдерживалось недостаточной поддержкой со стороны производителей аппаратуры.

14.10.2010, 10:54	#1
omel Старейшина Регистрация: 25.01.2010 Адрес: Каменец-Подольский Сообщений: 673 Вы сказали Спасибо: 35 Поблагодарили 72 раз(а) в 24 сообщениях Репутация: 176	О цифровых аудио форматах История развития цифровых аудио форматов уходит своими корнями в далекое прошлое. Когда по нашему шарику, еще тепленькому, ходили мамонты, а затем слоны... Но, как говориться, "повезло с ушами - да характер вспыльчивый". А если серьезно, то книжка с толковым описанием форматов занимает примерно 200 листов текста с множеством графиков и картинок… невеселых Попробуем разобраться на пальцах. Одним из основных параметров в цифровой записи является частота дискретизации сигналов (Fs). По теореме Котельникова частота выборки должна быть вдвое выше записываемой полосы и в 1985 году было предложено три стандартных частоты выборки (дискретизации), которые в зависимости от полосы записи распределились так: - 32кГц, 48кГц- DAT (Digital Audio Tape); - 44,1кГц - компакт–диск. Разница в частотах объясняется тем, что на заре рождения форматов бытовало мнение, что разнесением частот и соответственно несовместимостью форматов можно бороться с пиратством. Чтобы, например, нельзя было с компакт диска сделать прямую перезапись на DAT. Время расставило все по местам – стало понятным, что совместимость форматов приносит больше прибыли, чем борьба с пиратством, но неразбериха была узаконена. Позже появился более современный PCM формат - DVD – Audio, который благодаря подтянувшейся технологии изготовления чипов смог позволить себе повышенные частоты выборок 48 (удвоенные 96 или учетверенные 192) кГц. Если с точки зрения полосы сигнала информативна частота дискретизации – то за динамический диапазон и нелинейные искажения несут персональную ответственность число битов в кадре (frame), величина которого кратна 16. Цифра 16 – тоже исторически сложившаяся величина и отражала уровень развития схемотехники на время появление стандарта. Введение дополнительного количества битов (до 24) заставил кадр расположиться на двух стульях, и теперь он занимает 216=32 бита. Избыточное количество битов в кадре (32-24=8) маскируется или другими словами, «выбрасывается в пропасть». Но вернемся к процессу записи (для удобства остановимся на двух основных). Оцифровка сигнала осуществляется с применением параллельного кода (PCM – Pulse Code Modulation), и последовательного (DSD - Direct Stream Digital) кода и в таком виде пишется на носитель (в нашем случае компакт – диск). Ремарка: шикарный способ фазовой модуляции для кодировки звука, но дальше Hi-Fi стерео в видеомагнитофонах продолжения пока не имеет, надеюсь пока. Оба стандарта довольно «пожилые». И если стандарт ИКМ например у всех на слуху, особенно у телефонистов, то второй, не что иное, как ШИМ – модуляция. Последнее согреет душу всем разработчикам импульсных источников вторичного электропитания. Просто у них задача обратная - не создавать синусоиду, а подавлять. Иллюстрация ШИМ–кодера приведена внизу и у многих вызовет ностальгию воспоминаниями об усилителях, работающих в классе “D” и полевых транзисторах на которых (и только) можно было реализовать этот принцип. Но об этом чуть позже. Многие мастер - копии записаны именно в последовательном коде, что немаловажно. Поэтому фирма SONY, которая является одновременно звукозаписывающим концерном и владельцем (вместе с “PHILIPS”) авторских прав на стандарт CD предложила уйти от преобразования в параллельный код и предложила развивать формат DSD, который имеет ряд неоспоримых схемотехнических преимуществ перед PCM – преобразованием. Линейка этой техники получила название SACD (Super Audio CD). В чем перспектива этих форматов? Понятно, что PCM может двигаться в двух направлениях: -увеличение количества битов (что и видим в спецификациях до 24, что близко к теоретическому максимальному динамическому диапазону); - увеличение частоты выборки до 192кГц; Что собственно и сделано в формате DVD –Audio, который, по сути, и не является новым стандартом, а всего лишь развитием PCM. Какие плюсы имеет DVD –Audio? Начнем со стандартных уже 24 бит. Реализовать увеличение динамического диапазона за счет увеличения числа битов, довольно сложно начиная уже с момента записи. Слабо представляю себе, сколько может стоить студия звукозаписи со 100дБ динамическим диапазоном. Да и писаться в ней сможет только английская королева с Майклом Джексоном и сэром Полом. Другое дело частота дискретизации. Ее повышение требует всего лишь смены парка звукозаписывающей техники в части оцифровки сигнала, что в принципе несложно. Размеры файлов при этом возрастаю примерно в 4 раза. Так ведь эту емкость перекрывает DVD диск, стоимость которого не намного выше стандартного компакт – диска, поэтому непонятно почему так тяжело «подымается» этот формат. А ведь плюсы увеличения Fs заметно ощутимы. "Виновник" появления цифровой записи Котельников был прав говоря об достаточности удвоенной частоты выборки для процесса перевода «аналог – цифра», но обратный процесс «цифра – аналог» на краю полосы (22кГц) требует не 2 – кратной, а изначально 8 кратной выборки. 2-кратное (44кГц) же преобразование вносит дикие искажения в высокочастотный сигнал. А «исправляются» эти искажения при помощи цифровой фильтрации методом многократной (8 и даже 16 раз) передискретизации. Отсюда и желание многих разработчиков от нее избавиться. Но сделать этого корректно в рамках частоты 44кГц, как по мне, вряд ли возможно, потому, как не хватает начальной информации. К сожалению, на этапе воспроизведения при повышенном разрешении не все так гладко. Отвечать требованиям стандарта 24192 и бюджетным ограничениям можно только применяя Дельта-сигма преобразование. При этом в плеерах применяются недорогие чипы, поскольку работает принцип: «в спецификации написано 24*192 – что тебе еще надо?». Если же идти путем построения тракта по принципу R-2R, (который отвечает требованиям качественного звуковоспроизведения) то стоимость только микросхем цифрового тракта заметно превысит бюджет среднеценового DVD изделия в целом. И получается, замкнутый круг: формат не развивается, потому, что нет покупательского спроса (моды), а спроса нет, потому, что парк DVD - плееров и фонотека, мягко говоря, не соответствуют возможностям самого DVD – Audio и как следствие, не дают прибавки в качестве и вызывают законный вопрос: «А ради чего, собственно?».

14.10.2010, 10:59	#2
omel Старейшина Регистрация: 25.01.2010 Адрес: Каменец-Подольский Сообщений: 673 Вы сказали Спасибо: 35 Поблагодарили 72 раз(а) в 24 сообщениях Репутация: 176	Принципы цифрового звука Частота дискретизации 44 кГц - это много или мало? Чем компьютерный WT-синтезатор отличается от обычного клавишного? Можно ли компьютерной картой заменить профессиональную студию? Принцип представления звука в цифровой форме предполагает уничтожение какой-то части информации в нем. Исходная, непрерывная кривая, описывающая амплитуду звуковой волны, подвергается дискретизации - разбиению на отдельные интервалы (отсчеты), внутри которых амплитуда считается постоянной; таким образом фиксируются временные характеристики волны. Затем эти мгновенные значения амплитуды еще раз разбиваются на конечное число значений - теперь уже по самой величине амплитуды - и выбирается наиболее близкое из этих дискретных значений; так фиксируются амплитудные характеристики. Если говорить по отношению к графику (осциллограмме) звуковой волны, то можно сказать, что на него накладывается некая сетка - крупная или мелкая, которая определяет точность преобразования волны в цифровую форму. Мелкость временной сетки - частота дискретизации - определяет прежде всего частотный диапазон преобразуемого звука. В идеальных условиях для передачи сигнала с верхней частотой F достаточно частоты дискретизации 2F, в реальных же, приходится выбирать некоторый запас. Точность же представления самих значений амплитуды - разрядность отсчетов - определяет в первую очередь уровень шумов и искажений, вносимых при преобразовании. Естественно - снова для идеального случая, поскольку шумы и искажения вносятся и другими участками схемы. В начале 80-х, когда разрабатывалась система "компакт-диск", ориентированная для бытового применения, по результатам экспертных оценок была выбрана частота дискретизации 44.1 кГц и разрядность отсчета 16 бит (65536 фиксированных уровней амплитуды). Этих параметров достаточно для точной передачи сигналов с частотой до 22 кГц, в которые вносится дополнительный шум на уровне примерно -96 дБ. На уровне бытовой аппаратуры конца 70-х эти параметры выглядели довольно заманчиво - тем более, что акустических систем, способных более-менее точно передать звук с такими параметрами, тогда практически не существовало. В студийной работе использовалась та же разрядность отсчета при частоте дискретизации 48 кГц, что в то время считалось вполне достаточным. За прошедшее время ситуация сильно изменилась - значительно возросло качество передачи звука в студийных и бытовых системах, снова вошли в моду ламповые усилители и схемы, когда-то признанные неэффективными, но вносящие в звук меньше искажений, чем новые, и многие стали жаловаться на характерный "цифровой" призвук в музыке на компакт-дисках, причиной которого явилась недостаточные разрядность отсчетов и прежде всего - частота дискретизации. Дело в том, что при оцифровке сигнала с частотой дискретизации F необходимо полностью удалить все его составляющие с частотами выше F/2. Обычные аналоговые проигрыватели и усилители, для которых гарантировалась передача диапазона до 20 кГц, на самом деле не вырезали из сигнала более высоких частотных составляющих - их амплитуда просто постепенно спадала, и у качественных аппаратов этот спад был более пологим, а звук - более естественным и прозрачным. Однако при глубоком подавлении высших частот - даже тех, что неслышимы сами по себе - общая звуковая картина меняется достаточно заметно для хорошей аппаратуры и тренированного слуха. Таким образом, весьма высокие еще для начала 90-х параметры цифрового звука "16 бит/44.1 кГц" сейчас могут считаться лишь минимально допустимыми для понятий "качественный звук" и "Hi-Fi". В студийной работе происходит переход на стандарт "24 бита/96 кГц", который по теоретически достижимому качеству пока заметно перекрывает возможности существующих звуковых систем. Внутри стандарта "компакт-диск", ограниченного своими 16 разрядами и 44.1 кГц частоты дискретизации, используется преобразование цифрового звука под большую частоту дискретизации и разрядность с последующей интерполяцией промежуточных значений. Само по себе это не улучшает качества звука, однако позволяет заметно снизить погрешности, возникающие из-за неидеальности ЦАП, фильтров и прочих элементов тракта. В обычной же компьютерной звуковой карте уже при простых записи-воспроизведении трудно достичь даже качества хорошего проигрывателя компакт-дисков, не говоря уже о том, чтобы полностью "вычерпать" потенциальные характеристики внедряемых сейчас более высоких частот и разрядностей. Происходит это потому, что компьютерная карта во многом является зависимым устройством, получая питание от источника компьютера и находясь под влиянием разнообразных помех и наводок от прочих компьютерных компонент. Подавляющее большинство карт имеют совмещенные на одном кристалле ЦАП и АЦП, что снижает их помехозащищенность. Более "грамотное" проектирование звуковой карты - введение корректирующих и помехоподавляющих цепей, стабилизации питания, вынос чувствительных компонент за пределы компьютера - сразу же резко увеличивает ее стоимость, что снижает объемы продаж и еще более поднимает продажную цену, которая уже начинает приближаться к цене младших моделей студийных аппаратов. Покупка "фирменных" компьютеров со сниженным уровнем помех также плачевно сказывается на общей выгоде. Примерно такая же картина складывается с параметрами компьютерных WT-синтезаторов: к недостаткам собственно в качестве звука добавляется ограниченность тех или иных возможностей, которые в автономных профессиональных аппаратах представлены более полно. Нередко богатые аппаратные возможности синтезатора не поддерживаются должным образом его программным обеспечением, а для пользователя-музыканта это равнозначно их отсутствию. Чрезвычайно скудна документация, часто не освещающая до конца всех возможностей - особенно в сравнении с пухлыми томами описаний профессиональных инструментов. Таким образом, возникает парадокс: главное преимущество компьютерных карт - их сравнительно низкая стоимость по отношению к возможностям - с лихвой компенсируется явно недостаточными по сегодняшним меркам качеством звука, аппаратных возможностей по его обработке, уровнем программного обеспечения. К тому же многие серьезные производители - Roland, Ensoniq, Yamaha - вполне умышленно ограничивают качество и возможности выпускаемых ими компьютерных карт по сравнению с самостоятельными изделиями. Поэтому у пользователей - прежде всего музыкантов - возникает справедливый вопрос: оправдывает ли себя идея использования компьютера, или же в ней больше от рекламных трюков на популярном нынче направлении? Ответ прост: в современном процессе работы со звуком и музыкой без компьютера не обойтись - кроме известных направлений чисто акустической музыки, исполняемой "живьем". Другое дело - нужно правильно определить место компьютера в этом процессе. Было бы неверно полагать, что можно полностью заменить профессиональную студию с кучей серьезной и дорогой аппаратуры и звукоинженеров одним недорогим бытовым компьютером с недорогой же звуковой картой. Однако с их помощью можно начать делать то, что традиционно делалось только в "серьезных" студийных условиях - у себя дома или в небольшой любительской студии. Можно изучить и освоить возможности синтезатора, эффект-процессора, приемы воздействия на звук для получения желаемой его динамики и окраски, научиться записывать, создавать и использовать собственные звучания, подготавливать и сводить фонограммы. Для любителя и даже профессионала, не требующего сверхвысокого качества звука, даже этого может оказаться вполне достаточно, а остальные довольно скоро почувствуют ограниченность простой конфигурации - и весьма легко смогут заменить ее на более сложную и качественную, причем чаще всего - с гораздо меньшими потерями, чем при работе только с самостоятельными аппаратами. Вначале это может быть замена на более серьезную и качественную звуковую карту, затем - на автономные устройства с компьютерным управлением. Важно то, что при помощи компьютера нужным с программным обеспечением можно "выжать досуха" практически любой аппарат, для управления которым с его собственной панели просто-напросто не хватает рук. Кроме этого, многие профессиональные музыканты пользуются компьютерными картами для создания так называемых "домашних заготовок" - как и многие писатели, архитекторы или модельеры. В условиях дороговизны аренды студийного времени нередко оказывается более выгодным спокойно подготовить дома "черновик", не обращая особого внимания на несоответствие уровня шумов, прозрачность звука и натуральности имитации традиционных инструментов студийным канонам, а затем уже принести его в студию, где опытные специалисты быстро подберут аналогичные режимы работы "серьезной" аппаратуры, которая исполнит то же самое с "настоящим студийным качеством". Такой подход позволяет наиболее оптимально организовать разделение труда, оставив музыканту работу собственно над музыкой, а звукоинженеру - над ее сведением и записью. Мне часто приходится консультировать музыкантов и звукорежиссеров - как любителей, так и профессионалов - в вопросах применения компьютеров в их работе. И нередко приходится сталкиваться и с непонятным желанием получить все "в одном флаконе", соединив принципиально несовместимые требования, и с разочарованием от того, что не получится, купив недорогой компьютер, сразу же приступить к выпуску у себя дома компакт-дисков мирового класса. Однако мне еще не приходилось видеть человека, который, хотя бы наполовину разобравшись в звуковых возможностях компьютера, после этого смог бы отказаться от его использования. В этом и состоит правильный подход: не заменить одним инструментом все остальные, а применить его там, где ему самое место - только в этом случае достигается наибольший эффект от вложения и средств, и усилий, и времени.

14.10.2010, 11:21	#3
omel Старейшина Регистрация: 25.01.2010 Адрес: Каменец-Подольский Сообщений: 673 Вы сказали Спасибо: 35 Поблагодарили 72 раз(а) в 24 сообщениях Репутация: 176	Разнообразие цифровых аудио форматов Разнообразие цифровых аудио форматов WAV, МР3, MP3 Pro, Apple AIFF, RAW, WMA, ATRAC, Ogg Vorbis WAV Он является основным аудио форматом для многих и многих систем воспроизведения цифрового звука и используется как стандартный формат звуковых файлов в персональных компьютерах. К тому же, он имеет солидный набор спецификаций, изрядно пополнившийся за последнее время. Его полное название - Microsoft RIFF/WAVE - Resource Interchange File Format/Wave - формат файлов передачи ресурсов/волновая форма, и создан он был инженерами Microsoft и Intel. В свою очередь, WAV расшифровывается как Waveform Audio File Format. Apple AIFF Этот тип файлов является стандартным для систем Apple Macintosh и систем обработки звука, построенных на его основе. Apple AIFF расшифровывается как Audio Interchange File Format - формат файла обмена звуком, он в чем-то схож с WAV. Его особенностью является то, что он позволяет размещать вместе со звуковой волной дополнительную информацию, в частности, самплы WaveTable (примеры звучания инструментов вместе с параметрами синтезатора), что улучшает качество итогового результата. Хотя в настоящее время компьютеры Apple способны воспроизводить файлы практически любых форматов, в том числе и МР3. RAW Да, это не только формат изображения, в котором пишут фотографии некоторые цифровые камеры. На самом деле, RAW является т.н. «чистой оцифровкой», в которой не содержится заголовка и находится лишь последовательность отсчетов звуковой волны. Обычно оцифровка хранится в 16-разрядном формате. МР3 Самый популярный формат сжатия на сегодняшний день – это МР3. Формат МР3 (MPEG Layer 3) был разработан, после ряда промежуточных форматов, институтом Фраунхофера в Германии. Вообще то, формат .МР3 основан на обмане человеческого уха. После некоторых исследований выяснилось, что человеческому слуху свойственно адаптироваться к появлению новых звуков, что выражается в повышении порога слышимости. Поэтому одни звуки способны маскировать (то есть, делать субъективно неслышимыми) другие. Вот и в этом формате часть звуков, которые, как считает соответствующая теория, делаются неслышимыми, просто убираются из общего звучания. После чего получившийся «полуфабрикат» кодируется по методу Хоффмана. Обязательно следует учитывать то, что в формате МР3 программы, сжимающие звук из оригинального, не являются стандартизированными, то есть каждый грамотный программист может реализовать свою схему сжатия. А стандартам подчиняются только декодеры, что приводит к тому, что качество воспроизведения формата МР3 далеко не всегда зависит от плеера, проигрывающего этот файл. В связи с разными способностями и пристрастиями реализаторов различных кодеров, одни из них лучше справляются с симфонической музыкой, другие - с роком и металлом, третьи - с рэпом и рэйвом и так далее. JointStereo, являющийся одной из особенностей МР3, означает, что вместо кодирования стерео как двух независимых каналов производится кодирование т.н. центрального канала и разницы, отличающей его от исходных стереоканалов. Довольно много составляющих звука в стереоканалах одинаковы, и их кодирование в общем канале позволяет высвободить дополнительную полосу для более подробного кодирования разницы, что приводит к некоторому улучшению качества. Обязательно следует упомянуть и о Variable Bit Rate, или VBR. Это означает, что кодер изменяет степень сжатия «на лету», в зависимости от характера звука. Такой подход приводит к уменьшению итогового размера файла или, при увеличении требований к качеству, при том же размере файла позволяет добиться лучшего звучания. MP3 Pro Появившийся в 2001 году кодек MP3 Pro был создан компанией Coding Technologies совместно с Thomson Multimedia. В его основе лежит МР3, и в результате он получился полностью совместимым с MP3 назад и лишь частично вперед. В нем используется технология SBR (Spectral Band Replication), за счет чего кодек обеспечивает хорошее качество на низких битрейтах. Однако качество кодирования на средних и высоких скоростях передачи данных уступает качеству почти всех других кодеков. В итоге MP3 Pro применяется больше для трансляций в интернете и демонстраций фрагментов новых музыкальных композиций. WMA Кодек WMA, или Microsoft Windows Media Audio, является серьезной альтернативой МР3. Файлы этого формата имеют расширения .WMA и .ASF, обладают явным преимуществом перед МР3 на низких скоростях потока данных (битрейтах) и теряют его при увеличении скорости подачи информации на кодек. На основе WMA разработан стандарт WMA DRM, реализующий близкую сердцу звукозаписывающих компаний защиту от копирования. Файлы, созданные на основе этого формата, можно записывать на устройства воспроизведения, типа МР3-флэш-плееров, однако скопировать их оттуда нельзя. ATRAC ATRAC (Adaptive TRansform Acoustic Coding - акустическое кодирование адаптивным преобразованием) базируется на стереофоническом звуковом формате с 16-разрядным квантованием и частотой дискретизации 44.1 кГц. При сжатии каждый кадр делится на 52 частотные полосы, результирующая скорость потока - 292 кбит/с (сжатие 1:5). Применяется в системе MiniDisk. Ogg Vorbis Формат Ogg Vorbis - относительно новый универсальный формат записи звука с потерями данных. Он принадлежит к тому же типу форматов аудиосжатия, что и МР3 и WMA, а психоакустическая модель, описывающая особенности человеческого слуха, в соответствии с которыми производится сжатие, по принципам действия близка к МР3. Радикальным же отличием этого формата стала математическая обработка и практическая реализация этой модели. В этом формате пороговая максимальная частота оцифровки не 44 кГц как в MP3, а 48, что теоретически улучшает качество звука. Также следует отметить, что теоретическое число каналов не ограничено двумя, как обычно, а достигает 255. Файлы, закодированные в этом формате, меньше таких же файлов в МР3. Распространение формата сдерживалось недостаточной поддержкой со стороны производителей аппаратуры.

Похожие темы
Тема	Автор	Раздел	Ответов	Последнее сообщение
Аудио по блюпупу	prizrak	Бюджетный автозвук и песочница.	1	28.11.2012 22:25
Аудио СD	Nikowa	Бюджетный автозвук и песочница.	2	02.08.2012 17:34
Вопрос по аудио-системе	lordik333	Бюджетный автозвук и песочница.	1	08.07.2012 17:54
Электроакустика и аудио	wollik	Приемная комиссия	0	22.06.2011 09:40
Аудио Доктор	Kosiat	Белый шум	3	11.04.2008 10:28

Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)