Реферат: Методы и средства Мультимедиа. Звук

<hr />Основные сведения о звуковых волнах Характеристики Закон Вебера-Фехнера для звука Логарифмическая шкала Примеры Спектральное представление звука Искажения и эффекты Линейные искажения Линейные искажения Искажения в многоканальных системах Нелинейные искажения. Помехи и шумы Примеры нелинейных искажений Перегрузка Интермодуляционные Биение Помехи Цифровой способ представления звука Аналогово-цифровое преобразование Фильтрация Дискретизация Квантование Динамическая обработка звука Компрессор и лимитер Гейт и экспандер Частотная коррекция звукового сигнала Частотные фильтры Фильтр низких частот Фильтр высоких частот Полосовый фильтр Эквалайзер Пространственные и модуляционные эффекты Хорус, Фленджер, Фазер Эхо Реверберация Синтез звука Аддитивный синтез звука Субтрактивный синтез звука Частотной модуляция Генератор, управляемый кодом Частотная модуляция Синтез Нелинейный синтез звука Таблицы волн WT-синтез Сэмплерные синтезаторы Физическое моделирование Звуковые платы Состав звуковой платы Блок записи и воспроизведения Блок синтезатора Блок DSP Блок интерфейсов Блок микшера MIDI-интерфейс MIDI-интерфейс Назначение MIDI Аппаратная реализация MIDI Разъем DIN-5 (СГ-5) Протокол MIDI Адресация в MIDI Типы MIDI-сообщений Канальные сообщения о звуке Канальные сообщения о режиме Системные сообщения Стандарты MIDI-систем General MIDI General Synthesis Extended General MIDI (XG) Все вместе Запись и передача Секвенсоры Простейшая студия Студия для записи «живого» исполнения Студия для многоканальной записи Студия для многоканальной записи с секвенсором Секвенсор Паттерновые (Шаговые) Линейные Маскирование Сжатие звука Формат MP3 Алгоритм сжатия MP3 Схема MP3 кодера Режимы кодирования стерео Психоакустические форматы Программирование звука Основные программные интерфейсы Программный интерфейс MME Способы кодирования звука Формат потока Структура потока Системные особенности Несколько процессов Wave Mapper Устройства Алгоритм взаимодействия Программный интерфейс DirectSound Назначение, структура, особенности Аппаратная поддержка Звуковые буферы Аппаратные и программные Первичный и вторичные Уровни взаимодействия Наборы свойств Идентификация устройств Системные особенности Алгоритм взаимодействия Воспроизведение Запись Предметный указатель

Московский авиационный институт

(государственный TEXнический университет)

Факультет прикладной математики

Кафедра вычислительной математики и программирования

Методы и средства Мультимедиа. Звук

x(t)

/>t

Преподаватель: О. В. Казанцев Студент: И. К. Никитин

Москва, 2010

Содержание

1 Основные сведения о звуковых волнах 5 Характеристики ............................. 5ЗаконВебера-Фехнерадлязвука … 6Логарифмическаяшкала … 6Примеры … 7Спектральноепредставлениезвука … 7Искажения и эффекты 10 2 Линейные искажения 10 Линейныеискажения … 10Искажениявмногоканальныхсистемах… 103 Нелинейные искажения. Помехи и шумы 12 Примерынелинейныхискажений .................. 12Перегрузка… 12Интермодуляционные … 12Биение … 13Помехи … 134 Цифровой способ представления звука 14 Аналогово-цифровоепреобразование ................ 14Фильтрация … 15Дискретизация … 15Квантование… 165 Динамическая обработка звука 17 Компрессорилимитер ......................... 18Гейтиэкспандер … 196 Частотная коррекция звукового сигнала 21 Частотныефильтры … 21Фильтрнизкихчастот … 22Фильтрвысокихчастот … 22Полосовыйфильтр … 23Эквалайзер… 247 Пространственные и модуляционные эффекты 25 Хорус, Фленджер, Фазер ........................ 25Эхо… 27Реверберация … 28Синтез звука 30 8 Аддитивный синтез звука 31 9 Субтрактивный синтез звука 32 10 Частотной модуляция 33 ................... 33… 34 10.3Синтез… 3411 Нелинейный синтез звука 36 12 Таблицы волн 37 ................................ 37 12.2Сэмплерныесинтезаторы… 3813 Физическое моделирование 39 14 Звуковые платы 40 ........................ 40 14.2Блокзаписиивоспроизведения… 4114.3Блоксинтезатора… 4114.4БлокDSP… 42… 42 14.6Блокмикшера… 43MIDI-интерфейс 44 15 MIDI-интерфейс 44 ............................ 44 15.2АппаратнаяреализацияMIDI… 4515.3РазъемDIN-5(СГ-5)… 4616 Протокол MIDI 47 16.1АдресациявMIDI ............................ 4716.2ТипыMIDI-сообщений… 48… 48 16.2.2Канальныесообщенияорежиме… 4916.2.3Системныесообщения… 4917 Стандарты MIDI-систем 50 17.1GeneralMIDI ............................... 50… 50 17.3ExtendedGeneralMIDI(XG)… 51… 52Запись и передача 53 18 Секвенсоры 53 18.1Простейшаястудия ........................... 5318.2Студиядлязаписи«живого»исполнения… 5318.3Студиядлямногоканальнойзаписи… 54… 55… 56… 56 18.5.2Линейные… 5719 Маскирование 58 .............................. 5920 Формат MP3 60 ......................... 60… 60 20.3Режимыкодированиястерео… 6120.4Психоакустическиеформаты… 62Программирование звука 63 21 Основные программные интерфейсы 63 22 Программный интерфейс MME 63 ..................... 64 22.2Форматпотока… 6522.3Структурапотока… 6522.4Системныеособенности… 6622.4.1Несколькопроцессов… 6622.4.2WaveMapper… 6622.4.3Устройства… 6722.5Алгоритмвзаимодействия… 6923 Программный интерфейс DirectSound 71 ................ 71… 71 23.3Звуковыебуферы… 72… 72… 73 23.4Уровнивзаимодействия… 7723.5Наборысвойств… 78… 78 23.7Системныеособенности… 7823.8Алгоритмвзаимодействия… 79… 79 23.8.2Запись… 80Предметный указатель 81 1. Основные сведения о звуковых волнах1.1. Характеристики

Звуковая волна процесс распространения в сплошной среде объемных деформаций.

/>

Забавно, заметить, если длинна волны больше расстояния между ушами человека, то он не сможет определить откуда идет звук.

/>

Порог слышимости минимальное значение интенсивности звука, вос-

принимаемым человеческим ухом. Порог слышимости зависит от частоты звуковой волны. Минимальное зна- чение лежит в частоте 2 кГц и составляет 1012 [ Вт ]

м2

Порог болевого ощущения интенсивность звука вызывающего боле-

вые ощущения. Порог болевого ощущения не зависит от частоты звуковой волны. Значе- ние составляет 10 [ Вт ]

м2

1.2. Закон Вебера-Фехнера для звука

Теоремма 1 (Закон Вебера-Фехнера). Слух одинаково оценивает равные относительные изменения силы звука.

1.3. Логарифмическая шкала

I

L = log

I0

L — интенсивность в Беллах. I — интенсивность. I0 — порог.

1.4. Примеры

Шум ГромкостьФоновый10 ДбТранспорт70 ДбОркестр90 ДбНаушники100 ДбРеактивный двигатель120 ДбБолевой порог130 Дб1.5. Спектральное представление звука

Звук представим в виде спектра: x(t) = X · sin (2 · t + φ) ;

π · f · x(t)

/>

Даже белый шум представим как сумма гармоник, но не синусоидальных, а интегральных.

x(t)

/>

∑ 1 Y (x) = sin (2 · (2n + 1) · πF x)

A ·

2k + 1 ·

n=0

A — амплитуда; f — частота.

7

Изобразим первый член ряда:

x(t)

/>

Изобразим два члена ряда:

x(t)

/>

Изобразим три члена ряда:

x(t)

/>

Изобразим четыре члена ряда:

x(t)

/>

Изобразим десять членов ряда:

x(t)

/>

Наблюдаемые горбы (осциляции) называются эффектом Гиббса. Таким образом можно изобразить звуковой спектр на графике:

/>

Искажения и эффекты

2. Линейные искажения

Искажение —изменение формы сигнала после прохождения через электро-акустические устройства.

/>2.1. Линейные искажения

Линейное искажение искажения, которые проявляются в неодинако- вом усилении передачи или воспроизведении различных гармоник, состав- ляющих звуковой сигнал, независимо от их уровня

В случае спектра происходит изменение коэффициентов ряда Фурье. Из- меняется только амплитуда набора гармоник. При измерении искажений используется логарифмическая формула:

Xf

Y (f)=20lg

Xf0

2.2. Искажения в многоканальных системах

Искажения в этих системах чаще всего симметричны. Выделяют 3 вида разбалансировки системы.

/>

Разбалансировка громкости явление, при котором, какой-то канал

многоканальной системы передает звук громче. Фазовая разбалансировка явление, при котором, различные каналы многоканальной системы передают сигнал с разной скоростью.

Переходные помехи явление, при котором, сигнал из одного канала многоканальной системы проникает в другой канал.

3. Нелинейные искажения. Помехи и шумы

Нелинейное искажение заключается в изменении набора гармоник, обычно выше определенной частоты. Особенность: степень проявления зависит от амплитуды входного сигнала. Коэффициент гармоник

21

+ x

22

+ ... + x

2 n

x

100%

K =

x0 ·

x0 — амплитуда выходного сигнала; x1...xn — амплитуды наведенных гармоник. 3.1. Примеры нелинейных искажений3.1.1. Перегрузка

Это искажение часто используется для «обогащения» звука, например для электрогитар.

x(t)

/>/>3.1.2. Интермодуляционные

Более мощный низкочастотный сигнал вызывает амплитудную модуляцию у более слабого высокочастотного сигнала

3.1.3. Биение

Появление разностной частоты при воздействии на нелинейную систему двух сигналов с близкими частотами.

3.2. Помехи

Помехи порождают в выходном сигнале гармоники которые не зависят от входного сигнала.

/>

Уровень шумов и наводок можно оценить с помощью формулы:

U = 20 · log Un

Umax

4. Цифровой способ представления звука

/>

4.1. Аналогово-цифровое преобразование

/>4.1.1. Фильтрация

Фильтрация отсечение всех сигналов, частоты которых выше частоты, которая требуется для преобразования.

Граница на которой фильтр срезает частоту чаще всего имеет ширину 2кГц.

Оверсэмплинг фильтрация на высокой частоте.

x(t) x(t)

/>4.1.2. Дискретизация

Дискретизация —процесс взятия отсчетов непрерывного во времени сиг-нала в равно отстоящие друг от друга временных точках. Интервал дис-кретизации интервал времени через который производится взятие от-счетов.

Теоремма 2 (Котельникова-Найквиста-Шенона). Сигнал, спектр частот, которого занимет область частот до Fmax Может быть полностью пред-ставлен дискретными отсчетами с интервалами не привышаюзими

1 2Fmax

Частота 44.1 кГц — стандарт для Audio CD; Частота 48.0 кГц — профессиональный стандарт. 4.1.3. Квантование

Квантование процесс измерения мгновенных уровней сигнала полу-ченных в результате дискретизации с точностью, ограниченной количе-ством разрядов, используемых для записей значений.

Есть 3 стандарта хранения отсчетов:

1 бит — 256 уровней сигналов; 16 бит — 65536 уровней сигналов;

• 32 бит — 4294967296 уровней сигналов; C явлением квантование связано понятие шум квантования. Он рассчи-

тывается по формуле P = (6N + 1.8), где N — количество разрядов;

5. Динамическая обработка звука

Динамическая обработка служит для изменения динамического диапа-

зона сигнала. Динамический диапазон сигнала разница между самым громким и самым тихим звуком.

Чем шире диапазон, тем больше разница между самым тихим и самым громким звуком и наоборот. Динамические процессоры в основном подключаются «в разрыв».

Основные виды динамических обработок это:

/>

5.1. Компрессор и лимитер

Задача компрессора состоит в том, что бы сжимать динамический диа-пазон обрабатываемого сигнала. Компрессор понижает уровень громких звуков и повышает уровень тихих.

Лимитер тоже сжимает динамический диапазон, но в отличие от компрес-сора делает это жестко — не позволяет сигналу превышать определен-ный уровень.

Основные параметры:

Порог1 — уровень сигнала, при котором срабатывает обработка. Отношение2 — определяет величину уменьшения сигнала при пре-вышения порога. Например, 2:1означает, что при превышении порога сиг-нал должен быть уменьшен вдвое. У лимитера этот параметр не регулируется (бескончность). Компрессор с отношением n : 1,n � 10работает как лимитер. Атака3 — скорость срабатывания компрессора. Затухание4 — скорость восстановления компрессора. Усиление5 — уровень общего усиления сигнала на выходе. Задается в децибелах, отражающих увеличение или ослабление сигнала, который не превышает порог срабатывания. Жесткое или мягкое колено6 — определяет жесткость срабатыва-ния (отношение достигает своего значения сразу или плавно).

Threshold. Ratio. Attack. Release. Gain. Hard knee, soft knee.

5.2. Гейт и экспандер

Это обработка, противоположная лимитеру. Если лимитер отсекает самые

громкие звуки, то гейт отсекает самые тихие. Гейт пропускает только те сигналы, уровень которых превосходит задан-ный порог, остальные отбрасывает. В основном предназначен для борьбы с шумами и паразитными сигналами (звук соседнего барабана).

Основные параметры:

Порог7 — уровень сигнала, при котором срабатывает обработка. Отношение8 — определяет насколько должен уменьшаться сигнал, уровень которого ниже порога. Чаще всего полное ослабление. Например, 40 Дб — это практически полное ослабление. Атака9 — скорость срабатывания компрессора. Затухание10 — скорость восстановления компрессора.

Экспандер прибор очень похожий на гейт. Отличие состоит в том, что гейт понижает сигнал ниже порога на определенную величину, а экспандер по-нижает сигнал в заданном отношении.

То есть если у него задано отношение 2: 1, то при недостаче 10 Дб, сигнал будет понижении на 20 Дб, а если сигнал недостает 2 Дб, то сигнал будет понижен на 4 дб. Соответственно у экспандера отношение называется ratio.

7Threshold.

8Range. 9Attack. 10Release.

Представим сказанное в виде mind map.

/>

6. Частотная коррекция звукового сигнала

Основные виды обработок:

ФНЧ (LPF) ФВЧ (HPF) Полосовый фильтр(BPF) Режекторный (Notch filter) — полосовый фильтр, работающий в минус Графический эквалайзер Параметрический эквалайзер Параграфический эквалайзер — гибрид параметрического и графи-ческого эквалайзера

6.1. Частотные фильтры

/>6.1.1. Фильтр низких частот

Фильтр низких частот11 — отфильтровывает все ниже заданной частоты.

/>

fc — частота среза

6.1.2. Фильтр высоких частот

Фильтр низких частот12 — отфильтровывает все выше заданной частоты. Часто используется для подавления частот, которые не воспринимаются человеком. Эти частоты перегревают устройства.

11LPF — Low Path Filter. 12HPF — High Path Filter.

/>

fc — частота среза

Полосовый фильтр Эквалайзер />

Частотный фильтр, в случае понижения, не срезает полосу до ну-ля. Он только уменьшает интенсивность определенных частот.

Эквалайзер устройство или компьютерная программа, позволяющая выравнивать амплитудно-частотную характеристику звукового сигнала, то есть корректировать его (сигнала) амплитуду избирательно, в зависи-мости от частоты. Эквалайзер обычно используется для частотной ком-пенсации прибора.

Можно воспринимать эквалайзер как совокупность нескольких фильтров.

/>

Графический эквалайзер с жестко определенным набором фильтров.

Графический эквалайзер имеет определенное количество регули-руемых по уровню частотных полос, каждая из которых харак-теризуется постоянной рабочей частотой, фиксированной шири-ной полосы вокруг рабочей частоты, а также диапазоном регули-ровки уровня (одинаковый для всех полос).

Параметрический эквалайзер с кастомизированным набором филь-тров. Параметрический эквалайзер удобно использовать для исправления конкретного дефекта.

Каждая полоса параметрического эквалайзера имеет три основных регу-лируемых параметра:

Центральная13 частота в герцах (Гц); Добротность14 — безразмерная величина; Уровень усиления или ослабления выбранной полосы в децибелах (дБ).

Параграфический эквалайзер графического типа с регулировкой доб-ротности.

13Рабочая. 14Ширина рабочей полосы вокруг центральной частоты, обозначается буквой «Q».

7. Пространственные и модуляционные эффекты

7.1. Хорус, Фленджер, Фазер

/>

Модуляционные эффекты основанные на задержке сигнала, вызывающей

эффект изменения высоты тона. Для хоруса, aленджерa, фазерa задержка очень маленькая, порядка десят-ков миллисекунд. Задержка сигнала может изменяться во времени. Моду-лируется эта величина при помощи низкочастотного генератора.

Эффект Задержка [мс]

Фазер 1 6 Фленджер 7 15 Хорус 15 90

Основные параметры:

Частота15 — частота модулирующего генератора. Глубина16 — величина отклонения тона Обратная связь17 — величина обработанного сигнала, подаваемого на вход. Определяет число повторов.

15Rate. 16Depth. 17Feedback.

/>

7.2. Эхо

Эхо (Delay) задержка исходного сигнала с повтором Существует множество алгоритмов:

одиночный повтор, многократный повтор, повтор с изменением панорамы, повтор с разными величинами задержки для правого и левого кана-лов.

Величина задержки очень большая от 200 мс до нескольких секунд.

/>

Основные параметры:

Время18 — интервал времени между повторами. Обратная связь19 — величина обработанного сигнала, подаваемого на вход. Определяет число повторов.

18Time. 19Feedback.

7.3. Реверберация

Реверберация это имитация естественных отражений звуковых волн в помещении. Реверберация применяется для имитации акустики окружа-ющего пространства. Представляет из себя совокупность большого числа задержек исходного сигнала с разным временем.

Алгоритмы формирования таких задержек достаточно сложны и зависят от того, что моделируется.

Время задержки варьируется от десятком мс до сотен мс. Задержка как таковая на слух не ощущается (в отличие от эха). Воспринимается как при-дание некоторого объема звуковому сигналу.

Основные параметры:

• Тип и размер помещения20 — определяет алгоритм реверберации и величину задержек. Основные типы:

� room,

� hall,

� stadium,

� cathedral,

� bathroom,

� plate,

� spring и т.д.

Время21 – время звучания ревербераци