Как улучшить звук голоса в шумном помещении: разборчивая речь в шуме
Как улучшить звук голоса в шумном помещении: разборчивая речь в шуме – блог MrCable
Почему речь теряется в шуме и что влияет на разборчивость речи
Речь теряется в шуме в основном потому, что звуковые волны шумов просто накладываются на более тихие звуковые волны речи и перекрывают ее. Это особенно касается низкочастотных шумов (например, гул двигателей), которые имеют большую энергию и легко маскируют голос.
Также нельзя не учитывать тот факт, что речь является сложным сигналом в диапазоне примерно 300–3400 Гц. Основная информация содержится в высоких частотах: очень важны для разборчивости согласные звуки: «с», «ш», «п», «т». И если шум в том же частотном диапазоне, то он «затрет» в первую очередь именно эти критичные для разборчивости звуки.
Равномерно распределенный по частотам так называемый белый шум маскирует речь хуже, чем шум со спектром, идентичным речи (например, голоса других людей).
Человеческий мозг, будучи сложным и гибким, в целом научился выделять из фонового звукового потока нужный ему голос. Однако в шуме ему все равно сложно определить, откуда идет нужный ему голос, особенно без визуальной подсказки. При этом мозг может настроиться на один голос среди многих в условиях непохожести тембров говорящих и если мы смотрим на говорящего (это называют «эффектом коктейльной вечеринки»). Если же шум однородный и монотонный, то этот эффект не срабатывает.
В тишине мы можем понимать речь, даже не слыша какие-то звуки. Мозг достраивает смыслы, но в условиях шума мы теряем важные части информации и мозг не может достроить контекст.
Основные характеристики речи и то, что на них влияет
Громкость. Это основная характеристика речи. Тихая речь будет неслышная на фоне окружающих шумов или не достигнет порога слышимости слушателя. Оптимальным диапазоном уровня громкости считают обычно 65–75 дБ – при нем разборчивость максимальна. Слишком высокая громкость и слишком низкая громкость одинаково вредны, поскольку вызывают искажения звука, усталость слушателя и съедают важные звуковые нюансы.
Существует измеримое понятие «порог разборчивости». Разборчивость речи падает нелинейно, она зависит от соотношения сигнал/шум (SNR). Для комфортного понимания речи уровень голоса должен превышать уровень фонового шума как минимум на 6–10 дБ. При SNR = 0 дБ (голос и шум равны) разборчивость падает до 50 %. При отрицательном SNR понимать речь становится крайне тяжело. Речь теряется в шуме не потому, что она полностью исчезает, а потому, что акустическая информация критически искажается и маскируется, а наш мозг лишается возможности ее надежно выделить и восстановить.
Важно не просто говорить громко, а варьировать громкость: делать смысловые акценты, понижать голос для выделения важного и избегать монотонности.
Тембр голоса. Это его окраска, которая определяется распределением энергии по частотному спектру. Именно тембр позволяет отличить один звук или голос от другого, даже если они одинаковы по громкости и высоте. Ключевую роль для разборчивости играют высокие частоты (примерно 2000–8000 Гц). Именно в этом диапазоне звучат большинство шумных согласных звуков (с, ш, ч, ф, п, т, к и др.), ответственных за смыслоразличительную нагрузку в языке.
Если тембр голоса глухой, с недостатком высоких частот (например, из-за заложенности носа, неправильной артикуляции или плохого микрофона), то согласные звуки смазываются и слова становится трудно различить. Слишком резкий тембр с преобладанием высоких частот также ухудшает восприятие, вызывая раздражение слуха.
Четкость гласных звуков определяется положением формант – усиленных полос частот в спектре. Богатый, сочный тембр с хорошо выраженными формантами делает гласные ясными.
Прежде всего необходимо, чтобы речь была достаточно громкой, чтобы ее можно было услышать, тогда как тембр определяет, насколько хорошо будут различимы конкретные звуки и слова. Искажение на одном этапе влияет на другой. Если говорить очень тихо, микрофон или усилитель может поднять уровень сигнала, но вместе с ним усилит и низкочастотные шумы, что ухудшит тембр и разборчивость. И наоборот, неправильный тембр (недостаток высоких частот) заставляет слушателя мысленно додумывать слова, что требует больших усилий даже при нормальной громкости. Естественный, выразительный голос постоянно меняет и громкость, и тембр (интонационно). Эта динамика помогает мозгу слушателя лучше сегментировать речевой поток и выделять важные элементы.
Отражения. В дополнение к фоновым шумам существует эффект реверберации или эха. Это звуковые волны, отражающиеся от стен, потолка, пола и других поверхностей. Они достигают слушателя с небольшой задержкой относительно прямого звука. В результате сразу после слова приходят его отраженные копии, которые наслаиваются поверх, и получается акустическая каша, где начало и конец звуков смешиваются.
- Сильные отражения (с задержкой >50 мс) воспринимаются как отдельное эхо и напрямую мешают слушать следующий слог.
- Ранние отражения (с задержкой до 30–50 мс) могут, наоборот, усиливать прямой звук и делать речь более объемной и естественной, если их уровень контролируется.
Показатель отражений – время реверберации (RT60). Чем оно больше (например, в пустых залах с твердыми поверхностями), тем хуже разборчивость. Для хорошей разборчивости речи нужны сухие помещения с RT60 около 0,6–1,2 с.
Перегруз. Это еще одна причина плохой разборчивости речи. Перегруз – это искажение формы звуковой волны из-за превышения максимального допустимого уровня в каком-либо звене цепи: микрофоне, предусилителе, процессоре, усилителе, колонках. Чаще всего перегруз провоцирует клиппинг (обрезание верхушек волны). В этом случае в звуке появляются гармонические искажения, то есть ранее не существовавшие частоты.
Ошибки записи и озвучивания
Ошибки, допущенные во время процесса записи, включают:
- технические ошибки. Это шумы, плохое качество звука из-за неправильно выбранного микрофона или помещения без акустической обработки, клиппинг;
- ошибки дикции и исполнения. Включают оговорки, плохую дикцию, монотонность речи, паразитные звуки (э-э-э, м-м-м, щелчки языком, частые паузы), неверные логические ударения;
- содержательные ошибки. Это могут быть неверные даты, имена, цифры, потеря нити повествования, пропуск важной информации, нарушение стиля.
Ошибки озвучивания – при наложении голоса на готовый материал. Они включают:
- рассинхрон с картинкой и нарушение ритма. Речь не ложится в отведенный временной промежуток;
- несоответствие эмоции. Веселый текст озвучен грустным голосом, неверная характеристика персонажа, например детский голос у взрослого персонажа или отсутствие нужной харизмы, монотонность (как и при записи);
- техническое качество. Сюда относится плохая акустика, не соответствующая месту действия, разный тон и уровень громкости, посторонние шумы в записи;
- текстологические ошибки. Они особенно критичны в дубляже/переводе. Это может быть неверный перевод, несоответствие артикуляции и пр.
Как избежать ошибок на этапе записи и после
Чтобы избежать ошибок при записи:
- обеспечьте подготовку к ней – репетиция, четкий сценарий или конспект;
- используйте качественный микрофон и наушники, проверяйте уровни записи;
- записывайте в тихом месте с мягкой акустикой (ее дают, например, ковры и шторы);
- следите за уровнем звука и интонацией во время записи.
Как избежать ошибок при озвучивании:
- тщательно работайте с текстом, стремитесь к синхронности;
- не работайте без режиссера – он направляет актера, следит за эмоциями и соответствием оригиналу;
- записывайте в профессиональной студии звукозаписи;
- делайте многократные пробы и монтаж – запись дублей, выбор лучших вариантов, чистовое сведение и мастеринг.
На этапе производства:
- самый надежный способ – перезапись (рерайт): запишите проблемный фрагмент заново;
- монтаж – позволяет вырезать оговорки, паузы, шумы, склеить удачные дубли.
На этапе постпродакшена:
- осуществляется чистка звука – при помощи программ для шумоподавления (например, iZotope RX, Adobe Audition);
- выравнивается громкость – компрессия, нормализация;
- корректируются интонация и темп;
- ADR (Automated Dialogue Replacement) или переозвучка – используется для кино, когда актер повторяет свои реплики в студии, глядя на готовую сцену.
Выбор оборудования для четкой речи
- Микрофон. Это самое критичное для записи четкой речи. Чаще всего для нее используется конденсаторный микрофон с кардиоидной направленностью. Он лучше улавливает детали и нюансы.
Ключевые характеристики:
- ровный диапазон в области речи (100 Гц – 6 кГц);
- высокая чувствительность;
- кардиоидная направленность, что позволяет хорошо записывать звук спереди и минимально сзади, а это помогает бороться с эхом и фоновым шумом.
Популярные модели для старта (USB/XLR):
- Rode NT-USB/NT-1 (5th Gen), Sennheiser Profile Streaming Set – эталон для подкастов;
- Audio-Technica AT2020 (USB или XLR) – отличное соотношение цены и качества;
- Shure MV7 – уникальная гибридная модель (USB и XLV), наследник легендарного SM7B с удобными встроенными обработками для голоса;
- HyperX QuadCast/Blue Yeti – популярные USB-микрофоны для стримеров. Для профессиональной четкости лучше выбирать из первых трех вариантов.
- Акустическая обработка помещения. Цель – убить реверберацию и гулкость.
Возможные решения:
- поп-фильтр – защищает от взрывных согласных (п, б);
- стойка/пантограф – изолирует микрофон от вибраций стола;
- изоляционный щит (рефлектор-фильтр) типа Rode PSA1+ или Neewer – ставится за микрофоном и гасит отражения от стены.
Кроме того, не рекомендуется записываться в центре комнаты или напротив голой стены. Лучше ближе к стене с мягкими материалами (стеллажом с книгами, возле штор). На бытовом уровне лучше иметь ковры на полу, плотные шторы на окнах, мягкую мебель и одеяла на стенах. Профессиональное решение – акустические панели из минеральной ваты или поролона. Они крепятся в первых точках отражения (стены слева и справа от вас и перед вами) и в углах (басовые ловушки).
- Аудиоинтерфейс (звуковая карта). Он нужен, если вы выбрали XLR-микрофон, а не USB. Аудиоинтерфейс обеспечивает чистое предусиление и ЦАП/АЦП-преобразование. Рекомендуется купить предусилитель (preamp) с фантомным питанием +48V. Популярные модели – Focusrite Scarlett Solo/2i2, Audient EVO/ID4, Steinberg UR22C, Universal Audio Volt.
- Наушники. Они необходимы для звукозаписи. Выбирайте закрытые мониторные модели: они хорошо изолируют от внешних звуков и не подзванивают в микрофон. Примеры – Sennheiser HD 490 PRO, Audio-Technica ATH-M30x/M50x, Beyerdynamic DT 770 Pro.

Sennheiser HD 490 PRO
- Стойка и поп-фильтр.
- Стойка убирает передачу вибраций от стола. Подойдет настольный гусиный держатель (пантограф) или напольная модель.
- Поп-фильтр обязателен, поскольку смягчает взрывные согласные.
- Программное обеспечение.
Для записи и обработки:
- DAW (цифровая рабочая станция):
- бесплатные – Audacity (простейшая запись), Cakewalk by Bandlab;
- платные – Adobe Audition (идеально подходит для речи), Reaper (недорогой и мощный), Logic Pro (Mac), Pro Tools.
- Плагины для обработки речи после записи:
- компрессор – выравнивает громкость, чтобы тихие и громкие места стали ближе;
- эквалайзер (EQ) – можно немного приподнять область (3–6 кГц) для четкости и срезать низы (100 Гц и ниже) для избавления от гула.
- Шумоподавление. Убирает фоновый шум в паузах.
Микрофоны и гарнитуры – как выбирать
На начальном уровне
При ограниченном бюджете и звукозаписи дома используйте USB-микрофон (Rode NT-USB, Audio-Technica AT2020USB) с поп-фильтром, пантографом и наушниками. Схема подключения предельно проста: подключил к компьютеру и записываешь.
На любительском уровне
Для качественных подкастов и озвучки используйте XLR-микрофон (Rode NT1, Shure MV7), аудиоинтерфейс (Focusrite Scarlett), поп-фильтр, стойку, наушники и акустический щит. В результате получите качественный звук, акустическая обработка обязательна.
На профессиональном уровне
Звукозапись делается в профессиональных студиях с высококачественными студийными XLR-микрофонами (например, Neumann TLM 103, Sennheiser MK 4), топовыми интерфейсами/микшерами (например, Universal Audio, RME), профессиональной акустической обработкой комнаты и мониторными наушниками. В этом варианте вы делаете инвестиции в эталонное качество и долговечность.

Sennheiser MK 4
Краткий чек-лист для разборчивой речи
- Определитесь со своим бюджетом.
- Оцените акустику комнаты. Если можете ее улучшить, сделайте это.
- Выберите тип подключения – USB (проще) или XLR+ интерфейс (качественнее и гибче).
- Позаботьтесь о поп-фильтре, стойке, наушниках и кабелях.
- Прослушайте тестирования микрофонов на YouTube. Наш слух субъективен, и один и тот же микрофон может сесть на ваш голос по-разному. Нужный микрофон – тот, который лучше всего передает именно ваш тембр.
Добавить комментарий

