Звуковой автофокус.

На модерации Отложенный

Успехи в распознавании образов, применении нейросетей для обработки изображений и аналогичные новые технологии, уже успешно применяемые даже в массовой бытовой технике лидирующими компаниями-производителями оборудования видеосъёмки тем не менее сопутствуют с традиционным подходом к аудиосинхрону. Дело в том, что повсеместно используемый стандарт настолько укоренился в общественном сознании как «достаточный», что на звук обычно при покупке внимания вообще не обращают – цифровое же качество! Однако те, кто сталкивался с возможностями телеобъективов знают, что не всё так просто. Встроенные микрофоны не обеспечивают качества (а порой вообще звукового сопровождения) в случае нахождения объектов уже в десятке метров. В то же время видео хорошего качества можно писать даже с полукилометра. Это говорит о том, что у производителей просто отсутствует стимул к развитию – нет спроса, нет и предложения. А вот технические возможности есть. В первую очередь это направленные микрофоны высокой чувствительности с регулируемой диаграммой направленности. Никого не удивляет, что в видеоканале есть автофокус, способный обеспечить качество и отчётливость деталей, однако мало кто из простых операторов знает о возможностях звукового автофокуса, синхронизированного с автофокусом видео в смысле информации до объекта и направления в сочетании с системой распознавания звуков и шумоподавлением.

Очевидно речь о качественном звуке может идти уже не с десяти метров, а с десятка и возможно сотен при благоприятных условиях.

"Нейросетевое синхронное озвучивание? Да ладно, не может быть!" Тем не менее имея намерение создать видеоформат нового поколения со специализированной видеокартой не стоит забывать о необходимости соответствии звуковой картины, которую можно генерировать интеллектуально по сценарно-сэмплерному методу. Распознавание звуков уже сейчас позволяет синхронно переводить, очевидно можно предполагать в перспективе и автоматическую генерацию улучшенной объёмной звуковой картины вместо традиционного шумного неразборчивого стереосинхрона. Конечно ещё недостаточно вычислительных ресурсов в носимой технике для таких функций, но пять лет назад и 3Д дома было заоблачной технологией, а о 4К смартфонах и не мечтали.

 

6 сентября 2017 г.            Конструктор  Гаврук  В.  В.        Г.  Осиповичи     МТС +375 29 8464082    ©