Новый формат 3D видео
Задавшись целью сделать качественный 3D снимок микрообъекта (симпатичного паучка, например) с помощью стандартной камеры небезызвестной компании, разрекламировавшей как достоинство соответствие «базы» между объективами расстоянию между глазами человека, я понял, что это принципиально невозможно из-за недостатков конструкции и несовершенства принципа формирования 3D видеосигнала. Попытайтесь поднести к носу что то мелкое и рассмотрите – ничего не получится, тем более, если «зрачки» не сводятся, а смотрят только вперёд. А ведь особую ценность обычно представляют видео и снимки мира, который невидим человеку в обычных условиях. Для этого создавался космический телескоп Хаббл, электронные микроскопы, позволяющие заглянуть в микромир материи… Каким же образом можно реализовать в массовой продукции те высокие требования и стандарты, которые востребованы у искушённого ширпотребом покупателя? Не вдаваясь в технические подробности (чтобы не потерять свой авторский приоритет) могу только заявить, что достаточно одного высококачественного объектива вместо двух и дрожания объектива из-за естественного микроперемещения оператора (с чем научились весьма эффективно бороться), чтобы в результате получить высококачественное 3D видео микрообъектов. Необходимым условием является высокая частота кадров – не менее 120 кадров в секунду. Сочетая высокотехнологичные средства обработки видеосигнала – преобразования 2D в 3D, рекурсивный анализ распознанных образов с задержкой формирования конечного видео на доли секунды, требуемые для устранения шума, дрожания и формирования реального 3D кадра (дрожание рук подразумевается с частотой в единицы-десятки Герц), а так же регулирования параллакса и средств доведения до кондиции полученного потока, мы получаем принципиально новый оптимальный способ 3D видеосъёмки одним высококачественным объективом в том числе и макрообъектов. Никто не отменял требование реализма получаемого видео, поэтому мне могут возразить, что отсутствие достаточной базы видеосъёмки приведёт к снижению 3D эффекта удалённых объектов. Однако это происходит в любом случае и у камер с двумя объективами, если отношение расстояния до объекта к расстоянию между объективами велико, а в нашем случае должна включаться аналитическая логика, использующая уже не микроперемещения камеры, а перемещения оператора, съёмку в движении. Несколько лет назад я пришёл к выводу, что «правильный» способ формирования 3D сигнала – «триплексный» - системой минимум из трёх объективов, но этот способ – достаточно дорогой и у нас ещё не реализован ни программно, ни аппаратно. Третий высококачественный объектив с независимой автоматической регулировкой направления обзора и глубины резкости нужен для работы векторной логики и обеспечения качества отображения текстур, накладываемых на объекты (находящиеся в расфокусе стереопары), в то время, как стереопара будет формировать 3D объектную логику. Зритель же не зомби, который следует зрачками за движением камеры – он рассматривает выдаваемую на экран картинку произвольно, поэтому, несмотря на то, что уже сейчас автоматика управляет настройками объектива лучше всех операторов–любителей, при съёмке одним объективом мы видим нечёткие фрагменты и теряем информацию. Новая же система распознавания образов будет выдавать управляющие команды третьему объективу для прогрессивного заполнения текстурной карты окружения сцены. Этот метод позволил бы получить преимущества нового формата видео, аналогичные преимуществам векторной графики в сравнении с растровой (масштабирование и изменение скорости воспроизведения, прочие). Однако моё предложение на территории Беларуси энтузиазма даже на уровне руководства ОИПИ не вызвало, по крайней мере ко мне никто не обращался. Предполагаю, что они решили ухватить идею за хвост и мне даже спасибо не говорить, несмотря на очевидную востребованность таких технологий в новой для Беларуси области – космической видеорегистрации. А кому же эти идеи нужны – компаниям Samsung или Fhilips? В первую очередь нам самим.
Видеосъёмка 3D формата оборудованием нового типа имеет специфику и не столь очевидные нюансы. Давайте разберёмся – можно ли создать прогрессивную логику, накапливающую информацию об окружающей обстановке по мере создания видеосюжета? Общеизвестно, что анимационные приложения на достаточно хороших компьютерах практически в реальном времени позволяют из сценариев создавать высококачественные видеопотоки сцен и сюжетов (например для игр), в новой технике видеосъёмки должен присутствовать обратный процесс – распознавания и анализа образов с последующей генерацией сценариев.
В этом случае достичь высококачественного старта можно, предварительно поснимав вокруг на месте, где будет сниматься нужное событие. Впрочем, это можно сделать и позже, если интересует не «прямая трансляция», а ролик «для истории», который позже на компьютере будет доведён до финишного качества. Если снимается сюжет на открытом пространстве с большими расстояниями и зуммированием, то конечно же необходима максимальная база (расстояние между объективами). В этом случае можно предположить, что второй объектив может крепиться на выдвигаемой телескопической «антенне», либо оба объектива располагаться на достаточно удалённых штативах и синхронизироваться по беспроводному каналу. В этом случае полученный параллакс будет обеспечивать реалистичность и объёмность. Итак, распознавание образов в получаемых с матриц информационных потоках открывает новые невероятные возможности, о которых сейчас можно только догадываться. Сложность технической реализации в компактных видеокамерах высокопроизводительного схемотехнического и программного комплекса, способного обрабатывать потоки видео перспективных форматов, связана, на мой взгляд, с несовершенством Неймановской логики, базового принципа построения большинства современных процессоров. Экстенсивный рост объёмов вычислений с увеличением количества пикселей ведёт в тупик, не позволяющий реализовать минимальную функциональность на носимых камерах. Недостатки эти мне стали очевидны ещё в 2002 году, однако Беларусь не является законодателем мод в схемотехнике и архитектуре процессоров, тем более что спецслужбы предпочитают украсть идею у автора и засекретить потом её от всех остальных. Я же считаю, что вор должен сидеть в тюрьме. Поэтому многие мои идеи так и не реализовали, а жаль.
Но среди многих причин, по которым мы все до сих пор пользуемся растровой графикой есть менее очевидные и, к сожалению трудноустранимые системные несовершенства. В частности это отставание в развитии законодательства (противоречия национальных и международных норм, патентного права), несовершенство рыночной модели взаимоотношений и в частности разделения финансирования на потоки – фундаментальные исследования и кредитование проектов, содержащих ноу-хау. Интеграция множества отраслей знаний, использование векового эволюционно развивающегося капиталоёмкого производства компонент из других стран, инерционность рынка и другие подобные причины сказываются на невозможности быстро и дёшево реализовать лучшие идеи, прекратив производство морально устаревшего. Поэтому использовать кредитование для наукоёмких перспективных ОКР, где срок ограничен годом, практически невозможно (если только вы не аферист). А сразу же переключиться на другую ветвь финансирования – фундаментальные исследования – невозможно по другим причинам. Необходимы промежуточные ступени, где частично присутствует государственная поддержка авторских разработок, имеющих изобретательский уровень. Сейчас же автор вынужден платить патентоведу, что само по себе нелогично. Если идея заинтересовала – разумно бы патентоведам не предлагать ставить на пути её внедрения в производство дополнительные преграды, а наоборот способствовать промышленности прогрессивно внедрять и развивать технологии, по справедливости награждая авторов из прибыли. Реальная картина же такова – кризисная промышленность по экономическим причинам отказывается от лучших технологий, «защищённых» патентом, вываливая на рынок более дешёвый хлам, чтобы остаться на плаву, но в результате окончательно «тонет», задавленная крупными международными корпорациями, производящими патентованные девайсы.
Возможно ли способствовать получению грантов для фундаментальных научных исследований в области обработки видеоинформации и создании собственного стандарта телевидения, превосходящего 4К не количеством пикселей, а функциональными возможностями, в том числе возможности значительного улучшения качества видео старых форматов, что станет возможным в случае разделения технических средств получения, обработки и воспроизведения видео на устаревшие, основанные на теореме Котельникова и новые, основанные на моей теореме? Напомню её суть – пропускная способность канала должна описываться категориями информации, а не сигнала.
9 января 2013 г.
Комментарии