УДК 004.921

Обнаружение модификаций кадра на основе анализа границ объектов

Маньшин Илья Михайлович – аспирант кафедры Высшей математики Белгородского государственного технологического университета им. В.Г. Шухова.

Фальков Георгий Александрович – аспирант кафедры Высшей математики Белгородского государственного технологического университета им. В.Г. Шухова.

Аннотация: В данной работе представляется судебная экспертиза, основанная на функции отклика камеры (CRF), которая позволяет более надежно обнаруживать более широкий спектр манипуляционных процессов. Внимание приковано к манипуляции с соединением, когда содержимое извлекается из одного изображения, а затем копируется в новое изображение.

Ключевые слова: модификация изображений, функция отклика камеры, гистограмма градиента интенсивности.

Введение

Разработка алгоритмов судебной экспертизы направлена на повышение надежности и расширение ограниченного набора признаков, используемых для обнаружения подделки носителей. Однако с развитием инструментов обработки изображений оценка целостности визуальных носителей становится все более затруднительным. Особенно сложным примером является имитация движения и/или размытие фокуса, которые согласуются с вероятной геометрией сцены. Подделанные размытия могут значительно повысить фотореализм и показали большой успех в визуальных спецэффектах. Большинство существующих криминалистических инструментов не обладают масштабируемостью и автоматизацией, необходимыми для обеспечения надежных оценок.

Основная идея

Существующие криминалистические методы обнаружения сращивания используют для определения свойства различных областей изображения. Они подвержены ложным срабатываниям, когда разные регионы находятся на разной глубине (следовательно, имеют разную оптическую расфокусировку), перемещаются отдельно (следовательно, имеют различное размытие при движении), или при наличии существенных различий между базовой текстурой (так как не представляется возможным измерить размытие в однородно-окрашенные области). Рассмотренный метод позволяет избежать этих проблем, анализируя края. Он способен обнаруживать оба неестественно резких края (на этапе сегментации) и может отличать естественно размытые края от тех, которые были размыты инструментами обработки изображений.

Подход использует сигнал, присущий камерам: нелинейную функцию отклика камеры (CRF). Недавние исследования показали, что размытие движения или расфокусировки при CRF очень трудно компенсировать [1], потому что (линейная) операция размытия происходит последовательно с (нелинейной) CRF. Традиционные алгоритмы удаления размытия изображения могут привести к сильным артефактам из-за нелинейности CRF, если их не учитывать должным образом. Ключевая идея заключается в том, что нелинейность CRF не является коммутативной с линейной операцией оптического размытия: край, оптически размытый, а затем прошедший через нелинейный CRF, будет обладать свойствами, отличными от того, который сначала проходит через CRF, а затем размывается (например, в Photoshop).

Из-за отсутствия больших объемов обучающих данных методы глубокого обучения не способны обнаруживать их при работе на уровне исправлений. Однако можно заметить, что эти два пути приводят к различимым статистическим зависимостям между интенсивностью пикселя и величиной его градиента.

Так, для кадра, изображенного на рисунке 1, функция отклика камеры будет иметь вид монотонно растущих кривых (рис. 2).

image1

Рисунок 1. Снятый камерой кадр.

image2

Рисунок 2. Функция отклика камеры.

В камере функция отклика (CRF) отображает входную интенсивность излучения на выходную интенсивность изображения для достижения эстетических целей. CRF уникален для каждой камеры, потенциально для разных режимов съемки, и может использоваться в качестве «отпечатка пальца» устройства захвата, что делает его хорошо подходящим для экспертизы изображений [2, 3].

Следующим шагом, очевидно становится автоматическая сегментация на области произвольной формы с последующим анализом каждой из них, оценивая CRF, а затем проверяя согласованность между сегментами для определения подлинности.

Однако у такого подхода имеются собственные недостатки. Один из них заключается в том, что методы оценки CRF часто терпят неудачу, особенно на сегментах с небольшим изменением интенсивности. Поскольку CRF представляет собой отображение во всем динамическом диапазоне изображения, точная оценка требует наличия широкого диапазона значений интенсивности [4], которого часто не хватает в локальных областях изображения. Способ также принципиально неспособен обнаружить сращивание, когда исходное и целевое изображения снимаются одной и той же камерой, ведь обе области будут демонстрировать одинаковый CRF.

Для решения такой проблемы можно воспользоваться статистическими свойства CRF вместо его явной оценки и извлекая информацию из краев, где размытие обязательно приводит к плавно меняющемуся диапазону интенсивностей [1]. Другие свойства можно найти в [5] для различения фотографических изображений и компьютерной графики.

Статистические следы модификации

Нелинейность CRF во многом влияет на обработку изображений, и, в частности, в настоящее время хорошо изучено ее влияние на размытие [1, 6].

Ключевое отличие оригинальных изображений от поддельных состоит в том, что подлинные размытые края асимметричены по отношению к центральному расположению края, тогда как искусственно размытый край симметричен. Это связано с тем, что из-за своей нелинейности наклон CRF различен в диапазоне интенсивностей. Чтобы зафиксировать можно использовать статистическую двумерную гистограмму интенсивности пикселей в зависимости от величины градиента, которая называется гистограммой градиента интенсивности (IGH), и использовать ее в качестве функции для обнаружения модификаций.

image3

Рисунок. 3. Различные классы краев и их IGH.

Заключение

Последние достижения в области инструментов обработки изображений сделали обнаружение подделки изображений все более сложным. Важным компонентом таких инструментов является способность имитировать размытие, чтобы скрыть операции сращивания и копирования-перемещения. В работе рассмотрена методика, основанная на анализе функций реагирования камеры CRF, для эффективного и надежного обнаружения подделок. Нелинейная CRF приводит к различиям в статистике изображений на уровне пикселей в зависимости от того, применяется ли он до или после размытия. А в свою очередь функция IGH будет фиксировать эти статистические данные. И на основе этой информации в дальнейшем можно использовать систему глубокого обучения для обнаружения и локализации фальсифицированных краев.

Список литературы

  1. -W. Tai, X. Chen, S. Kim, S. J. Kim, F. Li, J. Yang, J. Yu, Y. Matsushita, and M. S. Brown. Nonlinear camera response functions and image deblurring: Theoretical analysis and practice. IEEE transactions on pattern analysis and machine intelligence, 35(10):2498–2512, 2013.
  2. Lin, R. Wang, X. Tang, and H.-Y. Shum. Detecting doctored images using camera response normality and consistency. In 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’05), volume 1, pages 1087–1092. IEEE, 2005
  3. -F. Hsu and S.-F. Chang. Image splicing detection using camera response function consistency and automatic segmentation. In 2007 IEEE International Conference on Multimedia and Expo, pages 28–31. IEEE, 2007.
  4. Matsushita and S. Lin. Radiometric calibration from noise distributions. In 2007 IEEE Conference on Computer Vision and Pattern Recognition, pages 1–8. IEEE, 2007.
  5. -T. Ng, S.-F. Chang, J. Hsu, L. Xie, and M.-P. Tsui. Physics-motivated features for distinguishing photographic images and computer graphics. In Proceedings of the 13th annual ACM international conference on Multimedia, pages 239–248. ACM, 2005.
  6. Chen, F. Li, J. Yang, and J. Yu. A theoretical analysis of camera response functions in image deblurring. In European Conference on Computer Vision, pages 333–346. Springer, 2012.

Интересная статья? Поделись ей с другими:

Внимание, откроется в новом окне. PDFПечатьE-mail