Метод частотного разложения: Рецепты частотного разложения

Содержание

Рецепты частотного разложения

Метод частотного разложения, на мой взгляд – это лучшая на сегодняшний день технология, позволяющая отдельно работать с детализацией и цветом. Для тех, кому интересны теоретические основы этого метода, рекомендую почитать соответствующие материалы в ЖЖ Андрея Журавлева, так как не вижу смысла дублировать то, что уже было сделано до меня, причем, максимально подробно, с описанием математики.

Мы же с вами коснемся чисто практических аспектов и нюансов применения данного метода, рассмотрим как достоинства, так и недостатки, а точнее, ограничения различных способов реализации метода частотного разложения.

Если вы уже сталкивались с этим методом, то знаете, что существует несколько способов его реализации.

Разложение на две частоты с помощью фильтров Размытие по Гауссу (Gaussian Blur) и Цветовой контраст (High Pass).

 Именно этот метод получил поначалу самое широкое распространение в сети. Он прост в реализации, но имеет некоторые ограничения в применении. Для начала кратко рассмотрим сам метод.

Для того, чтобы разложить изображение на две частоты, нужно выполнить следующие операции:

1. Создаем копию фонового слоя или объединяем видимые слои на отдельный слой.

2. Называем ее как-то осмысленно, исходя из того, что этот слой будет являться основой для дальнейших действий. Например, Base или Основа.

3. Делаем две копии слоя Base. Первую называем Low или Низкая частота, вторую, соответственно, High или Высокая частота.

4. Дальнейшие действия зависят от того, на какую составляющую мы будем ориентироваться. Если нам важно вынести на слой High всю хорошую текстуру, оставив более крупные дефекты на слое Low, то поступаем следующим образом:

5. К слою High применяем фильтр Цветовой контраст (High Pass) с таким радиусом, чтобы видеть только ту текстуру кожи, которая нам нужна. Радиус не должен быть слишком малым, иначе часть хорошей текстуры уйдет на слой с низкой частотой, то есть

Low. Также он не должен быть и слишком большим, чтобы не выносить на слой с высокой частотой те самые, более крупные дефекты в виде локальных объемов, от которых нам необходимо избавляться.

Неправильный выбор радиуса фильтра Цветовой контраст. Слишком большой радиус.

 Неправильный выбор радиуса фильтра Цветовой контраст. Слишком маленький радиус. 

Оптимальный радиус фильтра Цветовой контраст

6. Подобрав необходимый радиус фильтра Цветовой контраст (High Pass), например, 5 пикселей, запоминаем его и применяем. Очень желательно прописать радиус фильтра в названии слоя. Например, High 5. Дело в том, что если вас неожиданно отвлекут от работы, например, телефонным звонком, вы вполне можете забыть значение и тогда придется начинать все заново.

7. Применяем фильтр

Размытие по Гауссу (Gaussian Blur) с таким же радиусом, то есть, в данном случае, 5 пикселей.

8. Меняем режим наложения слоя High на Линейный свет (Linear light)

9. Снижаем контраст слоя High в два раза. Для этого создаем корректирующий слой Яркость/Контрастность, включаем параметр Использовать прежние и ставим значение контраста на минус 50. Применяем через обтравочную маску к слою High.

10. Мы разложили изображение на две частоты. Теперь можно по отдельности работать с детализацией, цветом и объемом. Я не буду подробно останавливаться на процессе, так как подробнее вы можете узнать об этом, купив запись онлайн мастер-класса «Частотное разложение — просто как 2х2»

11. Если же нам важно наоборот, контролировать, какие дефекты останутся на низкой частоте, то есть, работа с низкой частотой в приоритете, то нужно сначала отключить видимость слоя

High, затем подобрать нужный радиус Размытия по Гауссу для слоя Low, прописать это значение в названии слоя, а затем, включив видимость слоя High, применить фильтр Цветовой контраст с тем же радиусом, что и фильтр Размытие по Гауссу. Далее все аналогично.

12. После этого можно создать дополнительные слои для ретуши низкочастотной и высокочастотной составляющих.

Достоинства метода: простота в освоении даже для новичков, возможность временно усилить текстуру для ретуши путем простого отключения корректирующего слоя, снижающего контраст.

Недостатки и ограничения метода: недостаточная гибкость, по сравнению с разложением изображения на три пространственных частоты, опасность появления артефактов на контрастных границах при работе на слое с текстурой, некоторая математическая неточность, обусловленная особенностью математики фильтра

Цветовой контраст (подробнее об этом можно почитать здесь). Впрочем, надо отметить, что в 99% случаев этой погрешностью можно пренебречь, так как вы сами при ретуши вносите гораздо более существенные «погрешности», несоизмеримо большие.

Разложение на две частоты с помощью операции вычитания.

Для реализации этого метода нужно выполнить следующее:

1. Сделайте копию фонового слоя или копию видимых слоев, аналогично предыдущему алгоритму.

2. Точно также сделайте две копии, назвав одну Low, а другую High.

3. Отключите видимость слоя High.

4. Подберите радиус размытия для слоя Low, примените фильтр Размытие по Гауссу.

5. Перейдите на слой High. Если вы работаете с глубиной цвета 8 бит, то примените команду Внешний канал (

Apply Image), установив следующие параметры – слой Low, канал RGB, режим наложения Вычитание, масштаб 2, сдвиг 128. Если вы работаете с глубиной цвета 16 бит, то примените команду Внешний канал, установив следующие параметры – слой Low, канал RGB, инвертировать, режим наложения Добавление, масштаб 2, сдвиг 0.

Параметры команды Внешний канал для режима 8 бит

Параметры команды Внешний канал для режима 16 бит

6. Измените режим наложения слоя High на Линейный свет (Linear light).

Достоинства метода: более аккуратная математика, отсутствие «проблемы High Pass», возможность применения любых фильтров размытия, а не только Размытия по Гауссу. Например, за счет применения фильтра

Размытие по поверхности можно полностью решить проблему грязи на контрастных границах, легкость применения при построении «частотных эквалайзеров», то есть, многополосного разложения на пространственные частоты.

Недостатки метода: необходимость дополнительных операций для визуализации высокой частоты. Как выполнить такую визуализацию, я расскажу в конце статьи. Также к недостаткам (скорее к особенностям) метода можно отнести недостаточный контраст слоя High, что вызывает необходимость создания дополнительного корректирующего слоя, повышающего контраст, для облегчения ретуши высокочастотной составляющей. Точно также, метод имеет недостаточную гибкость, по сравнению с разложением на три пространственных частоты.

Разложение на три полосы частот.

Обеспечивает гораздо большую гибкость в работе, чем двухполосные методы. В частности, на низкой частоте можно полностью сосредоточиться на крупных участках, цвете, светотеневом рисунке, на высокую частоту вынести только необходимую текстуру, а все остальное оставить на промежуточной, средней частоте. В диапазон средних частот попадают такие дефекты как родинки, прыщи, пигментация кожи, веснушки, целлюлит, растяжки и т.д. Ретушируя среднюю полосу частот, мы избавляемся от этих дефектов. Иногда можно встретить рекомендации размывать среднюю полосу или просто вырубать ее черным цветом на маске. Я считаю такой подход несколько некорректным, так как именно ретушь средней полосы частот даст гораздо лучший результат.

Именно метод с разложением на три полосы частот я использую для ретуши фотографий, к которым предъявляются очень высокие требования по качеству постобработки. Подробный процесс ретуши со всеми объяснениями вы сможете найти в обучающем онлайн-курсе с домашними заданиями «Секреты профессиональной ретуши»

Как разложить изображение на три пространственных частоты:

1. Делаем базовый слой, как описано выше.

2. Создаем три копии слоя, называя их соответственно Low, Mid и High.

3. Подбираем радиус фильтра Цветовой контраст для слоя High. На этом слое будет только текстура кожи, без излишней информации о локальных объемах и дефектах. Радиус фильтра прописываем в названии слоя.

4. Подбираем радиус фильтра Размытие по Гауссу для слоя Low. Основным критерием здесь является размытие дефектов мелких и средних размеров. Должны остаться только дефекты относительно крупные, такие как следы крупных родимых или пигментных пятен, неровностей светотеневого рисунка. Однако, переусердствовать тоже не следует, иначе средняя частота получится слишком широкой. Как показала практика, оптимальное соотношение между высокой и низкой частотой в большинстве случаев лежит в пределах от 1:3 до 1:4, то есть, радиус размытия в 3-4 раза больше радиуса фильтра

Цветовой контраст. Прописываем радиус фильтра в названии слоя.

5. Все, что лежит между этими радиусами, будет вынесено в среднюю полосу частот. Для этого переходим на слой Mid и выполняем вычитание из него слоя Low. Делаем это с помощью команды Внешний канал, аналогично тому, как делали разложение на две частоты. Таким образом мы убиваем двух зайцев: получаем честный математический алгоритм, что критично для довольно больших радиусов, а также имеем возможность использовать на слое НЧ любые фильтры размытия, отличные от гауссова.

6. Размываем слой Mid по Гауссу с радиусом, который использован на слое High для фильтра Цветовой контраст.

7. Меняем режим наложения слоя Mid на Линейный свет.

8. Меняем режим наложения слоя High на

Линейный свет. Уменьшаем контраст этого слоя в два раза, аналогично первому методу.

9. Теперь мы сможем работать раздельно с тремя пространственными частотами.

Достоинства метода: больше гибкости в работе, более качественный результат ретуши.

Недостатки метода: те же, что и у метода с разложением на две частоты, требуется больше времени для ретуши, так как приходится работать на трех слоях, вместо двух. Сложность в освоении метода, если нет необходимых базовых знаний Photoshop.

Полосовой фильтр.

Этот метод в зарубежных источниках имеет название Inverted High Pass, однако, по аналогии с электрическими фильтрами, здесь имеет место простое подавление некоторой полосы частот, то есть это аналог режекторного или полосового фильтра.

Полосовой фильтр хорошо использовать для быстрой ретуши, когда требуется с минимальными затратами времени и приемлемым для массовых работ качеством избавиться от дефектов в средней полосе частот.

Алгоритм действий:

1. Делаем копию фонового слоя, называя ее, например, Fast Retouch, то есть Быстрая Ретушь.

2. Размываем данный слой по Гауссу с таким радиусом, чтобы убрать ненужные локальные объемы.

3. Вычитаем из размытого слоя исходный, то есть, в данном случае процесс происходит наоборот, так как в предыдущих методах мы вычитали из исходного слоя как раз размытый. Делаем это с помощью команды Внешний канал.

4. Изменяем режим наложения слоя Fast Retouch на Линейный свет. Мы должны увидеть размытую картинку.

5. Теперь снова размываем данный слой по Гауссу, только теперь с радиусом в 2-4 раза меньшим, проявляя мелкую текстуру кожи. Мы получим изображение, которое выглядит несколько необычно.

6. Прячем данный слой в черную маску и белой кистью проявляем его в нужных местах. При этом избегайте работы вблизи контрастных границ, так как получите грязь на этих местах.

Впрочем, проблему грязи на контрастных границах довольно легко решить. Уже догадались как?

Правильно! Использовать для размытия фильтр, оставляющий четкие границы, например, Размытие по поверхности.

Достоинства метода: простота и эффективность, быстрота в применении для массовой обработки. В отличие от плагинов, более контролируемый результат.

Недостатки метода: отсутствие какой-либо гибкости в работе, невозможно получить результат высокого качества.

Многополосное разложение или «эквалайзер».

Для упрощения процесса ретуши можно модифицировать предыдущий метод, раскладывая изображение на несколько пространственных частот, с использованием различных радиусов для размытия изображения. Таким образом мы получим возможность, работая по маске слоя, быстро убирать дефекты различных размеров.

Алгоритм создания эквалайзера:

1. Определяемся со значениями радиусов, которые будем использовать. Обычно используются значения 5, 10, 15, 25, 40 пикселей, но вы можете выбирать любые, которые вам подходят.

2. Создаем базовый слой, как в предыдущих методах.

3. Создаем необходимое количество копий, по числу радиусов плюс один слой. В данном случае шесть копий базового слоя.

4. Называем копии осмысленно, например, по диапазонам радиусов, то есть, 40, 40-25, 25-15, 15-10, 10-5, 5.

5. Отключаем все слои выше слоя 40. Размываем этот слой по Гауссу с радиусом 40 пикселей

6. Включаем вышележащий слой 40-25, переходим на него и выполняем вычитание слоя 40 с помощью команды Внешний канал.

7. Размываем данный слой по Гауссу с радиусом 25 пикселей. Получаем полосу частот от 40 до 25 пикселей.

8. Меняем режим наложения на Линейный свет.

9. Переходим на слой 25-15 и, ВНИМАНИЕ! Не включаем видимость слоя!

10. Выполняем вычитание из данного слоя содержимого всех слоев. То есть, в настройках команды Внешний канал в качестве источника нужно поставить Объединено. Таким образом мы вычтем из данного слоя изображение, размытое на 25 пикселей.

11. Теперь включаем видимость слоя 25-15 и меняем режим наложения на Линейный свет.

12. Размываем слой 25-15 на 15 пикселей.

13. Повторяем операции с другими слоями. Последний слой, с названием 5, не размываем, так как на нем будет находиться текстура с размерами элементов до 5 пикселей.

14. Таким образом, мы получаем эквалайзер пространственных частот. Теперь мы можем как ослаблять нужный диапазон частот, так и усиливать его. Ослабление производится путем наложения маски слоя и рисования по нужным местам черной кистью с необходимой непрозрачностью. Усиление производится с помощью корректирующего слоя, например, Кривые, действующего через обтравочную маску на конкретный слой. Поднимая контраст простым поворотом кривой против часовой стрелки, мы усиливаем контраст слоя, тем самым усиливая видимость данной полосы частот.

Достоинства метода: возможность быстрого подавления или усиления в выбранных полосах частот, таким образом можно значительно ускорить процесс ретуши.

Недостатки метода: сложность в реализации для начинающих, накопление ошибок округления из-за большого количества слоев, при работе вблизи контрастных границ те же проблемы с грязью из-за ореолов размытия.

Частотное разложение без потерь.

Все предыдущие способы разложения изображения на пространственные частоты имеют общий недостаток (хотя это скорее особенность), возникающий из-за целочисленной арифметики Photoshop, то есть, из-за округления чисел до целых при расчете. В результате, например, 5 разделить на 2 будет равно уже не 2.5, а 3.

Поэтому, если вынести изображение, получаемое частотным разложением, на отдельный слой и сравнить его с исходником, наложив в режиме Разница (Difference) и сильно подняв контраст, мы увидим, что изображения имеют небольшое отличие друг от друга.

Как правило, это отличие не превышает один-два тоновых уровня. Те изменения, которые вносятся впоследствии в картинку при ретуши, несоизмеримо больше. Поэтому не следует обращать на это внимания.

Однако, если для вас все же критична даже такая микроскопическая разница, можете воспользоваться способом честного частотного разложения, без потерь.

Для режима 8 бит алгоритм будет следующий:

1. Создаем базовый слой. Делаем три копии базового слоя.

2. Называем первый слой Low, следующий High_Dark, и верхний High_Light.

3. Отключаем видимость слоев High_Light и High_Dark.

4. Размываем слой Low с необходимым радиусом. При этом можно использовать любые фильтры размытия.

5. Включаем слой High_Dark. Переходим на него. Применяем команду Внешний канал со следующими настройками: источник слой Low, канал RGB, инвертировать, режим наложения Линейный осветлитель (Linear Dodge).

6. Меняем режим наложения слоя High_Dark на Линейный затемнитель (Linear Burn).

7. Включаем слой High_Light и переходим на него. Применяем команду Внешний канал со следующими настройками: источник слой Low, канал RGB, инвертировать, режим наложения Линейный затемнитель.

8. Меняем режим наложения слоя High_Light на Линейный осветлитель.

Если вынести разложенную картинку на отдельный слой с помощью комбинации клавиш CTRL+ALT+SHIFT+E, то при наложении ее на исходную в режиме Разница, с предельно усиленным контрастом, мы ничего не увидим. То есть, метод обеспечивает математически точное частотное разложение. К сожалению, в режиме 16 бит данный метод имеет видимую погрешность. Для 16 бит используется несколько другой алгоритм, который также дает погрешность, но уже на уровне единичных пикселей, что абсолютно некритично.

9. Таким образом, мы получаем два слоя для текстуры – один High_Light со светлой составляющей на черном фоне и второй High_Dark с темной составляющей на белом фоне. Ретушь текстуры в данном случае придется производить в два этапа, сначала одну составляющую, затем другую.

Достоинства метода: математически точное частотное разложение, без погрешностей.

Недостатки метода: необходимость ретуши высокочастотной составляющей в два этапа.

Алгоритм визуализации высокочастотной составляющей.

При работе с фильтрами размытия, такими как Размытие по поверхности (Surface Blur) или Медиана (Median) имеется определенная проблема. Заключается она в том, что довольно часто хочется реализовать видимость высокочастотной составляющей, как будто мы применяем фильтр Цветовой контраст. Это необходимо для того, чтобы иметь возможность контролировать, какая текстура будет впоследствии вынесена на высокочастотный слой.

Для визуализации высокочастотной составляющей я предложил следующий метод, который основан на знании математики режимов наложения и особенностей работы фильтров в Photoshop. Теперь этот метод используют многие ретушеры и преподаватели в различных онлайн и оффлайн школах, обучающих обработке изображений.

Алгоритм визуализации следующий:

1. Создаем базовый слой. Делаем две копии, называем одну Low, другую High. Слой High отключаем.

2. Копируем слой Low, называем копию Temp, что означает временный.

3. Слой Temp инвертируем и устанавливаем непрозрачность 50%. Получаем 50% серый.

4. Теперь над слоем Temp создаем временный корректирующий слой Инверсия (Invert).

5. Для дополнительного усиления контраста, чтобы лучше видеть текстуру, желательно создать еще один временный корректирующий слой Кривые, закрутив кривую RGB против часовой стрелки вокруг центральной точки.

6. Теперь, если мы будем размывать каким-либо фильтром слой Low, мы увидим серую картинку с текстурой, как будто мы применяем фильтр Цветовой контраст. В данном случае я применил фильтр Медиана

7. Подобрав таким образом параметры фильтра, применяем его, удаляем все временные слои.

8. Затем включаем слой High и получаем высокочастотную составляющую путем вычитания с помощью команды Внешний канал.

Надеюсь, что данный сборник рецептов поможет вам лучше разобраться в использовании метода частотного разложения для ретуши в различных его вариациях. 

Более подробно о самых современных методиках быстрой ретуши вы можете узнать из записи онлайн-мастер-класса «Частотное разложение 2.0. Эксклюзивные методики быстрой ретуши» (предупреждаю, что материал там не для начинающих).

А для тех, кто делает только первые шаги в ретуши, рекомендую запись моего трехдневного онлайн-марафона по ретуши «Сделай первые шаги в ретуши портретов»

По всем вариантам частотного разложения вы можете записать экшены и использовать их в своей работе. Пусть это будет вашим домашним заданием.

Автор: Евгений Карташов

Как сделать ретушь лица методом частотного разложения в Фотошопе

При обработке фотографий в силу разных причин может потребоваться отделение текстуры от оттенка/тона. Данный метод называется частотным разложением, он довольно часто применяется, например, при выполнении ретуши кожи лица и не только. Давайте посмотрим, каким образом это можно сделать в Фотошопе.

Примечание: Существуют другие, более простые способы, однако продемонстрированный ниже алгоритм дает один из наиболее качественных результатов. Если в процессе обработки фото что-то пошло не так, ничего страшного, т.к. всегда можно отменить последнее действие с помощью комбинации клавиш Ctrl+Z либо через инструмент “История” (расположен в меню “Окно”), который позволяет вернуться на более чем один шаг назад.

Метод частотного разложения

В целом, процедура выглядит следующим образом: дважды копируем исходный слой, в первой копии будет содержаться графическая информация о тоне, во второй – о текстуре. Затем по отдельности обрабатываем каждый дубликат.

Пошагово продемонстрируем алгоритм действий на примере фотографии ниже. Наша задача – убрать все явные дефекты на коже лица.

Этап 1: подготовка фотографии

  1. Открыв в Photoshop наше изображение создаем две копии исходного слоя с помощью горячих клавиш Ctrl+J (одно нажатие – одна копия). Обратите внимание, что дубликат делается со слоя, который выбран в момент нажатия указанного сочетания клавиш (но в данном случае это неважно).
  2. Для дальнейшего удобства корректируем имена слоев-копий: нижнему дадим название – “тон”, верхнему – “текстура”. Режим редактирования запускается путем двойного щелчка по текущему имени. По завершении ввода нужных символов жмем Enter.
  3. Убираем видимость слоя с именем “текстура” и переключаемся на “тон”.
  4. Переходим в меню “Фильтр”, в котором нам нужен пункт “Размытие по Гауссу”.
  5. В открывшемся окне задаем такой радиус размытия, при котором все явные дефекты лица исчезнут. В нашем случае 6,5 пикс. будет достаточно. Запоминаем это значение, т.к. оно потребуется дальше.
  6. Возвращаемся на слой “текстура” и снова активируем его видимость.
  7. Переходим в меню “Фильтр”, где выбираем пункт “Цветовой контраст” в группе “Другое”. В некоторых версиях программы может называться “Цветовой баланс”.
  8. В появившемся окошке задаем строго тот же самый радиус, что и для фильтра “Размытие по Гауссу”.
  9. Обращаем внимание на миниатюру слоя – она изменилась. Теперь щелкаем по текущему режиму наложения (по умолчанию выбран “Обычные”).
  10. В раскрывшемся списке из предложенных вариантов останавливаемся на “Линейном свете”.
  11. После этого на холсте можно заметить чрезмерную детализацию, которую нужно убавить.
  12. В нижней части Палитры щелкаем по значку для создания нового корректирующего слоя и в открывшемся списке выбираем пункт “Кривые”.
  13. Появится окно с настройками инструмента. Здесь щелкаем по левой нижней точке диагональной линии кривой, после чего в поле “Выход” вручную пишем значение “64”.
  14. Теперь кликаем по правой верхней точке кривой и для нее указываем значение “192” в поле “Выход”. В завершение щелкаем по кнопке привязки, чтобы применить настройки только для слоя ниже (кнопка включена, если квадратная стрелка вниз не перечеркнута).
  15. Таким образом, нам удалось в 2 раза снизить “присутствие” текстурного слоя на расположенных под ним слоях.
  16. В палитре, при этом, видим следующую картину. На этом подготовительный этап можно считать завершенным.

Этап 2: ретушируем текстуру

Приступаем, непосредственно, к ретушированию текстуры. План действий следующий:

  1. Переключаемся на слой “текстура” и щелкаем по значку создания слоя. Таким образом, над ним будет добавлен новый чистый слой.
  2. Отключаем видимость исходного (фонового) слоя и тонового.
  3. На боковой панели инструментов выбираем “Восстанавливающую кисть”.
  4. В верхней строке с настройками для параметра “Образец” должен быть выбрать вариант “Активный и ниже”.Остальные параметры выставляем примерно так, как показано на рисунке ниже: размер примерно должен совпадать с размером обрабатываемых изъянов, угол обзора и форма устанавливаются в зависимости от обрабатываемого материала.
  5. Оставаясь на созданном пустом слое, зажав клавишу Alt кликаем по “чистому” участку кожи рядом с изъяном, чтобы взять образец. Указатель мыши при зажатом Alt должен принять форму, напоминающую прицел.
  6. Отпускаем клавишу Alt, после чего щелкаем по дефекту, который должен замениться взятым образцом.
  7. Таким же образом убираем остальные крупные изъяны, после чего можно переходить к следующему этапу.

Этап 3: обрабатываем тон кожи

Теперь остается только поработать с тоном кожи. Для этого:

  1. Снова включаем видимость нижних слоев, которые ранее отключили.
  2. После этого можем оценить промежуточный результат наших трудов. Иногда после включения всех слоев могут быть обнаружены еще дефекты. В этом случае снова отключаем видимость двух нижних слоев и убираем изъяны с помощью “Восстанавливающей кисти”, как это было описано выше. В нашем случае результат удовлетворительный, поэтому движемся дальше.
  3. Переключаемся на фоновый слой, жмем комбинацию Ctrl+J, чтобы скопировать его. Затем размещаем дубликат фона над слоем “тон”.
  4. Выбираем “Размытие по Гауссу” в меню “Фильтр”. Выставляем для него такой радиус, при котором кожа будет выглядеть максимально гладко (замыленно).
  5. Зажав клавишу Alt щелкаем в нижней части Палитры по значку добавления слоя-маски. В результате появится маска, залитая черным цветом.
  6. На боковой панели инструментов выбираем обычную “Кисть”.
  7. Устанавливаем для нее непрозрачность на уровне 50%, нажим – от 50% до 100%.Форму выбираем круглую мягкую, жесткость – 0% (можно слегка увеличить при желании), размер зависит от размера обрабатываемых дефектов (ставим чуть больше).Цвет кисти (основной) должен быть белый.
  8. Убеждаемся, что выбрана именно слой-маска (если это не так, просто щелкаем по ее миниатюре).
  9. Далее проходимся по проблемным областям. Здесь стоит действовать предельно внимательно, не заходя на границы между участками с разными цветами/тонами, иначе произойдет их смешивание, что крайне нежелательно и может испортить результат. Обработанные кистью участки на миниатюре слоя-маски будут окрашиваться в белый цвет.
  10. На этом можно сказать, что наша работа по ретушированию лица методом частотного разложения успешно завершена. Сравним исходное и полученное в результате обработки фото. Мы не стали убирать все изъяны, чтобы сохранить естественный внешний вид кожи.

Заключение

Частотное разложение – словосочетание, которое, вероятно, может напугать новичков, решивших освоить Фотошоп. Однако практическая польза применения данного метода при обработке фотографий, в частности, при выполнении ретуши лица, огромна. Поэтому стоит потратить время и силы на изучение данного метода, т.к. это качественный профессиональный навык, который будет выручать не раз.

Частотное разложение в фотошопе

Поделиться статьёй:

Частное разложение фотографии в редакторе — навык, которым стремятся обладать все специалисты, имеющие прямое или косвенное отношение к обработке снимков. Этот процесс производится в несколько этапов. Именно поэтому изучить его самостоятельно без помощи каких-либо подсказок будет крайне сложно. Данная статья познакомит вас с нюансами использования фотошопа и правилами частотной обработки.

Содержание статьи:

Итак, если вы лишь начинаете свое знакомство с фото-сферой, то, наверняка, имеете лишь поверхностное представление о том, что такое частотное разложение изображения. 

Частотное разложение фотографии — это некое “расслоение” текстур (в данном случае речь идет о коже). То есть, происходит разделение текстуры кожи и ее тона/оттенка. Такие манипуляции производятся не случайно, это необходимо для того чтобы иметь возможность редактировать свойства кожи по отдельности. Например, если вам необходимо совершить ретушь текстуры, вы делаете это, оставляя тон нетронутым, и наоборот. 

Метод частотного разложения для ретуши, как правило, используется лишь в крайних случаях. Дело в том, что этот процесс занимает много времени, и выполнять его достаточно скучно. Однако, проделанный труд того стоит. Результат работы выглядит эффектно и более естественно, нежели в случаях использования других методов коррекции. Профессиональные ретушеры предпочитают затратить больше времени, но получить результат на уровень выше, поэтому, они предпочитают именно этот способ обработки изображений другим более легким и быстрым. 

Способ частотного разложения

Особенность данного метода заключается в том, что программа создает две версии одного изображения с помощью копирования. Первая версия предназначена для работы с тоном (low), а вторая предполагает изменения в текстуре (high). Возможно, лучше вникнуть в смысл частотной обработки фотографии поможет практический пример и подробное описание последовательности действий. 

Итак, вы выбрали снимок, который нуждается в коррекции. С чего же начать работу? Разобраться в этом поможет подготовка. 

Подготовительный этап

  1. Вам требуется продублировать исходное изображение и создать две его копии. Сделать это можно при помощи клавиш CTRL+J. Чтобы упростить себе работу и не запутаться, лучше сразу переименовать получившиеся слои (сделать это можно с помощью двойного клика по имени слоя), дать им соответствующие названия. Например, называться они могут так: “тон”, “структура”, “исходное изображение”. 
  2. Затем, необходимо выключить видимость слоя “структура” (как правило, в списке он выходит первым). Сделать это можно с помощью значка, находящегося слева от названия слоя (представлен в виде картинки глаза). Сейчас нас интересует слой “тон”, с которым и предстоит работать. Его следует размыть до максимально возможного предела. Нужно, чтобы все мелкие несовершенства кожи, привлекающие внимание, стали незаметными. Чтобы сделать это, кликните по иконке “фильтр” и выберите из открывшегося перечня “размытие” — “размытие по Гауссу”. Эффективность фильтра определяем так, чтобы, как уже было сказано выше, исчезли все мелкие дефекты. Значение выбранных параметров лучше запомнить или даже записать, в дальнейшем они могут вам пригодиться. 
  3. Следующим этапом станет работа со слоем “структура”. Чтобы начать работу с ним, нужно восстановить его видимость. Когда слой вернул себе все возможности, начинаем работу с ним. Заходим в меню и кликаем по иконке “фильтр”. Из общего перечня выбираем “другое”, а затем “цветовой контраст”. Затем, необходимо определиться со степенью применения эффекта. Вот тут нам снова понадобятся параметры, которые были применены к предыдущему слою. Задаем точно такие же цифры, как и в фильтре “размытие по Гауссу”. Не пренебрегайте этим правилом, сохранить точность в цифрах очень важно для получения качественного результата.
  4. Продолжаем работу со слоем “структура”, изменяя режим наложения на “линейный свет”. Как видите, детализация фотографии увеличилась, теперь несовершенства кожи явно выделяются на снимке и привлекают к себе внимание. Разумеется, нам необходимо избавиться от этого. Как это сделать? Ослабить эффект детализации в режиме наложения “линейный свет”.
  5. Начинаем работу с параметром “кривые”. Найти его вы можете, кликнув по иконке в виде двух полукругов (светлого и темного). В открывшемся каталоге параметров выбираем “кривые” и приступаем к использованию. 
  6. В открывшемся окне настроек необходимо активировать точку, находящуюся в левом нижнем углу диаграммы. Сделать это можно с помощью двойного клика. Выбираем поле “выход” и задаем ему значение 64. Далее, необходимо поработать и с верхней точкой. Она расположена в правом углу диаграммы. Ее выходной определитель будет равен 192, параметр входа останется без изменений. После внесения корректировок кликаем на кнопку привязки. Такие манипуляции помогут ослабить влияние текстурного слоя на остальные слои практически в два раза. Следствием таких манипуляций станет полное изменение слоя: он станет идентичен исходному варианту. Не верите? Зажмите ALT и кликните по значку видимости основного слоя (фона). Разница между изображениями должна отсутствовать. 

Итак, основной подготовительный этап завершен. Теперь можно смело приступать к главному этапу редактирования — ретуши.

Ретушь фотографии 

  1. Начать работу следует с перехода на слой “структура”. Затем, производим создание нового слоя и оставляем его пустым. 
  2. Отключаем видимость сразу двух слоев: “тон” и “фоновый слой”. 
  3. Готовим к использованию инструмент “восстанавливающая кисть”, найти который можно на панели инструментов в левом углу экрана. 
  4. Обращаем внимание на панель, находящуюся в верхней части экрана. Выбираем иконку “активный слой и ниже” и настраиваем овальную форму с параметрами: угол — 135 градусов, форма — 60 процентов. Размер кисти лучше выбирать, опираясь на среднюю величину дефектов, присутствующих на фото. 
  5. Перемещаемся на пустой слой и нажимаем клавишу “альт”. Копируем образец текстуры в непосредственной близости от изъяна. Далее, переходим к работе с самим дефектом, кликая по нему. Программа автоматически произведет замену существующей текстуры на ту, которая была скопирована в буфер обмена. Вы увидите, что результат выглядит более естественно. В отличии от других видов ретуши, где все недостатки просто сглаживаются, здесь структура кожи сохраняется, что сохраняет “натуральность” снимка. Проделайте такие же манипуляции со всеми участками, требующими обработки. 

Работа с тоном кожи

Теперь, когда текстура кожи выглядит идеально, необходимо позаботиться и о тоне кожи. Работа с тоном кожи будет происходить по похожему алгоритму, однако, используемые корректоры будут немного отличаться. 

Для начала следует выбрать рабочий инструмент. Всё, что нам нужно, как и в предыдущем случае, будет находиться в левой части экрана на специальной панели. Кликните на инструмент “кисть” и установите его параметры: режим — нормальный, прозрачность — 50 процентов. Далее, зажмите “альт” и, попав на исходный слой, выберите наиболее удачный на ваш взгляд фрагмент. Именно он будет использован в качестве образца для исправления недостатков. Кликните по одному изъяну, проверьте работу. Если результат исправлений вас устроил, то проделайте те же действия и с другими участками, нуждающимися в корректировке. 

Редактируя тон кожи, профессиональные мастера нередко используют одну интересную и простую хитрость, которая позволяет сократить количество времени и сил, затрачиваемых на работу. Хотите научиться трюку настоящих гуру ретуши? Мы подробно расскажем о каждом этапе проведения корректирующей процедуры. 

  1. Выполните копирование фона, создав новый слой. Задайте ему правильное положение: выше слоя с тоном. 
  2. Примените уже знакомую функцию “размытие по Гауссу” и определите значение радиуса. Лучше выбирать большое значение, ведь ваша задача на данном этапе — максимально сгладить недостатки кожи. Отключите видимость верхних слоев, чтобы лучше понимать свои действия. 
  3. Затем, вам опять пригодится клавиша “альт”. Зажимаем ее и кликаем по иконке “маска”. Это действие создаст дополнительный черный слой и приведет к маскировке дефекта. Активируйте видимость всех других слоев. 
  4. Далее, опять возвращаемся к инструменту “кисть” и настраиваем его таким же образом, что и в прошлый раз. Дополнительно к черному цвету выбираем белый (верхняя панель). Используем этот инструмент для всех проблемных участков и будьте предельно осторожны. Обратите внимание на природу коррекции тона: при размытии происходит частичное смешение светлых и темных оттенков. Поэтому, в месте исправления может появиться “грязь”. Чтобы такого не происходило, постарайтесь не прибегать к коррекции на участках явных переходов одного тона в другой. 

Итак, процесс коррекции фотографии с помощью частотного разложения завершен. Осталось лишь не забыть про видимость всех слоев и сохранение результата. Если с первой попытки итог стараний вас не устроил, потренируйтесь еще пару раз перед тем, как браться за ответственное задание. Так вы сформируете свой профессиональный взгляд, научитесь легко определять недостатки и находить нужный инструмент для их устранения.

Со временем вы полностью освоите метод частотного разложения в фотошопе, научитесь выполнять процесс быстрее. Вы узнаете, от каких этапов работы в определенных случаях можно отказаться, а каким следует уделить особое внимание. Вы научитесь сокращать время и силы на проведение работы, повысите свой профессиональный уровень и узнаете, как сделать коррекцию ненавязчивой. 

Поделиться статьёй:

Первичная чистка и частотное разложение

Исходная фотография

Привет! Меня зовут Саша, я один из основателей платформы для творческих людей “ТВОРЧmachine”.

Мы записали цикл бесплатных видеоуроков по естественной обработке портретов, который состоит из трёх частей:

  1. Первичная чистка и частотное разложение.
  2. Dodge and Burn, ретушь глаз.
  3. Глобальный контраст и добавление объёма в кожу, подготовка к публикации во ВКонтакте.

В первом 7-минутном видеоуроке из цикла я рассказываю, как на фотографиях избавляюсь от временных проблемных зон на коже базовыми инструментами Adobe Photoshop, а также демонстрирую один из вариантов механики ретуши под названием “Частотное разложение”.

Частотное разложение в фотографии — это приём, используемый фотографами и ретушёрами, основанный на разложении частот (в классическом варианте на низкую, среднюю и высокую). В низкой находится основное распределение цвета и яркости, в средней — объёмы объектов, а в высокой — мелкая детализация.

В нашем примере мы используем упрощённый вариант — деление только на “низы” и “верха”.

Исходная фотография

Начинаем ретушь с дублирования основного слоя (Ctrl+J для Win, cmd+J для Mac). Анализируя временные проблемные зоны (которые не преследуют человека всю жизнь: прыщики, болячки и синяки, неуложенные волосы и др.), выбираем подходящий инструмент для лучшего результата. Я использую в большинстве случаев два:

  • Patch Tool (Заплатка) — универсальный вариант для работы с кожей, позволяет практически бесследно убирать изъяны разных размеров.
  • Healing Brush Tool (Лечащая кисть) — хорошо работает с волосами.
Результат после первичной чистки

Следующий этап: разложить изображение на две частоты: верхнюю и нижнюю. Нижняя — общее распределение яркости и цвета, верхняя — вся текстура и детализация. Создаём две копии получившего слоя после первичной чистки. Один из них для удобства назовём Low, другой — High.

К слою Low, на который мы выносим яркость и цвет, применяем Filter—Noise—Median.

Значение радиуса зависит от конкретного случая. Алгоритм выбора: необходимо размыть фотографию настолько, чтобы переходы между светом и тенью были различимы, но плавны. В нашем случае это значение равно 15.

Переходим на слой High. Чтобы вынести на него текстуру, идём по пути Image—Apply Image.

В открывшемся окне, как видно на следующей картинке, выбираем в пункте Layer слой с нижней частотой (Low) в режиме наложения Add (Добавление), включаем инвертирование, значение Scale устанавливаем на 2, Offset — 0. Нажимаем ОК.

Слою High меняем режим наложения на Linear Light (Линейный свет) и объединяем со слоем Low в группу.

Итак, подготовительный этап закончен. Далее будем работать только с нижней частотой (слой Low), не переживая за потерю детализации или текстуры, ведь она осталась на слое High.

Принцип дальнейшей работы прост: выравниваем необходимые (на субъективный взгляд каждого) области по яркости и цвету, тем самым визуально прикрывая на фотографии проблемные зоны — в нашем примере это участки под глазами, носогубные складки и т.д.

Для работы переходим на слой Low и берём инструмент Mixer Brush Tool (Микс-кисть, находится на панеле “Наборы кистей”).

Устанавливаем в верхней панели кисти значение в отрезке 20-22 для параметров Wet, Load, Mix, Flow. В нашем примере мы использовали 21.

Границы кисти должны быть мягкими.

Во время работы с микс-кистью движения должны быть плавными. Направление — из зоны с хорошим паттерном на область, где нужно избавляться от проблем с яркостью или цветом. Таким образом проходим все необходимые места.

 

Если действия кажутся слишком внушительными, что сказывается на естественности и реализме фотографии, то значения непрозрачности группы можно снизить, например, до 60-70%.

На этом мы заканчиваем ретушь портрета, проделав первичную чистку базовыми инструментами Adobe Photoshop и используя приём “Частотное разложение”. В большинстве случаев на этом результате можно остановиться, однако существуют и другие механики ретуши, дополняющие этот приём или раскрывающиеся полноценно и самостоятельно. Например, техника Dodge and Burn, об одном варианте которой я расскажу вам в следующем материале.

Результат после первичной чистки и частотного разложения

Видеоурок

Подписывайтесь на ТВОРЧmachine в социальных сетях:

 

Секреты ретуши методом частотного разложения

Чёрная магия Шопа

Наверняка вам уже известно, что в ретуши фотографий самой что ни на есть «черной магией» является  достижение невероятно гладкой кожи, без потери резкости ее текстуры, а также текстуры одежды. В Photoshop существуют фильтры для размытия и повышения резкости, но оба эти процесса несколько противоречивы. Как же правильно их использовать?

Метод частотного разложения

В этом уроке я покажу вам, как я произвожу ретушь фотографии от начала до конца, используя метод, позволяющий выборочно обрабатывать не только различные области изображения, но и различные уровни детализации.

Метод частотного разложения заключается в создании сильно детализированного слоя (высокая пространственная частота) и слоя с низкой детализацией из фотографии-исходника — этот метод впервые изложил в доступной форме Шон Бейкер, фотограф и ретушер из штата Мэриленд. Эта техника позволяет сгладить грубые участки и обработать области с хорошей детализацией независимо друг от друга. А также задействовать высококачественные и недеструктивные методы обработки, при помощи которых можно сделать фотографию более резкой.

Шаг 1

Первым делом убедитесь, что вы работаете в 16-битном режиме. Далее создайте 2 копии исходной фотографии. Назовите нижний слой «low frequency», а верхний — «high frequency». Самый нижний слой с исходной фотографией не трогайте, возможно, он понадобится вам в дальнейшем.

Шаг 2

Перейдите на слой «low frequency». Чтобы применить к вашей фотографии метод частотного разложения, сперва следует удалить все детали с этого слоя. Для этого применим к этому слою фильтр Размытие по Гауссу. Значение радиуса определяется точкой пересечения высокодетализированного и низкодетализированного слоев. Т.е. значение радиуса нужно подобрать таким образом, чтобы такие четкие детали как, к примеру, поры кожи и ресницы, стали размытыми. Поэкспериментируйте до достижения нужного вам эффекта.

Шаг 3

Теперь перейдите на слой «high frequency» и выберите Изображение > Внешний канал. Для параметра Слой выберите ваш слой «low frequency», Наложение, Добавление. Установите Масштаб на 2, Сдвиг — 0, поставьте галочку у параметра Инвертировать и нажмите ОK. Если вы все сделали правильно, у вас должен получиться слабодетализированный слой. Измените режим наложения этого слоя на Линейный свет.

Шаг 4

Итак, ваше изображение восстановлено без потери качества. Перейдите на слой «low frequency» и примените к нему фильтр Размытие по поверхности (Filter > Blur). Это делается для того, чтобы сделать переходы между затемненными и осветленными участками кожи более плавными, без «размазывания» границ этих областей. Я использую Радиус 11, Порог (Threshold) 10.

Шаг 5

Поскольку слой с «высокой частотой» аккуратно отделен от остальных слоев, размытие и дорисовка изображения становятся менее деструктивными. Из-за яркого света на лице девушки сейчас слишком грубые тени. Находясь на слое «low frequency», при помощи инструмента Пипетка для определения цвета, и инструмента Кисть с мягкими краями с параметром Flow 1% аккуратно сгладьте контуры тени на лице.

Шаг 6

Перейдите на слой «high frequency» и отретушируйте кожу, убрав пятна, морщины и растрепанные волосы. Один из моих любимых инструментов — Точечная восстанавливающая кисть (Spot Healing Brush). Без «низких частот» этот инструмент становится еще более эффективным, позволяя вам удалить ненужные детали, не создавая при этом цветных пятен, не соответствующих цветовой гамме текущей области ретуширования.

Шаг 7

При помощи этой техники также можно очень качественно повысить резкость. Продублируйте слой «high frequency» и добавьте этому слою маску (Alt + click на окне маски). После этого инвертируйте изображение на маске слоя, нажав Ctrl + I.

Шаг 8

Далее применим технику осветления и затемнения, чтобы сделать осветленные и затемненные участки более ярко выраженными. Для этого выберите Слои > Новый > Слой (Layer > New >  Layer). Измените режим наложения на Перекрытие и поставьте галочку у пункта «Выполнить заливку нейтральным цветом режима «Перекрытие» (серым 50%)», залейте слой серой или белой кистью 1%. (на изображении видно, как слой будет выглядеть в режиме Наложения установленном на Нормальный).

Шаг 9

Вы также можете использовать технику осветления и затемнения с кистями больших размеров для создания более выразительных светов и теней на фоне модели. Я создал еще один слой, чтобы осветлить различные элементы фотографии, например – кексы. Также добавил свечение от лампы и сделал более насыщенной тень позади модели.

Шаг 10

После ретуши, осветления и затемнения кожи при помощи кисти, у вас могут появится небольшие пятнистые области. Чтобы проверить наличие таких областей, создайте корректирующий слой Кривых и придайте ему форму буквы S. Таким образом, вы сразу заметите небольшие тоновые несоответствия для дальнейшей коррекции.

Шаг 11

Отключите отображение корректирующего слоя Кривые и создайте еще один корректирующий слой Кривых для того, чтобы немного осветлить тени. Перейдите на голубой канал и добавьте немного голубого оттенка теням. После того, как будете довольны результатом, продублируйте этот слой, чтобы при необходимости воспользоваться им в дальнейшем.

Шаг 12

Далее создайте еще один слой Кривые – он нужен нам для коррекции цветовой гаммы изображения. Для изображений, которые нуждаются в цветовой коррекции, это будет первым шагом перед тем, как приступить к ретуши фотографии. Тем не менее, в данном примере это больше художественный эффект. Выберите синий канал и поверните кривую примерно на 10 градусов по часовой стрелке.

Шаг 13

Теперь добавьте два слоя: Цветовой тон/Насыщенность и Яркость/Контрастность, чтобы сбалансировать цветовую изображение на данном этапе. Установите Насыщенность -27. Уменьшив насыщенность изображения, я установил режим наложения Корректирующего слоя на Цвет, после чего я уже не волновался насчет контраста.

Шаг 14

Чтобы добавить блеска светлым областям, создайте новый слой, измените цвет переднего плана на белый и выберите Выделение > Цветовой диапазон. Подберите такое значение параметра Разброс, чтобы у вас были выделены белым только самые яркие части светлых областей. Нажмите Оk и залейте полученное выделение белым цветом.

Шаг 15

Эта фотография должна получиться очень нежной с мягкими, как бы мечтательными оттенками цветов. Области, которые вы только что залили белым цветом могут бвыглядеть немного зернистыми. Чтобы это исправить, находясь на слое с белыми областями, выберите Размытие по Гауссу радиусом в 5 пикселей. Границы белых областей станут более мягкими и им добавится едва заметное нежное свечение.

Шаг 16

Теперь, давайте добавим некоторую глубину теням на фотографии, чтобы сфокусировать внимание на модели и кексах. Для этого повторите то же самое на новом слое, но уже не для светлых областей, а для темных: измените цвет переднего плана на черный, уменьшите Непрозрачность этого слоя до 10-20%.

Шаг 17

Окинем взглядом наше изображение: одна деталь на фотографии будет отвлекать зрителя от лица модели – это коричневый кекс, лежащий на раковине. Чтобы исправить это, я создам новый слой и при помощи инструмента Штамп в режиме Образец: Все слои, заменяю темный кекс на светлый, который находится рядом с ним.

Шаг 18

В процессе ретуши некоторые «креативщики» первым делом берутся корректировать форму лица, пропорций и т.д. при помощи фильтра Пластика. Лучше всего это сделать в конце, поскольку это — самый деструктивный шаг. Я обычно сохраняю изображение в формате PSD, а затем объединяю в нем все слои специально для этого шага. Здесь я немного выпрямляю девушке нос и уменьшаю растяжение мочки уха под весом серьги.

У нас получилось 18 шагов. Кажется, что это много. Но уверяю вас — приступите к делу и вы увидите, как всё просто. Гладкая кожа того стоит.


Понравилось? Расскажите о нас другим фотографам

Ретушь портрета. Метод частотного разложения.

Ретушь портрета. Метод частотного разложения.

Канал на YouTube

При обработке портрета все мы сталкиваемся с проблемой – как убрать дефекты кожи, сделать кожу ровной и бархатистой, а так же сохранить её текстуру. Думаю, многие из вас уже наслышаны о таком плагине для фотошопа, как Portraiture – это, как говорится, для особо ленивых 🙂 Быстро, удобно, но он делает кожу неестественной и пластмассовой. Я лично иногда его применяю, но крайне редко и с большой прозрачностью, бывает удобен при ростовых фотографиях, где лицо получается довольно маленьким. Но давайте поговорим о более профессиональном методе ретуши кожи, который хоть и более нудный и медленный, но позволяющий добиться превосходного результата.

Итак, имеем фотографию слева, в ней уже сделана первичная свето- и цветокоррекция в лайтруме. Получим после наших манипуляций фотографию справа.

В сети довольно много разных способов этого метода ретуши, но я расскажу о том, какой быстрее, удобнее, проще и дает лучший результат.

На чем основывается этот метод: он основывается на том, что любую картинку можно разложить на 2 составляющие – на верхние и нижние частоты. И если «сложить» их обратно – получим исходную картинку. Тем самым разделяем картинку на слой, который сожержит текстуру кожи и слой, который содержит информацию о цвете, свето-теневых переходах и “форме”. Фильтр нижних частот в фотошопе – это фильтр Gaussian Blur. Верхних – High Pass, который мы будем применять через Внешний канал, т.к сам фильтр при “склеивании” дает неточности. Звучит сложно, но я постараюсь объяснить простым языком и на примерах)

Перейдем к практике:

  1. Допустим, у нас есть слой background. Делаем 2 копии его – я делаю это с помощью горячей клавиши Ctrl+J. Вы можете пойти в меню Layer – Duplicate Layer…

  1. Переименовываем их – нижнюю копию называем low, верхнюю – high.

  1. Отключаем видимость у верхнего слоя high, нажимая на иконку глаза.

  1. Выбираем слой low, теперь работаем только с ним. Применяем к нему фильтр Gaussian Blur (Размытие по Гауссу). Для этого идем в Filter — Blur — Gaussian Blur… Тем самым мы создаем слой, который хранит “цвет и форму” изображения.

  1. Какой же радиус нам выбрать? Важно выбрать такой радиус размытия, чтобы текстура кожи уже была не видна, но все свето-теневые неровности от недостатков кожи сохранились. Такой радиус колеблется от 3px (там, где маленькая площадь лица/ростовой снимок — или маленький размер фото) до 15px(крупный потрет или бьюти, большой размер фото). В моем случае меня вполне устроил результат на 3,5px, т.к я кадрировала фото.

  1. Выбираем слой high и включаем его видимость.

  1. Теперь работаем с этим слоем, создавая “текстуру” изображения. Для этого идем в Image — Apply Image… (Изображение — Внешний канал…)

  1. Во вкладке Layer (Слой) кликаем и выбираем наш размытый слой — low.

  1. ВАЖНО:

1 случай — если вы работаете в 8-битном режиме, то настройки ставим — Blending — Substract (Наложение — Вычитание), Scale (Масштаб) — 2, Offset (Сдвиг) — 128.

2 случай — если вы работаете в 16-битном режиме, то настройки ставим — Blending — Add (Наложение — Добавление), Scale (Масштаб) — 2, Offset (Сдвиг) — 0. И нажимаем галочку Invert (инвертировать).

Как посмотреть, в скольки битном канале вы работаете? Обычно это пишется наверху рядом с названием открытой картинки через слэш (например, Beauty.psd (…/8) или (…\16)). Если не видите, то идите в Image — Mode — в открытой вкладке будет помечен галочкой режим, в котором вы сейчас работаете.

  1. Мы видим серое изображение. Меняем у слоя high режим наложения на Linear Light (Линейный свет).

  1. Предлагаю сгруппировать эти два слоя. Выделяем их и нажимаем Ctrl+G или идем в Layer — Group Layers (Слои — Сгруппировать слои). Эту группу называем “частотное разложение”.

  1. Попробуйте выключить/включить видимость этой группы — вы поймете, что изображение не меняется, мы разложили изображение на 2 составляющие — на нижние частоты — размытый слой, где содержится информация о цвете и форме, и на верхние — где хранится только текстура изображения. Теперь мы можем работать с этими слоями по отдельности, не боясь “напортачить”).

  2. Сначала боримся со всеми неровностями кожи — прыщи, шрамы, родинки, лишние волосы — информация о них хранится в слое текстуры, т.е. на слое high. Работать мы будем инструментом Штамп, с жесткостью 100%. Почему? Потому что это текстура кожи и на ней недопустимы “размытые края”, которые остаются после работы мягкой кистью или лечащей кистью, или той же заплаткой. Размер подбираем чуть больше прыщика.

  1. Сделали? Теперь выбираем рядом с прыщиком хорошую текстуру, т.е. ровную. Нажимаем Alt и кликаем. Тем самым мы выбрали место, откуда будем брать текстуру. Теперь смело кликаем на сам прыщик. Отлично!

  2. Так проходимся по всей коже, удаляя всё то, что нам не нравится)

  3. Заменили плохую текстуру хорошей, но пятна от этих прыщиков и неровностей всё равно остались. За них отвечает уже нижний слой, будем работать с ним.

Для этого выбираем слой low. Нам нужен инструмент Mixer Brush Tool с настройками наверху в 10%.

Что же он делает? В самом названии кроется суть его работы — он смешивает близлежащие цвета там, где вы проводите кистью. Таким образом, немного поводив кистью на месте прыщика и в его окрестностях, мы смешаем цвет так, что на его месте будет ровная поверхность вместо пятна. Попробуйте.

  1. Таким образом проходимся по всем пятнам на лице, выравнивая фактуру кожи и создавая ровный тон лица, но не переусердствуйте.

Вот в принципе и весь метод частотного разложения)

Чтобы добиться лучшего результата, есть несколько усовершенствований этого метода, о которых я сейчас вам поведаю.

  1. Смягчение кожи.

Для этого перед тем, как вы будете работать со слоем low, сделайте его копию и примените к копии фильтр Gaussian Blur с размытием не более 10px, так, чтобы вы наглядно видели, как смягчается кожа.

Теперь создадим маску слоя. Для этого жмем соответствующую иконку.

Далее инвертируем маску. Жмем Ctrl+I или идем в Image — Adjustments — Invert.

Теперь берем белую кисть и рисуем там, где нам нужно смягчение, а именно — лоб, щеки, нос, подбородок, но не заходим на глаза, губы или край лица. В итоге маска будем примерно такая:

Я снизила непрозрачность до 65%, вы же делайте это по своему усмотрению)

  1. Резкость и лучшее видение всех недостатков при ретуши.

Данный действия делаем до того, как мы начали работать с текстурой.

Делаем копию слоя high нажатием Ctrl+J. Создаем обтравочную маску для него. Для этого выбираем слой high copy, зажимаем Alt и ведем курсор на положение между этими слоями, до возникновения такого значка. Кликаем.

Меняем его режим наложения на Normal.

Теперь все действия со штампом мы будем проводить на нем.

Чтобы лучше видеть все недостатки, создадим вспомогательный слой кривых. Нажимаем на иконку и выбираем Curves.

Переименовываем этот слой в contrast, ибо этот слой действильно повышает контраст. И создаем для него обтравочную маску, как мы это уже делали выше.

Далее выставляем в кривых такие значения:

Для нижней точки: Input — 97, Output — 0.

Для верхней точки: Input — 158, Output — 255.

Видим, как это влияет на наше изображение:

Оно стало слишком резким, поэтому убавляем непрозрачность примерно до 50%, чтобы мы хорошо видели все неровности.

Когда закончите ретушь — убавьте непрозрачность примерно до 1-5%, если вы хотите повысить резкость всего изображения, если же вам нравится исходная картинка — то либо выключите видимость этого слоя, либо вообще его удалите. Вот и всё)

P.S. Я все еще недовольна результатом, т.к. на коже видны некоторые пятна. Чтобы их удалить, я пользуюсь методов осветления и затемнения, в народе он более известен как метод Dodge and Burn, о котором я рассказала в этой статье. После него получаем гораздо более привлекательную картинку. Далее я сделала финальную цветокоррекцию и вот результат: исходная картинка, после частотного разложения и финальная:

Про методы упрощения и ускорения процесса можно узнать в этом видео:

И почитать в в этой статье

Ставь лайк, если статья была полезна (:

Частотное разложение. ULTIMATE | Виртуальная школа Profile

Частотное разложение. ULTIMATE

Цикл завершен. Начавшаяся 4 года назад история подошла к логическому концу. Я не изобретал этот прием, мне просто удалось вытащить его из узкого кулуарного круга «крутых профи» и запустить в широкие массы. Само название «частотка» — яркое тому доказательство. Огромное спасибо Александру Миловскому за подсказку, позволившую мне открыть Америку через форточку (так мой дед называл изобретение для себя лично чего-либо уже известного окружающим). Именно из его статьи шагнул в массы термин «частотное разложение».

1. ТЕОРИЯ

Разложение в спектр.

В 1807 году Жан Батист Жозеф Фурье подготовил доклад «О распространении тепла в твёрдом теле», в котором использовал разложение функции в тригонометрический ряд

При таком преобразовании функция представляется в виде суммы синусоидальных колебаний (гармоник) с различной амплитудой

Любой сигнал может быть представлен в таком виде, а все образующие его гармоники вместе называются спектром

В 1933 году Владимир Александрович Котельников сформулировал и доказал теорему, согласно которой любой сигнал с конечным спектром может быть без потерь восстановлен после оцифровки, при условии, что частота дискретезации будет как минимум в два раза выше частоты верхней гармоники сигнала

Что такое пространственные частоты.

Частота с которой меняется яркость при перемещении по горизонтали или вертикали

Изображение — это двумерный сигнал (яркость меняется при перемещении по горизонтали и вертикали), поэтому общая решетка образуется из двух решеток различных ориентаций — горизонтальной и вертикальной

Чем выше частота, тем быстрее меняется яркость, тем мельче детали которые она задает

Самые мелкие детали — это перепады яркости на контрастных контурах

Разложение на полосы частот.

Для эффективной обработки сигнала нет необходимости раскладывать его в спектр, достаточно разложить его на несколько полос, содержащих все гармоники ниже или выше определеной частоты

Самые низкие частоты задают общее распределение яркости и, как следствие, цвета

Средние частоты уточняют эту картинку принося основные объемы объектов

Верхние частоты добавляют самую мелкую детализацию — фактуру поверхностей

Дополнительные материалы:

Алексей Шадрин. «Управление визуальным объемом изображений»Александр Миловский. «Муар нам только снится»

2. ПРОСТОЕ РАЗЛОЖЕНИЕ НА 2 ПОЛОСЫ ЧАСТОТ

Фильтры нижних и верхних частот.

Gaussian Blur — фильтр нижних пространственных частот

Чем больше Raduis, тем более крупные детали убираются, тем ниже оставшиеся частоты

High Pass — фильтр верхних пространственных частот, дополнительный к Gaussian Blur

High Pass показывает детали, которые убрал Gaussian Blur при том же значении Radius

Эти детали отображаются в виде отклонения от средне-серого цвета (отклонения от средней яркости в каждом канале)

Сложение исходного изображение из частотных полос.

Добавить эти отклонения к исходному изображению может режим Linear Light

Контраст ВЧ-слоя надо понизить в два раза вокруг средней яркости (тон 128), чтобы скомпенсировать заложенное в Linear Light удвоение

Это можно сделать при помощи кривых (Curves) подняв черную точку в позицию (0; 64) и опустив белую в позицию (255; 192)

Можно понизить контраст при помощи Brightness/Contrast с установкой Contrast -50 и активированным ключем Use Legacy

Вместо понижения контраста можно уменьшить до 50% непрозрачность слоя, но в этом случае регулятор Opasityиспользовать нельзя, а нужно воспользоваться регулятором Fill

Дополнительные материалы:

Андрей Журавлев. «Ретушь портрета на основе частотного разложения»

3. DODGE & BURN

Идеология Dodge & Burn.

Основная идея этой техники: ручное осветление излишне темных и затемнение слишком светлых участков для придания объекту более гладкой и правильной формы

Таким же образом усиливаются или дорисовываются недостающие объемы

Классически реализуется при помощи инструментов Dodge Tool и Burn Tool, но эти инструменты допускают только деструктивную обработку

Может быть реализована при помощи режимов наложения или корректирующих кривых с рисованием по макске слоя

Реализация Dodge & Burn при помощи режимов наложения.

Для сильной перерисовки свето-теневого рисунка используются режимы наложения Multiply и Screen

Рисование производится на пустых или залятых нейтральными для данных режимов цветом слоях

Основным преимуществом такой работы является большая сила воздействия: Multiply способен затемнять даже белый объект, а Screen осветлять даже черный

Дополнительным плюсом является возможность работать разным цветом на одном слое и простота выбора цвета: его можно брать с самого изображения

Минусом (особенно для начинающих) является уже упомянутая сила воздействия, заставляющая точно контролировать свои движения

Для легкой финальной правки применяют слой в режиме Soft Light (прозрачный или залитый средне-серым)

Плюсами являются: мягкость и визуальная однородность воздействия; ограниченный диапазон воздейстывий; отсутствие воздействия на белые и черные участки

Реализация Dodge & Burn при помощи кривых.

Затемнение и осветление производится при помощи корректирующих слоев кривых (Curves), а необходимые участки прорисовываются по их маскам

При затемнении происходит повышение, а при осветлении понижение, насыщенности изображения. Для их компенсации к каждому слою кривых через маску вырезания (Create Clipping Mask) добавляется слой Hue/Saturation

К плюсам метода можно отнести большую (по сравнению с использованием режимов наложения) гибкость последующих настроек

Минусом является невозможность вносить разные оттенки цвета при помощи одного корректирующего слоя

Для самостоятельного изучения:

Алиса Еронтьева и Дмитрий Никифоров. «Портретная ретушь»

4. ИНСТРУМЕНТЫ ИХ НАСТРОЙКИ

Почему выгодно править частотные полосы по отдельности.

При ретуши необходимо согласовывать цвет и его переходы с одной стороны и фактуру поверхности с другой

При исправлении формы крупных объектов выгодно использовать пониженную непрозрачность

Для сохранения мелких объектов (фактура поверхности) необходимо использовать 100% непрозрачность

Мягкая граница кисти у штампа — вынужденный компромисс между этими двумя требованиями

Жесткий стык между однородными однотипными фактурами заметен не будет

Выбор радиуса при разложении на две полосы частот.

Для Gaussian Blur выгодно задавать большой радиус, чтобы максимально убрать фактуру

Для High Pass выгодно задавать малый радиус, чтобы не пропустить объемы

Конкретное значение выбирается как компромиссный вариант между этими двумя условиями

При этом учитывается детали какой крупности мы относим к фактуре

Визуализация при выборе радиуса разложения.

Радиус Gaussian Blur удобнее подбирать плавно увеличивая его, пока не исчезнут ненужные детали

Радиус High Pass удобнее подбирать плавно уменьшая его, пока не пропадут ненужные объемы

Если более важной является форма, радиус удобнее подбирать ориентируясь на содержимое НЧ (размытая картинка)

Если более важной является фактура поверхности, радиус удобнее подбирать ориентируясь на содержимое ВЧ («хайпасная» картинка)

Зависимость радиусов от размера лица и крупности дефектов.

Пропорции среднего лица (ширина к высоте) составляют примерно один к полутора

При вычислении радиусов удобнее отталкиваться от высоты лица, так как она меньше зависит от ракурса съемки

Для удаления аккуратной фактуры кожи необходимо взять значение Radius порядка 1/280 — 1/250 от высоты лица

Для удаления мелких дефектов (прыщи, морщины и т.п.) необходимо взять значение Radius порядка 1/100 — 1/120 от высоты лица

Для удаления крупных дефектов (подглазины, шрамы и т.п.) необходимо взять значение Radius порядка 1/50 — 1/60 от высоты лица

5. РЕТУШЬ ПРИ РАЗЛОЖЕНИИ НА 2 ПОЛОСЫ ЧАСТОТ

Ретушь НЧ-составляющей — исправление формы.

Находящуюся на НЧ слое форму удобно ретушировать при помощи инструментов Clone Stamp, Brush и Mixer Brush

Штампом работаем с мягкой кистью и пониженной непрозрачностью

Можно работать на новом прозрачном слое с настройкой штампа Sample: Current & Below

При этом на экран можно вывести общий вид картинки, а не только НЧ слоя.

Кисть (Brush Tool) удобно использовать для закрашивания локальных дефектов (пробойные блики, проваальные тени и т.п.) телесным цветом

Mixer Brush используется для быстрого разглаживания лишних объемов

Ретушь ВЧ-составляющей исправление фактуры.

Работаем штампом с жесткой кистью и 100% непрозрачностью

Можно работать на новом прозрачном слое с настройкой штампа Sample: Current & Below и отображением только ВЧ слоя

Чтобы ретушировать глядя на финальную картинку надо работать на самом ВЧ слое (его копии) с настройкой штампа Sample: Current Layer

Чтобы иметь возможность откатиться к исходному состоянию ретушь проводят на копии слоя ВЧ с применением к нему команды Create Clipping Mask

Для лучшего контроля над деталями можно временно включить корректирующий слой кривых, повышающий контраст ВЧ составляющей

При отсутствии на изображении необходимой текстуры можно перенести ее с другой фотографии

Как работает Healing Brush.

На НЧ слое после размытия на участках рядом с контрастной границей появляется цвет соседней области

На ВЧ слое вдоль контрастных границ появляются ореолы противоположных цветов

Если в процессе ретуши ВЧ слоя убрать ореол на финальной картинке на этом участке появится цвет соседней области

Healing Brush переносит фактуру с донорской области, подгоняя цвет и яркость под ретушируемого участка под цвет и яркость его окрестностей

Его работа построена на алгоритме частотного разложения, а значение радиуса привязано к размер кисти

6. ОТДЕЛЬНЫЕ ПРИЕМЫ РЕТУШИ

Как побрить человека.

Вынести волоски (щетину) на ВЧ слой и заменить их фактурой чистой кожи

Если щетина была темная, поправить цвет на НЧ слое

Внимательно следите за фактурой, она сильно отличается на разных участках лица

«Брить» мужчину тяжело, поскольку на лице не хватает нужной фактуры

При необходимости нужную фактуру кожи можно взять с другой фотографии

Борьба с пробойными бликами. Ретушь НЧ.

Изображение раскладывается на две полосы с установками обеспечивающими полный переход фактуры кожи на ВЧ слой

На НЧ слое участки пробойных бликов закрашиваются цветом кожи

При необходимости на них наносится свето-теневой рисунок передающий объем объекта

Борьба с пробойными бликами. Ретушь ВЧ.

Если блик пробойный и вообще не содержал фактуры, она переносится с целых участков кожи

Если блик близок к пробойному и фактура кожи все-таки содержится, после ретуши НЧ она визуально усилится

Чтобы смягчить этот эффект можно наложить на нее фактуру с более гладких участков на отдельном слое с пониженной непрозрачностью

7. «ЧЕСТНОЕ» РАЗЛОЖЕНИЕ НА 2 ПОЛОСЫ ЧАСТОТ

Ошибка High Pass.

Максимальный диапазон разностей яркости от -256 (вычитаем белый из черного) до 256 (вычитаем черный из белого) составляет 512 тоновых уровней

Максимально возможные отклонения от средней яркости от -128 (затемнение) до 127 (осветление)

При наличии мелких деталей на массивном фоне отличающихся по яркости более чем на 128 уровней High Pass ошибается

Обычно это случается на точечных бликах расположенных на темном объекте

Чем больше радиус размытия, тем больше сама ошибка и вероятность ее появления.

На практике, при малых радиусах разница является «гомеопатической» и рассматривать ее как реальную проблему можно только с академической точки зрения

При больших радиусах ошибка составляет реальную проблему, поскольку «гасит» мелкие блики

Создание ВЧ составляющей вычитанием НЧ из оригинала.

Альтернативой High Pass является наложение на исходное изображение размытой версии при помощи команды Apply Image в режиме Subtract с установками Scale:2 Offset:128

В поле Offset (смещение) задается значение яркости вокруг которого будет откладываться результат вычитания

В поле Scale устанавливается во сколько раз будет уменьшаться результат вычитания перед добавлением к значению Offset

Диапазон установок Scale от 1 до 2, то есть контраст можно понизить максимум в 2 раза

Применять корректирующий слой понижающий контраст в этом случае не нужно, поскольку он уже понижен установкой Scale:2

Особенности разложения 16-битных изображений.

При вычислении ВЧ через команду Subtract у 16-битных изображений появляется ошибка величиной в 1 восьмибитный (128 шестнадцатибитных) уровень

Вероятно, это связано с тем, что реально вычисления происходят в пятнадцатибитном виде

Чтобы избежать этой ошибки при работе в 16-битном режиме вместо команды Subtract используют команду Add с активированным ключом Invert и установками Scale:2 Offset:0

Использование Surface Blur для получения НЧ составляющей.

В случае применения для получения НЧ составляющей Gaussian Blur вдоль контрастных границ создаются сильные ореолы

Ретушь в области ореолов может привести к «затягиванию» на объект цвета соседнего фона

Проблема проявляется тем более сильно, чем больше радиус размытия, поскольку в этом случае ореолы становятся более массивными и плотными

Чтобы избежать такой проблемы НЧ составляющую можно создавать при помощи фильтра Surface Blur

Границы, имеющие перепад яркости больше уровня установленного регулятором Threshold, не размываются

На практике удобнее всего подобрать значение Radius при установленном на максимум Threshold, а потом уменьшать значение Threshold до восстановления контрастных границ

8. АВТОМАТИЗАЦИЯ ПРОЦЕССА

Запись универсального экшена для разложения на 2 полосы частот.

Все операции выполняются со слоями, созданными самим экшеном

Слой создается командой Layer > New Layer и сразу переименовывается

Текущее изображение помещается на него при помощи команды Image > Apply Image с установкой Layer: Merged

Переключения между слоями выполняются при помощи шоткатов «Alt»+«[» и «Alt»+«]»

Для возможности переключения вместо отключения видимости слоя его непрозрачность уменьшается до нуля

При необходимости перемещение слоев выполняются командами Layer > Arange

В качестве подсказки перед применением Gaussian Blur в экшен вставляется команда Stop с комментариями по подбору радиуса

При регулярном применении Stop можно деактивировать или удалить

Преимущества «честного» разложения при работе с экшенами.

При записи экшена количество стандартных операций не является критичным

При этом важно минимизировать количество операций, требующих участия пользователя

Вычисление ВЧ составляющей через наложение НЧ на копию исходного слоя избавляет пользователя от задания радиуса для фильтра High Pass

Дополнительным плюсом такого метода является возможность применить для размытия не Gaussian Blur, а какой-нибудь другой фильтр

Создание набора экшенов для разложения на 2 полосы.

Сделать набор экшенов с жестко заданными значениями радиуса можно на основе универсального экшена

Для этого нужно убрать команду Stop, отключить диалоговое окно в Gaussian Blur и настроить его радиус на требуемый

Для удобства последующей работы с файлом к названиям слоев Low и High можно сразу добавить приписку со значением радиуса размытия

Экшен для пакетной обработки с настройкой по первому кадру.

При обработке серии фотографий с одинаковой крупностью объектов было бы удобно один раз вручную подобрать нужный радиус разложения, а потом применять его ко всей серии

Это можно сделать, если вместо прямого вызова конкретного фильтра вписать в экшен команду вызова последнего использовавшегося фильтра

Теперь достаточно один раз вызвать нужный фильтр (в рамках стандартного экшена или отдельно), настроить его параметры и он будет применяться при всех следующих запусках экшена

9. РАЗЛОЖЕНИЕ НА 3 ПОЛОСЫ ЧАСТОТ

Зачем раскладывают картинку на три полосы.

Чаще всего задача такого разложения — вынести все дефекты в среднюю полосу частот

Таким образом можно бороться с объектами определенного типоразмера, например веснушками

Кроме того, в средних частотах находится большинство «старящих» элементов: глубина морщин, жилистость, вены, провисания, мешки под глазами и т.п.

Реже ретушируются все три полосы, в этом случае процесс аналогичен разделению на 2 полосы, но позволяет проще работать объектами разного типоразмера

Как это сделать.

Для НЧ увеличиваем радиус Gaussian Blur пока не останется чистая форма

Для ВЧ уменьшаем радиус High Pass пока не останется чистая фактура

Создаем между нами слой средних частот применив к нему сначала High Pass с радиусом который использовался для создания НЧ, а потом Gaussian Blur с радиусом который использовался для создания ВЧ

Универсальное правило: High Pass следующего слоя имеет такой же радиус, как Gaussian Blur предыдущего

Теперь можно ретушировать средние частоты не обращая внимание не только на фактуру, но и на разницу цвета исходной и ретушируемой области

При «честном» разложении средние частоты получаются вычитанием из исходного изображения низких и высоких

Автоматизация разложение на три полосы.

Для создания ВЧ удобно использовать High Pass, поскольку он позволяет более наглядно подобрать радиус

В процессе подбора уменьшаем радиус High Pass пока на ВЧ не останется чистая фактура

Вместо High Pass можно использовать Gaussian Blur с визуализацией ВЧ составляющей

Слой средних частот можно получить вычитая из исходного изображения верхние и нижние частоты

10. УПРОЩЕННЫЙ МЕТОД РЕТУШИ СРЕДНИХ ЧАСТОТ (INVERTED HIGH PASS)

Почему можно упростить ретушь средних частот.

Ретушируя средние частоты мы прежде всего убираем лежащие в них излишние локальные объемы

Это можно сделать проще, не раскладывая изображение на три полосы, а выделить среднюю и вычесть ее из исходника

Вычитание должно быть локальным: только на участках где присутствует лишний объем, пропорционально степени его подавления

Как это сделать.

Подбирать радиус для High Pass удобнее через Gaussian Blur (через НЧ составляющую) и наоборот

Делаем копию исходного слоя

Вызываем Gaussian Blur, плавно увеличиваем радиус пока не исчезнут ненужные детали, запоминаем его значение и нажимаем Cansel

Вызываем High Pass, плавно уменьшаем радиус пока не пропадут ненужные объемы, запоминаем его значение и вводим радиус подобранный на предыдущем шаге

Применяем Gaussian Blur с радиусом подобранным на предыдущем шаге

Инвертируем изображение

В два раза понижаем контраст вокруг средней точки

Переключаем режим наложения на Linear Light

На слой вычитающий средние частоты из исходного изображения набрасываем черную маску

Белой кистью по маске прорисовываем те участки, на которых нужно подавить крупные детали

Автоматизация процесса.

Все рутинные операции записываются в экшен

Полоса средних частот получается вычитанием из исходного изображения НЧ и ВЧ полос с подобранными пользователем радиусами

За счет этого визуализация оказывается наиболее комфортной

Подбор верхнего радиуса можно делать после наложения на исходное изображение инвертированной СЧ+ВЧ составляющей. В этом случае используется Gaussian Blur и на размытой картинке начинает проступать чистая фактура

Чем приходится расплачиваться за скорость.

Результат ручной ретуши выглядите естественно прежде всего из-за сохранения мелких неоднородностей

За скорость и простоту приходится расплачиваться механистически правильной формой объектов, что визуально удешевляет работу

Соотношение радиусов обычно выбирают 1:3 или меньше, иначе результат будет выглядеть слишком неестественным

Для более тонкой работы соотношение радиусов берут примерно 1:2 и производят несколько циклов разложения с разными значениями вилки

При ретуши второстепенных участков можно брать соотношение 1:4 и даже больше

Для самостоятельного изучения:

Евгений Карташов. «Рецепты частотного разложения»

11. ЧАСТОТНОЕ РАЗЛОЖЕНИЕ И ДРУГИЕ ИНСТРУМЕНТЫ PHOTOSHOP

Средние частоты и Clarity.

Алгоритм работы Clarity строится на усилении (ослаблении) средних пространственных частот

При этом работа идет только по яркостной составляющей изображения

Повышение и ослабление Clarity не симметрично

Инструмент использует интеллектуальное размытие с сохранением контрастных контуров напоминающее Surface Blur, но не совпадающее с ним

При умеренных значениях можно рекомедовать использование Clarity в конвертере, при условии, что в дальнейшем изображение не будет подвергаться «сильной» обработке

Высокие частоты и повышение резкости.

Искусственное повышение резкости есть ни что иное, как усиление самых верхних из содержащихся в изображении частот.

При подготовке пейзажей основной проблемой является замыливание (исчезновение) сверх мелкой детализации (трава) вследствии нехватки разрешения.

Аналогичная проблема встает при подготовке изображений с мелкими деталями для размещения в интернете

Создать визуально ощущение наличия сверх мелких деталей можно добавив в изображение мелкий шум, согласованный с его элементами

Для этого повышаем резкость классическим способом, но оставляем это повышение только на низко контрастных областях

Проще всего это сделать используя Surface Blur в качестве фильтра, создающего нерезкую маску

12. В ЗАВЕРШЕНИИ РАЗГОВОРА

Для чего еще можно применять частотное разложение

Частотное разложение — это универсальный метод применимый к любому жанру фотографии

Убирать складки на ткани или других материалах

С его помощью можно смягчать слишком жесткие тени

Избавляться от разводов оставшихся после общей ретуши

Решать любые задачи, требующие различной работы с общей формой и мелкими деталями

Почему после частотного разложения картинка выглядит плохо?

Ретушь — это процесс не поддающийся автоматизации

Частотное разложение не делает ретушь за вас, оно лишь упрощает решение некоторых проблем

Увлекшись возможностью решить все «несколькими размашистыми мазками», при использовании частотного разложения ретушеры нередко позволяют себе работать халтурно

Будьте честны перед собой, не сваливайте собственные ошибки и халтуру на «плохую методику»

Чтобы избежать такой ловушки можно разделить процесс на два этапа

При помощи частотного разложения быстро поправить форму и разобраться с сильными огрехами фактуры (пробойные блики, грубая фактура и т.п.)

Последующую доработку производить при помощи привычных реализаций Dodge & Burn, чтобы обеспечить остаточную неоднородность и естественность изображения

Для самостоятельного изучения:

ModelMayhem.com — RAW! Beauty Robot.Сергей Брежнев «Частотное разложение vs Dodge&Burn»

Разложение в частотной области — Решения для структурной вибрации

Идея метода разложения в частотной области (FDD) заключается в выполнении приблизительного разложения отклика системы на набор независимых систем с одной степенью свободы (SDOF), по одной для каждого режима. Теория описана в R. Brincker, L. Zhang and P. Andersen: Modal Identification from Ambient Responses using Frequency Domain Decomposition.Proc. 18-й Международной конференции по модальному анализу (IMAC), Сан-Антонио, Техас, 2000.

Разложение выполняется простым разложением каждой из оцененных матриц спектральной плотности. В приведенной выше ссылке показано, что сингулярные значения являются оценками автоспектральной плотности систем SDOF в модальных координатах, а в окрестности резонансного пика сингулярные векторы являются оценками форм колебаний моды.

Техника FDD включает основные этапы, перечисленные ниже:

  1. Оцените матрицы спектральной плотности на основе необработанных данных временного ряда.
  2. Выполните разложение по сингулярным значениям матриц спектральной плотности.
  3. Если доступно несколько тестовых настроек, тогда усредните первое сингулярное значение всех тестовых настроек и усредните второе и т. Д.
  4. Пик пик по средним сингулярным значениям. Для хорошо разделенных режимов всегда выбирайте первое сингулярное значение. В случае близких или повторяющихся режимов выберите также второе сингулярное значение, третье сингулярное значение и т. Д.
  5. Дополнительно, если доступно несколько тестовых настроек, проверьте особые значения каждой тестовой настройки и при необходимости отредактируйте положение пикового захвата.

Первые три шага выполняются автоматически при обработке данных в задаче подготовки данных. Последние шаги требуют вашего ввода и выполняются с помощью окна модальной оценки. Этот метод является полностью непараметрическим методом, в котором режимы оцениваются исключительно путем обработки сигналов.

В случае с пластиной с гармониками , окно модальной оценки выглядит, как показано ниже, сразу после завершения обработки сигнала данных:

В этом случае обнаружение гармоник было включено, поскольку измерения также включают детерминированные сигналы от источника синусоидального возбуждения.Пик гармоники обозначен на частоте 374 Гц с вертикальной зеленой областью за пиком.

Модальная оценка с использованием декомпозиции в частотной области

В окне модальной оценки отображаются сингулярные значения матриц спектральной плотности. Если присутствует несколько наборов тестов, единичные значения, рассчитанные для каждого набора тестов, были усреднены для получения отображаемых кривых. В данном примере имеется одна испытательная установка с 16 каналами, и для получения представленных четырех кривых были оценены матрицы спектральной плотности размерности 16 × 4 для испытательной установки 1.В нем всего четыре столбца, поскольку в задаче «Подготовка данных» выбрано только четыре канала проекции.

Оценка новой хорошо-разделенной моды

Вы можете оценить режим вручную, нажав кнопку «Добавить новый режим», или использовать функцию автоматической оценки режима, нажав кнопку. Если вы используете руководство, синий крестик привязывается к ближайшей точке кривых сингулярных значений, как показано ниже:

Крестик фиксируется на пике, ближайшем к курсору мыши.В правой легенде расположение креста представлено в терминах частоты ( X = ) и сингулярного числа ( Y = ).

Чтобы оценить режим на пике, где находится крест, просто дважды щелкните левой кнопкой мыши. Чтобы отменить оценку, вместо этого нажмите клавишу < Esc >. Когда оценка завершена, вертикальная линия фиксируется на частоте в выбранном режиме. Кроме того, вместо синего креста появится зеленый крест, чтобы указать, какое сингулярное значение выбран режим.Ниже показан полный редактор после оценки режима:

Как видно, режим теперь обозначен зеленым и указан в списке режимов ниже. Пока режим выбран, он отображается зеленым цветом. Теперь вы можете сразу же щелкнуть начальную анимацию, чтобы проверить предполагаемую форму режима.

Чтобы выбрать другой режим, просто дважды щелкните нужную точку привязки. Вы можете сохранять режимы выбора, пока активна кнопка Добавить новый режим .

Оценка повторяющихся режимов

Если у вас есть система в качестве примера модели здания с повторяющимися режимами, вам может потребоваться выбрать режимы на нескольких кривых сингулярных значений на одной и той же частоте. Это означает, что если у вас есть два повторяющихся режима, вам придется выбрать их на первой и второй кривой сингулярных значений. Это также означает, что максимальное количество повторных режимов, которое можно оценить, равно минимальному количеству каналов или каналов проецирования в тестовых настройках.

Оценка близко расположенных мод

Также могут быть ситуации, когда режимы расположены близко друг к другу, как в случае первых режимов изгиба в примере модели здания. В этом случае все еще возможно выбрать моды для первых сингулярных значений. Однако разница между близким расположением и повторением зависит как от реальной системы, так и от частотного разрешения оценки спектральной плотности.

Когда вы выбираете режимы, вы должны попытаться визуализировать, что вы выбираете индивидуальные режимы на вершине их соответствующей функции спектральной плотности с одной степенью свободы (SDOF).Если вы можете представить себе, что колокол, например, две моды имеют пики на разных частотах, тогда они не повторяются и обе могут быть выбраны на первой кривой сингулярного значения. Если они имеют пики на одной и той же частоте, вам придется выбирать их на разных кривых сингулярных значений. Это то, чем пользуется улучшенный пиковый выбор. Он просто идентифицирует эти функции звонка SDOF, построенные на основе единичных значений.

Переключение между линиями среднего и отдельными сингулярными значениями

До сих пор все операции, относящиеся к оценке режима, выполнялись с использованием отображения усредненного сингулярного значения в редакторе пикового пика.Пока вы используете этот дисплей, при выборе сингулярных векторов в индивидуальных испытательных установках будут использоваться одна и та же частота и сингулярное значение. Этот способ оценки режимов является самым простым и, следовательно, наиболее рекомендуемым, и он будет работать в большинстве случаев. Однако иногда вы вынуждены изменить частоту и / или единичное значение в одной или нескольких тестовых установках. Это может произойти, если частота режима немного изменится или если другой режим внезапно станет намного более энергичным.По этой причине вы можете отключить отображение среднего значения и вместо этого просмотреть индивидуальную настройку теста. Когда вы выбираете отображение строк единичных значений для отдельных настроек теста, всегда отображаются строки выбранной в данный момент настройки теста.

Редактирование уже оцененного режима

Вы всегда можете редактировать текущий выбранный ( зеленый ) режим. Возможно, вы захотите отрегулировать частоту, на которой вы выбираете режим, или выбрать другую кривую сингулярного значения. Последнее применимо при работе с близко расположенными модами.

Чтобы активировать режим редактирования, начните с выбора режима, который вы хотите редактировать. Затем нажмите кнопку режима редактирования, которая активирует режим редактирования, который будет оставаться активным, пока вы не нажмете кнопку еще раз или не нажмете клавишу < ESC >. Если нажать левую кнопку мыши и удерживать ее нажатой, вы увидите синий крест, который привязывается к линии, и зеленый курсор, который указывает выбранный режим, как показано ниже:

Зеленый крест показывает, какой режим вы редактируете, а синие линии нарисованы от исходного положения режима.Синий крест показывает вам текущее положение привязки. Если вы отпустите кнопку мыши, режим переместится в это положение и будет переоценен с использованием новой частоты и положения сингулярного значения.

Примечание: Пока вы отображаете линии среднего сингулярного значения, изменения отражаются во всех тестовых настройках. Однако, если вы редактируете при отображении строк сингулярного значения
отдельной тестовой настройки, изменяются только частота и сингулярное значение этой конкретной тестовой настройки.

Удаление режима

Вы всегда можете удалить текущий выбранный ( зеленый ) режим, нажав кнопку режима удаления или в контекстном меню. Для каждого удаляемого режима вас просят подтвердить удаление.

Если вы хотите узнать больше, прочтите Расширенную декомпозицию частотной области.

Если вы хотите узнать больше, прочтите раздел «Подгонка кривой в частотной области».

Frequency Decomposition — обзор

3.2 Разделение источников многоканального звука

В этом разделе мы кратко представляем основы разделения источников многоканального звука. Эта презентация ограничена основным материалом, необходимым для понимания следующего обсуждения MASS в дикой природе. Действительно, цель этой главы не состоит в том, чтобы подробно представить теоретические основы и принципы разделения источников и формирования луча, даже ограничиваясь аудиоконтекстом: многие публикации посвящены этой проблеме, включая книги [13,26,33,61,89] и обзорные статьи [20,48,106].

Сотни методов усиления многоканального аудиосигнала были предложены в литературе за последние 40 лет по двум историческим направлениям исследований. Обработка массива микрофонов возникла из теории обработки массивов датчиков для телекоммуникаций и была сосредоточена в основном на локализации и улучшении речи в шумной или реверберирующей среде [14,18,25,49,84], в то время как MASS позже был популяризирован Сообщество машинного обучения, и оно рассматривало сценарии «коктейльной вечеринки» с участием нескольких источников звука, смешанных вместе [26,89,106,113,136,137].Эти два направления исследований сошлись в последнее десятилетие, и сегодня их трудно различить. Методы разделения источников больше не обязательно являются слепыми, и в большинстве из них используются те же теоретические инструменты, модели импульсной характеристики и принципы пространственной фильтрации, что и в методах улучшения речи.

Формализация задачи MASS начинается с формализации сигнала смеси. Наиболее общее выражение для линейной смеси сигналов источников J , записанных микрофонами I , —

(3.1) x (t) = ∑j = 1Jyj (t) + b (t) ∈RI,

, где yj (t) ∈RI — многоканальное изображение сигнала j -го источника sj (t) [128] с учетом эффекта распространения звука от положения излучаемого источника до микрофонов (каждая запись yij (t) из yj (t) является изображением sj (t) на микрофоне i ). b (t) — коэффициент шума датчика. В большинстве исследований MASS эффект распространения звука от источника j до микрофона i моделируется как линейный инвариантный во времени фильтр импульсной характеристики aij (t), и мы имеем

(3.2) x (t) = ∑j = 1J∑τ = 0La − 1aj (τ) sj (t − τ) + b (t).

Вектор aj (τ) содержит все ответы aij (t) для i∈ [1, I], которые, как предполагается, имеют одинаковую длину La для удобства. В зависимости от приложения цель MASS состоит в том, чтобы оценить либо исходные изображения yj (t), либо (одноканальные) исходные сигналы sj (t) по наблюдению x (t).

Современные методы MASS обычно начинаются с частотно-временного разложения временных сигналов, обычно с применением кратковременного преобразования Фурье (STFT) [29].На это есть две основные причины. Во-первых, подходы на основе моделей могут использовать преимущества очень конкретной разреженной структуры аудиосигналов в плоскости TF [115]: небольшая часть исходных коэффициентов TF имеет значительную энергию. Таким образом, исходные сигналы, как правило, намного меньше перекрываются в области TF, чем во временной области, что, естественно, способствует разделению. Во-вторых, принято считать, что на каждой частоте процесс сверточного микширования во временной области (3.2) преобразуется с помощью STFT в простое произведение между исходными коэффициентами STFT и коэффициентами дискретного преобразования Фурье (DFT) смешивающего фильтра, см. e.грамм. [4,91,107,109,110,146,147] и многие другие исследования:

(3.3) x (f, n) ≈∑j = 1Jaj (f) sj (f, n) + b (f, n) = A (f) s (f , n) + b (f, n),

где x (f, n), sj (f, n) и b (f, n) — СТПФ для x (τ), b (τ) и sj ( τ) соответственно, а aj (f) собирает ДПФ элементов aj (τ), известных как акустические передаточные функции (ATF). Векторы ATF объединяются в матрицу A (f), а исходные сигналы sj (f, n) складываются в вектор s (f, n). Во многих практических сценариях A (f) заменяется соответствующей матрицей относительной передаточной функции (RTF), для которой каждый столбец нормализуется своей первой записью.При такой нормализации первая строка A (f) состоит из «1», а исходные сигналы sj (f, n) заменяются их изображением на первом микрофоне. 2

Как далее обсуждается в разделе 3.3.3, (3.3) является приближением, которое допустимо, если длина импульсных характеристик фильтров смешивания короче, чем длина анализа окна STFT. В литературе и далее это приближение называется приближением мультипликативной передаточной функции (МПФ) [9] или узкополосным приближением [71].

MASS-методы затем можно разделить на четыре (неисключительные) категории [48,137]. Во-первых, методы разделения, основанные на анализе независимых компонентов (ICA), заключаются в оценке фильтров демиксирования, которые максимизируют независимость разделенных источников [26,61]. Методы ICA на TF-домен широко исследованы [103, 110, 127]. К сожалению, основанные на ICA методы подвержены хорошо известным проблемам неоднозначности масштабов и перестановки источников по элементам разрешения по частоте [3], которые обычно должны решаться как этап постобработки [62,119,120].Кроме того, эти методы нельзя напрямую применять к недоопределенным смесям.

Во-вторых, методы, основанные на анализе разреженных компонентов (SCA) и двоичном маскировании, основываются на предположении, что только один источник активен в каждой точке TF [4,91,118,146] (большинство методов рассматривают только один активный источник в каждом бине TF, хотя в принципе подходы SCA и ICA можно комбинировать, рассматривая до I активных источников в каждом бине TF). Эти методы часто основываются на некотором виде кластеризации источников в домене TF, обычно на основе пространственной информации, извлеченной из предшествующей идентификации фильтра смешивания.Следовательно, для такого рода методов проблема разделения источников часто связана с проблемой локализации источника (где находятся источники излучения?).

В-третьих, более современные методы основаны на вероятностных генеративных моделях в области STFT и связанных алгоритмах оценки параметров и вывода источника [137]. Последние в основном основаны на хорошо известной методологии максимизации ожидания (EM) [30] и т.п. (то есть методах итеративной альтернативной оптимизации). Одним из популярных подходов является моделирование коэффициентов STFT источника с помощью комплексной локальной гауссовой модели (LGM) [37,45,82,148], часто в сочетании с моделью неотрицательной матричной факторизации (NMF) [74], применяемой к спектральной плотности мощности источника. (PSD) матрица [6,44,107,109], которая напоминает такие новаторские работы, как [12].Это позволяет резко сократить количество параметров модели и (до некоторой степени) облегчить проблему перестановки источников. Источники звука обычно разделяются с помощью фильтров Винера, построенных на основе изученных параметров. Такой подход был расширен на супергауссовские (или с тяжелыми хвостами) распределения для моделирования разреженности аудиосигнала в области TF [98], а также на полностью байесовскую структуру путем рассмотрения априорных распределений для (источника и / или микширования). процесс) параметры модели [66].Обратите внимание, что, что касается методов SCA / двоичного маскирования, оценка параметров смешения и само разделение источников — это два разных этапа, которые часто обрабатываются поочередно в рамках методологии, основанной на принципах EM.

Методы, принадлежащие к четвертой категории, можно в целом классифицировать как методы формирования луча, что примерно эквивалентно линейной пространственной фильтрации . Формирователь луча — это вектор w (f) = [w1 (f),…, wI (f)] T, содержащий один комплексный весовой коэффициент для каждого микрофона, который применяется к x (n, f).Выход wH (f) x (n, f) может быть преобразован обратно во временную область с помощью обратного STFT. Изначально формирователи луча относились к пространственным фильтрам, основанным на направлении прихода (DOA) исходного сигнала, и только позже были обобщены на любые линейные пространственные фильтры. Формирователи луча на основе DOA все еще широко используются, особенно когда решающее значение имеют простота реализации и ее надежность. Однако ожидается, что характеристики этих формирователей луча ухудшатся по сравнению с современными формирователями луча, которые учитывают весь акустический путь [46].Вес формирователя луча устанавливается в соответствии с конкретным критерием оптимизации. Многие критерии формирования луча можно найти в общей литературе [134]. В сообществе обработки речи используется формирователь луча с минимальной дисперсией без искажений (MVDR) [46], формирователь луча с максимальным отношением сигнал / шум (MSNR) [142], многоканальный фильтр Винера (MWF) [34], в частности его искажение речи взвешенный вариант (SDW-MWF) [35] и формирователь луча с линейно ограниченной минимальной дисперсией (LCMV) [92], широко используются.

Можно утверждать, что до сих пор подход формирования луча приводил к более эффективным промышленным приложениям реального мира, чем «общий» подход MASS. Это заключается в различии между (а) усилением пространственно фиксированного доминирующего целевого речевого сигнала от фонового шума (возможно, состоящего из нескольких источников) и (б) четким разделением нескольких исходных сигналов, которые все рассматриваются как представляющие интерес сигналы, которые смешиваются с аналогичными мощность (проблема коктейльной вечеринки). Первую проблему, как правило, решить проще, чем вторую.Другими словами, второй можно рассматривать как продолжение первого. В любом случае, как мы сейчас увидим, проблемы обработки в естественных условиях в каждом случае остаются сложными.

Частотное разложение — обзор

3.2 Разделение источников многоканального звука

В этом разделе мы кратко представляем основы разделения источников многоканального звука. Эта презентация ограничена основным материалом, необходимым для понимания следующего обсуждения MASS в дикой природе.Действительно, цель этой главы не состоит в том, чтобы подробно представить теоретические основы и принципы разделения источников и формирования луча, даже ограничиваясь аудиоконтекстом: многие публикации посвящены этой проблеме, включая книги [13,26,33,61,89] и обзорные статьи [20,48,106].

Сотни методов усиления многоканального аудиосигнала были предложены в литературе за последние 40 лет по двум историческим направлениям исследований. Обработка массива микрофонов возникла из теории обработки массивов датчиков для телекоммуникаций и была сосредоточена в основном на локализации и улучшении речи в шумной или реверберирующей среде [14,18,25,49,84], в то время как MASS позже был популяризирован Сообщество машинного обучения, и оно рассматривало сценарии «коктейльной вечеринки» с участием нескольких источников звука, смешанных вместе [26,89,106,113,136,137].Эти два направления исследований сошлись в последнее десятилетие, и сегодня их трудно различить. Методы разделения источников больше не обязательно являются слепыми, и в большинстве из них используются те же теоретические инструменты, модели импульсной характеристики и принципы пространственной фильтрации, что и в методах улучшения речи.

Формализация задачи MASS начинается с формализации сигнала смеси. Наиболее общее выражение для линейной смеси сигналов источников J , записанных микрофонами I , —

(3.1) x (t) = ∑j = 1Jyj (t) + b (t) ∈RI,

, где yj (t) ∈RI — многоканальное изображение сигнала j -го источника sj (t) [128] с учетом эффекта распространения звука от положения излучаемого источника до микрофонов (каждая запись yij (t) из yj (t) является изображением sj (t) на микрофоне i ). b (t) — коэффициент шума датчика. В большинстве исследований MASS эффект распространения звука от источника j до микрофона i моделируется как линейный инвариантный во времени фильтр импульсной характеристики aij (t), и мы имеем

(3.2) x (t) = ∑j = 1J∑τ = 0La − 1aj (τ) sj (t − τ) + b (t).

Вектор aj (τ) содержит все ответы aij (t) для i∈ [1, I], которые, как предполагается, имеют одинаковую длину La для удобства. В зависимости от приложения цель MASS состоит в том, чтобы оценить либо исходные изображения yj (t), либо (одноканальные) исходные сигналы sj (t) по наблюдению x (t).

Современные методы MASS обычно начинаются с частотно-временного разложения временных сигналов, обычно с применением кратковременного преобразования Фурье (STFT) [29].На это есть две основные причины. Во-первых, подходы на основе моделей могут использовать преимущества очень конкретной разреженной структуры аудиосигналов в плоскости TF [115]: небольшая часть исходных коэффициентов TF имеет значительную энергию. Таким образом, исходные сигналы, как правило, намного меньше перекрываются в области TF, чем во временной области, что, естественно, способствует разделению. Во-вторых, принято считать, что на каждой частоте процесс сверточного микширования во временной области (3.2) преобразуется с помощью STFT в простое произведение между исходными коэффициентами STFT и коэффициентами дискретного преобразования Фурье (DFT) смешивающего фильтра, см. e.грамм. [4,91,107,109,110,146,147] и многие другие исследования:

(3.3) x (f, n) ≈∑j = 1Jaj (f) sj (f, n) + b (f, n) = A (f) s (f , n) + b (f, n),

где x (f, n), sj (f, n) и b (f, n) — СТПФ для x (τ), b (τ) и sj ( τ) соответственно, а aj (f) собирает ДПФ элементов aj (τ), известных как акустические передаточные функции (ATF). Векторы ATF объединяются в матрицу A (f), а исходные сигналы sj (f, n) складываются в вектор s (f, n). Во многих практических сценариях A (f) заменяется соответствующей матрицей относительной передаточной функции (RTF), для которой каждый столбец нормализуется своей первой записью.При такой нормализации первая строка A (f) состоит из «1», а исходные сигналы sj (f, n) заменяются их изображением на первом микрофоне. 2

Как далее обсуждается в разделе 3.3.3, (3.3) является приближением, которое допустимо, если длина импульсных характеристик фильтров смешивания короче, чем длина анализа окна STFT. В литературе и далее это приближение называется приближением мультипликативной передаточной функции (МПФ) [9] или узкополосным приближением [71].

MASS-методы затем можно разделить на четыре (неисключительные) категории [48,137]. Во-первых, методы разделения, основанные на анализе независимых компонентов (ICA), заключаются в оценке фильтров демиксирования, которые максимизируют независимость разделенных источников [26,61]. Методы ICA на TF-домен широко исследованы [103, 110, 127]. К сожалению, основанные на ICA методы подвержены хорошо известным проблемам неоднозначности масштабов и перестановки источников по элементам разрешения по частоте [3], которые обычно должны решаться как этап постобработки [62,119,120].Кроме того, эти методы нельзя напрямую применять к недоопределенным смесям.

Во-вторых, методы, основанные на анализе разреженных компонентов (SCA) и двоичном маскировании, основываются на предположении, что только один источник активен в каждой точке TF [4,91,118,146] (большинство методов рассматривают только один активный источник в каждом бине TF, хотя в принципе подходы SCA и ICA можно комбинировать, рассматривая до I активных источников в каждом бине TF). Эти методы часто основываются на некотором виде кластеризации источников в домене TF, обычно на основе пространственной информации, извлеченной из предшествующей идентификации фильтра смешивания.Следовательно, для такого рода методов проблема разделения источников часто связана с проблемой локализации источника (где находятся источники излучения?).

В-третьих, более современные методы основаны на вероятностных генеративных моделях в области STFT и связанных алгоритмах оценки параметров и вывода источника [137]. Последние в основном основаны на хорошо известной методологии максимизации ожидания (EM) [30] и т.п. (то есть методах итеративной альтернативной оптимизации). Одним из популярных подходов является моделирование коэффициентов STFT источника с помощью комплексной локальной гауссовой модели (LGM) [37,45,82,148], часто в сочетании с моделью неотрицательной матричной факторизации (NMF) [74], применяемой к спектральной плотности мощности источника. (PSD) матрица [6,44,107,109], которая напоминает такие новаторские работы, как [12].Это позволяет резко сократить количество параметров модели и (до некоторой степени) облегчить проблему перестановки источников. Источники звука обычно разделяются с помощью фильтров Винера, построенных на основе изученных параметров. Такой подход был расширен на супергауссовские (или с тяжелыми хвостами) распределения для моделирования разреженности аудиосигнала в области TF [98], а также на полностью байесовскую структуру путем рассмотрения априорных распределений для (источника и / или микширования). процесс) параметры модели [66].Обратите внимание, что, что касается методов SCA / двоичного маскирования, оценка параметров смешения и само разделение источников — это два разных этапа, которые часто обрабатываются поочередно в рамках методологии, основанной на принципах EM.

Методы, принадлежащие к четвертой категории, можно в целом классифицировать как методы формирования луча, что примерно эквивалентно линейной пространственной фильтрации . Формирователь луча — это вектор w (f) = [w1 (f),…, wI (f)] T, содержащий один комплексный весовой коэффициент для каждого микрофона, который применяется к x (n, f).Выход wH (f) x (n, f) может быть преобразован обратно во временную область с помощью обратного STFT. Изначально формирователи луча относились к пространственным фильтрам, основанным на направлении прихода (DOA) исходного сигнала, и только позже были обобщены на любые линейные пространственные фильтры. Формирователи луча на основе DOA все еще широко используются, особенно когда решающее значение имеют простота реализации и ее надежность. Однако ожидается, что характеристики этих формирователей луча ухудшатся по сравнению с современными формирователями луча, которые учитывают весь акустический путь [46].Вес формирователя луча устанавливается в соответствии с конкретным критерием оптимизации. Многие критерии формирования луча можно найти в общей литературе [134]. В сообществе обработки речи используется формирователь луча с минимальной дисперсией без искажений (MVDR) [46], формирователь луча с максимальным отношением сигнал / шум (MSNR) [142], многоканальный фильтр Винера (MWF) [34], в частности его искажение речи взвешенный вариант (SDW-MWF) [35] и формирователь луча с линейно ограниченной минимальной дисперсией (LCMV) [92], широко используются.

Можно утверждать, что до сих пор подход формирования луча приводил к более эффективным промышленным приложениям реального мира, чем «общий» подход MASS. Это заключается в различии между (а) усилением пространственно фиксированного доминирующего целевого речевого сигнала от фонового шума (возможно, состоящего из нескольких источников) и (б) четким разделением нескольких исходных сигналов, которые все рассматриваются как представляющие интерес сигналы, которые смешиваются с аналогичными мощность (проблема коктейльной вечеринки). Первую проблему, как правило, решить проще, чем вторую.Другими словами, второй можно рассматривать как продолжение первого. В любом случае, как мы сейчас увидим, проблемы обработки в естественных условиях в каждом случае остаются сложными.

Границы | Обобщенное кросс-частотное разложение: метод выделения нейронных компонентов, связанных на разных частотах

1. Введение

Синхронизация между популяциями нейронов считается ключевым механизмом, лежащим в основе взаимодействий между отдельными группами нейронов.Согласно гипотезе коммуникации через когерентность (CTC), эффективная коммуникация между двумя группами нейронов возможна только тогда, когда колебания синхронизированы по фазе (когерентны) (Fries, 2015).

Среди различных явлений синхронизации взаимодействия в одной и той же полосе частот (с соотношением 1: 1, т. Е. Гамма-гамма, альфа-альфа или бета-бета) в основном изучены и хорошо охарактеризованы как на людях (Varela et al., 2001; Halgren et al., 2002; Howard et al., 2003; Palva et al., 2005) и у животных (Womelsdorf et al., 2017). Эти согласованные взаимодействия присутствуют как во время выполнения задач, так и в состоянии покоя. В исследовании MEG было показано, что выраженная фазовая синхронность 1: 1 присутствует в состоянии покоя для всех частотных диапазонов и по всей коре, тогда как локальная 1: r , r ≥ 2, фазовая синхронность увеличивается во время решения задач. в диапазоне бета-альфа и гамма-альфа над задними областями правого полушария (Palva et al., 2005). Между тем, дальнодействующая фазовая синхронизация альфа-диапазона связана с обработкой внимания и рабочей памяти (Palva and Palva, 2011).Синхронизация в диапазонах бета и гамма частот и их пространственные закономерности указывают на активацию зрительного внимания и формирование визуального представления (Siebenhühner et al., 2016). Установлено, что синхронизация бета-фазы сопровождает обучение слухомоторному ритму (Edagawa, Kawasaki, 2017). Синхронизация нулевой фазы гамма-диапазона может быть связана с сенсорной репрезентацией в обонятельной луковице (Li and Cleland, 2017).

Помимо внутричастотной синхронизации, связь между двумя полосами частот также наблюдалась у людей (Sauseng et al., 2008; Джирса и Мюллер, 2013; Акияма и др., 2017; Palva and Palva, 2017) и записи животных (Chrobak and Buzsáki, 1998). Такая кросс-частотная синхронизация нейронных колебаний в двух различных частотных диапазонах является активной темой исследований (Palva, Palva, 2017). Фактически, недавние экспериментальные результаты предполагают, что перекрестная частотная связь между пространственно распределенными источниками может лежать в основе динамического формирования функциональных сетей мозга, участвующих в перцепционной, когнитивной и моторной деятельности (как описано в Hyafil et al., 2015).

Было обнаружено несколько типов перекрестной частотной связи: амплитудно-амплитудная, межфазная, межфазная перекрестно-частотная связь (Canolty et al., 2006; Jensen and Colgin, 2007). Согласно недавним открытиям, разные типы межчастотной связи связаны с различными функциональными ролями. Например, тета-колебания влияют на фазу или мощность гамма-колебаний в слуховых цепях во время обработки речи (Giraud and Poeppel, 2012; Hyafil et al., 2015). Перекрестная частотная связь между гамма-мощностью и альфа-фазой отражает индивидуальную способность кодировать память (Park et al., 2016).

Особенно важной формой нейронных взаимодействий является фазовая синхронизация, поскольку она представляет собой стабильные временные спайковые отношения между отдаленными колебаниями нейронов и, следовательно, напрямую координирует фазовую связь быстрых и медленных колебаний (Siebenhühner et al., 2016). Считается, что фазовая синхронизация интегрирует и координирует активность нейронов (Jirsa and Müller, 2013; Akiyama et al., 2017). Есть свидетельства того, что межчастотная фазовая синхронизация между тета- и альфа-гамма, а также между альфа- и бета-гамма-колебаниями отражает нагрузку на задачи рабочей памяти (Siebenhühner et al., 2016). Межчастотная фазовая связь лежит в основе недавних нейрофизиологических наблюдений на животных: взаимодействия тета-гамма нейронов в гиппокампе (Belluscio et al., 2012). Взаимодействие между колебаниями альфа-, тета-, бета- и гамма-диапазонов в лобно-корковых областях и их модуляция, по-видимому, играют решающую роль в высших когнитивных функциях (Palva and Palva, 2017), таких как рабочая память (Chaieb et al., 2015), интеграция памяти и процессы внимания (Sauseng et al., 2008).

Хотя это потенциально важно для когнитивных функций и вычислений мозга, связь между фазами нелегко охарактеризовать в неинвазивных записях, поскольку распространенные методы страдают от ряда трудностей, таких как несинусоидальный характер колебаний, нестационарность сигналы и большое количество шума в данных ЭЭГ (Никулин, Брисмар, 2006; Hyafil et al., 2015; Lozano-Soldevilla et al., 2016). Особенно сложная проблема связана с объемной проводимостью, которая приводит к одновременному обнаружению одного и того же сигнала на многих датчиках, что усложняет выделение отдельных нейронных источников, показывающих кросс-частотную синхронизацию. Один из способов решения этой проблемы — использовать моделирование обратного источника. Однако этот подход также имеет ограничения из-за неединственности получаемых решений. Наконец, для выделения связанных сигналов могут использоваться методы пространственного разложения, такие как SPoC (Source Power Comodulation) и CFD (Cross Frequency Decomposition).Последний, будучи высокоэффективным, ограничен соотношением 1: r (Никулин и др., 2012). Следовательно, необходимы новые методы для надежной оценки межчастотной фазовой связи.

Чтобы избежать ограничений предыдущих методов, в настоящем исследовании мы предлагаем новый подход для выделения компонентов, демонстрирующих межчастотную фазовую связь. Мы называем этот новый метод Generalized Cross-Frequency Decomposition (GCFD). GCFD — это обобщение CFD (Никулин и др., 2012) и использует нелинейные методы для извлечения наиболее сильных ритмических компонентов, объединенных при соотношении частот p : q . Этот метод применим к широкому диапазону перекрестных частотных взаимодействий по сравнению с предыдущими современными методами CFD. Мы протестировали работу GCFD как в моделировании, так и на реальных данных ЭЭГ (стационарные визуально вызванные потенциалы (SSVEP) и наборы данных в состоянии покоя).

2. Методы

2.1. Межчастотная фазовая синхронизация

Пусть с ( t ) будет ходом сигнала с действительным знаком во времени.Мгновенная фаза с ( t ) определяется следующим образом. Сигнал s ( t ) сначала комплексируется:

, где H, (·) — преобразование Гильберта, а i — мнимая единица. Комплексный сигнал s ~ (t) называется аналитическим сигналом для s ( t ) и допускает следующую факторизацию

s ~ (t) = A (t) · eiφ (t), A (t) ∈ℝ, A≥0, φ (t) ∈ℝ,

, где A ( t ) называется мгновенной амплитудой из s ( t ), а φ ( t ), определенная по модулю 2π, называется его мгновенной фазой .

Для изучения обычной 1: 1 фазовой синхронизации двух узкополосных сигналов s 1 ( t ) и s 2 ( t ) с одинаковой центральной частотой f , мы наблюдаем их циклическая разность фаз

Δφ (t): = φ2 (t) -φ1 (t) mod2π

в достаточно большом временном окне t = 1 .. T . В случае полного отсутствия синхронности эмпирическое распределение вероятности Δφ ( t ) по временному окну будет равномерным на отрезке [0, 2π].Любое существенное отклонение от равномерного распределения указывает на наличие взаимодействия между мгновенными фазами s 1 ( t ) и s 2 ( t ). Сильная форма этого — когда Δφ ( t ) имеет ярко выраженное унимодальное распределение на [0, 2π]. Это означает, что для некоторого c ∈ [0, 2π] почти в каждый момент времени мы наблюдаем, что φ 2 ( t ) −φ 1 ( t ) ≈ c .Это называется фазовой синхронизацией .

Теперь обобщим это на случай, когда центральные частоты f 1 и f 2 из s 1 ( t ) и s 2 ( t ) разные, но рационально связанные:

см. Rosenblum et al. (2001). Изучение синхронности между такими сигналами — основная цель данной статьи. Чтобы проанализировать этот случай, мы снова вычисляем их мгновенные фазы φ 1 и φ 2 , ​​но теперь мы рассматриваем обобщенную циклическую разность фаз

Δφp, q (t): = pφ2 (t) -qφ1 (t) mod2π.

Теперь мы говорим, что s 1 и s 2 находятся в межчастотной фазовой синхронизации (CFS) , если распределение Δφ p, q ( t ) не является униформа.

Мы используем следующее значение фазовой синхронизации (Rosenblum et al., 2001; Palva et al., 2005) для оценки силы CFS между с 1 и с 2 во временном окне t = 1 .. T :

PLVp, q (φ1, φ2) = 1T | ∑t = 1..TeiΔφp, q (t) |. (1)

2.2. Предварительная обработка

В случае записей, полученных эмпирическим путем, сырые данные Э / МЭГ проверяются и очищаются от мерцания и других мышечных артефактов. Это делается путем применения независимого анализа компонентов (алгоритм FastICA, см. Hyvärinen et al., 2001) и удаления всех компонентов, связанных с артефактами. В конце концов, у нас есть многоканальный сигнал E / MEG с одним или несколькими непрерывными временными интервалами, свободными от артефактов, которые называются эпохами .

Очищенные данные E / MEG затем фильтруются нижними частотами в широкую полосу, начиная с 0.От 5 Гц до примерно 150% максимальной частоты, используемой в анализе. Если нас интересует межчастотное взаимодействие между ритмом 20 Гц и ритмом 30 Гц, высокая частота среза фильтра будет 45 Гц. Это сделано для дальнейшей очистки данных от любого высокочастотного шума.

2.3. Алгоритм GCFD

Общий рабочий процесс предлагаемого метода представлен на рисунке 1, а подробности будут представлены в следующих разделах. Метод состоит из следующих основных этапов:

(a) выберите один диапазон, который представляет « эталон» , диапазон — P, а другой представляет « соответствует» , диапазон — Q;

(b) идентифицировать один или несколько компонентов-кандидатов для эталонной полосы;

(c) для другой частоты, используя нелинейную оптимизацию, найти уникальные компоненты, которые наиболее синхронизированы с кандидатами в эталонный ритм;

(d) выводит пары, которые демонстрируют лучшую синхронизацию.

Рисунок 1 . Схема алгоритма.

Ниже мы подробно рассмотрим каждый из этих шагов, а также некоторые вспомогательные шаги.

2.3.1. Выбор эталонного диапазона

В следующем анализе полосы частот f 1 и f 2 играют две разные роли. Сначала мы выбираем несколько наиболее сильных ритмических компонентов из эталонной полосы с помощью пространственно-спектральной декомпозиции, см. Подраздел 2.3.2.Эти компоненты становятся нашими опорными сигналами. Во-вторых, для каждого из эталонных сигналов мы находим компонент в соответствующей полосе, который наиболее синхронен с ритмической активностью в эталонном сигнале. Это делается с помощью нового метода кросс-частотной подгонки фазы (XPF), который составляет основу данной статьи.

Если нет особой причины предпочитать f 1 f 2 или наоборот в качестве эталонного диапазона, мы рекомендуем выбирать диапазон с меньшей частотой.Таким образом, полиномиальные выражения в процедуре нелинейной оптимизации имеют более низкие степени, и, следовательно, метод сходится быстрее и является более точным. В дальнейшем мы всегда предполагаем, что f 1 является эталонной полосой, а f 2 — подходящей полосой.

Здесь мы подчеркиваем, что XPF асимметричен относительно порядка полос частот f 1 и f 2 . То есть тот же анализ, но с переставленными местами полосами, как правило, не гарантирует получение тех же результатов.Однако численные эксперименты на смоделированных данных показывают, что, хотя результаты могут быть разными, оба подхода очень близки к истине. Пространственные шаблоны для компонентов в подходящей полосе в среднем обнаруживаются более точно, чем пространственные шаблоны для компонентов в эталонной полосе, мы подробно остановимся на этом в следующих разделах.

2.3.2. Пространственно-спектральное разложение

Для полосы опорных частот f 1 мы выполняем процедуру декомпозиции, которая позволяет нам выделить соответствующие колебательные компоненты и уменьшить размерность данных.Среди таких процедур метод пространственно-спектральной декомпозиции (SSD) (Никулин и др., 2011) показал особенно хорошие результаты в симуляционных тестах. Это связано с тем, что SSD лучше приспособлен для обработки узкополосных сигналов по сравнению с более общими методами, такими как ICA.

По сути, SSD максимизирует отношение сигнал / шум, которое определяется как отношение мощности в узкой полосе частот, представляющей интерес, к мощности шума в окружающих фланговых диапазонах частот. См. Nikulin et al.(2011), где представлено полное описание SSD, и (Никулин и др., 2012), раздел 3, где представлена ​​его компактная схема. Мы используем SSD в GCFD два раза. В первый раз мы используем SSD для извлечения самых сильных ритмических компонентов в эталонной полосе, см. Подраздел 2.3.1. Во второй раз мы выполняем SSD, чтобы снизить вычислительную сложность задачи нелинейной оптимизации за счет уменьшения эффективного количества компонентов в полосе соответствия, см. Подраздел 2.4.

Для последующего анализа из эталонной полосы мы берем только компоненты с наибольшими собственными значениями и отбрасываем остальную часть сигнального пространства эталонной полосы.В каждом конкретном наборе данных может быть разное количество этих важных компонентов. Мы рекомендуем сначала использовать количество компонентов по умолчанию, равное 5, и при необходимости изменить его позже.

2.3.3. Кросс-частотный фазовый фитинг (XPF)

Кросс-частотная фазовая подгонка (XPF) — это основная процедура GCFD. Его входами являются один узкополосный опорный сигнал r ( t ) на частоте f 1 и набор нескольких узкополосных сигналов m 1 ( t ),…, m I ( t ) на частоте f 2 , ​​где f 1 : f 2 = p : q с положительными целыми числами , q и t = 1.. Т . Во время стандартного рабочего процесса GCFD опорные сигналы — это компоненты от SSD, которые один за другим подаются в XPF. Другой возможный сценарий, описанный в подразделе 2.5, — это когда единственный опорный сигнал известен априори . Затем XPF применяется только один раз, используя этот конкретный сигнал и набор сигналов в подходящей полосе.

Мы предполагаем, что m i представляет собой линейную комбинацию неизвестного «целевого» сигнала s ( t ), который находится в межчастотной фазовой синхронизации (CFS) с r ( t ) и I N компоненты шума n i :

(m1 ⋮ mI) T = (sn1 ⋮ nIN) T · P, (2)

, где P — это матрица с действительным знаком ( I N + 1) на I , называемая матрицей пространственного смешивания или матрицей пространственного шаблона .Сначала мы стремимся восстановить коэффициенты w i ∈ ℝ такие, что s (t) = ∑iwimi (t). Эти коэффициенты называются пространственным фильтром или просто фильтром . Если бы P было квадратной матрицей, то w i было бы первым столбцом P −1 .

Для каждого канала r ( t ) и m i ( t ) мы вычисляем их комплексные аналитические сигналы r ~ (t) = r (t) + iH (r) (t) и m ~ i (t) = mi (t) + iH (mi) (t), где H (·) — преобразование Гильберта, а i — мнимая единица.Сигналы r ~ (t), m ~ i (t) представляют собой-значные временные ряды, такие что для каждых t = 1 .. T имеет

Re (r ~ (t)) = r (t), Re (m ~ i (t)) = mi (t).

Теперь для r ~ (t) мы выполняем так называемое искажение частоты в q раз . А именно, мы составляем новый-значный сигнал r ~ [q] (t) такой, что

| r ~ [q] (t) | = | r ~ (t) |, Arg (r ~ [q] (t)) = q · Arg (r ~ (t)). (3)

Эквивалентный способ записать это —

r ~ [q] (t) = r ~ (t) q | r ~ (t) | q-1 для каждого t∈1..T.

Обратите внимание на разницу между обозначениями (·) [ q ] и (·) q .Последнюю оставляем для штатного комплекса мощностью

.

По построению, всякий раз, когда какой-либо другой сигнал g ( t ) отображает p : q синхронизацию с r ~ (t), он также находится в p : 1 синхронизации с r ~ [q] ( t), и наоборот. q -я степень r ~ (t) q сигнала r ~ (t) имеет то же свойство, но менее удобна для вычислительных целей, поскольку ее величина | r ~ (t) | q может быть либо очень маленькой, либо очень большой для больших значений q .

Как указано в Nikulin et al. (2012), максимизация корреляции между узкополосными сигналами аналогична максимизации их когерентности. Ранее было замечено, что когерентность в первую очередь отражает фазовую синхронизацию (Nolte et al., 2004), но она также измеряет корреляцию амплитуд между двумя сигналами. Когерентность представляет собой фазовую синхронизацию, взвешенную по амплитудной комодуляции (Nolte et al., 2004; Friston et al., 2012). Мезейова и Палуш (2012), однако, показали, что на практике фазовая синхронизация (измеряемая с помощью индекса синхронизации) и когерентность могут давать аналогичные результаты.Кроме того, Nolte et al. (2004) заметили, что для эмпирических сигналов не совсем ясно, можно ли предположить независимость между амплитудой и фазой. Более того, авторы утверждали, что при очень низком отношении сигнал / шум фаза может сильно измениться, и, следовательно, когерентность (которая включает ковариацию амплитуды) может дать более надежные результаты, чем индекс синхронизации.

Основываясь на этом свидетельстве, мы будем максимизировать корреляцию между-значными сигналами s ~ 1p и s ~ 2, где s ~ 1 = s + iH (s1), s ~ 2 = s + iH (s2) — аналитические сигналы для с 1 , ​​ с 2 .Мы можем найти коэффициенты w i как решение задачи оптимизации

argminwi∈ℝ∑t | (∑iwim ~ i (t)) p-r ~ [q] (t) | 2 =? (4)

Обратите внимание, что, хотя и m ~ i (t), и r ~ [q] (t) являются комплексными, мы все еще ищем коэффициенты w i в действительном пространстве . Таким образом, это частный случай ограниченной нелинейной задачи наименьших квадратов (см., Например, Schittkowski, 1988). Стандартный подход — начать со случайного предположения для w i и итеративно спуститься до локального минимума.На практике несколько современных высокоуровневых вычислительных комплексов предлагают компактные решатели для задач ограниченного нелинейного метода наименьших квадратов. В нашей реализации мы использовали функцию lsqnonlin из MATLAB. Те, кто предпочитает Python, могут использовать функцию scipy.optimize.least_squares из пакета SciPy, который предоставляет аналогичную функциональность.

2.3.4. Назад к пространственным образцам

Наконец, для каждого опорного компонента r ( t ) в полосе частот f 1 , ​​у нас есть коэффициенты пространственного фильтра w i и компонент s ( t ) = ∑ w i m i ( t ) в подходящей полосе частот f 2 , ​​которая находится в межчастотной фазовой синхронизации с r ( т ).Теперь мы явно вычисляем значение межчастотной фазовой синхронизации (1) для r ( t ) и s ( t ) и выбираем пару ( r, s ) с наибольшим PLV.

Последний шаг — преобразовать пространственные фильтры для вновь обнаруженных компонентов в соответствующие пространственные паттерны (см. Haufe et al., 2014). Подход, предложенный Parra et al. (2005) основан на предположении, что источники взаимно некоррелированы, и дает компактную формулу

, где p, — искомый образец, s (t) = ∑iwimi (t), а M = ( m i ) — матрица сигналов сенсорного пространства в f 2 диапазон частот.Этот расчет эквивалентен (Haufe et al., 2014) умножению ковариационной матрицы данных в M на фильтр w .

Конечным результатом алгоритма является наиболее синхронная пара ( r, s ) вместе с соответствующими пространственными фильтрами и пространственными шаблонами. Эти пространственные паттерны теперь можно визуализировать в виде топографии кожи головы, см. Пример на Рисунке 3.

2,4. Вторичный SSD

Поскольку вычислительная сложность основной задачи нелинейной оптимизации быстро возрастает по мере увеличения числа каналов N (приблизительно, порядка ~ N 3 , в зависимости от конкретного решателя), иногда полезно уменьшить размер проблемы.Для этого мы проецируем исходное пространство датчика в линейное подпространство меньшего размера. Мы применяем пространственно-спектральную декомпозицию (см. Подраздел 2.3.2) к узкополосным сигналам на частоте f 2 и пренебрегаем всеми, кроме 15 наиболее значимых компонентов. Например, для N = 60 датчиков это дает ускорение примерно в 4 3 = 64 раза. Для большего количества датчиков этот шаг становится еще более важным.

Затем применяем ту же процедуру нелинейной оптимизации (см. П. 2.3.3) к тому же опорному сигналу и первым 15 компонентам SSD в качестве сигналов соответствия. Это возможно, потому что оптимизация фактически не использует информацию о реальном характере положения датчиков и одинаково хорошо работает для таких «виртуальных датчиков». Наконец, каждый пространственный образец p ′ длины 15, обнаруженный в пространстве виртуальных датчиков, должен быть преобразован обратно в исходное пространство датчика:

, где p — это пространственный шаблон длиной N в пространстве реальных датчиков, а S — это матрица N × 15 пространственных шаблонов компонентов SSD.

Обратите внимание, что такая оптимизация скорости может происходить за счет снижения точности алгоритма, потому что поиск лучшего пространственного фильтра затем выполняется в некотором 15-мерном подпространстве, а не во всем пространстве фильтра. Таким образом, в некоторых случаях можно отключить эту опцию. Однако эта опция чрезвычайно полезна для быстрого грубого поиска синхронизированных компонентов по множеству комбинаций частотных диапазонов.

2,5. Опорный сигнал

r Известный априори

В некоторых экспериментальных сценариях мы можем захотеть изучить синхронизацию колебаний мозга с определенным сигналом, который уже известен.Например, Байрактароглу и др. (2011) провели исследование кортико-мышечной когерентности между одноканальным сигналом электромиограммы и данными многоканальной ЭЭГ. Другой пример — увлечение нейрональной активности зрительной коры на периодическое мерцание экрана. В таком случае шаг SSD не требуется перед основной процедурой нелинейной оптимизации. Другой подходящий пример для этого сценария — запись потенциала локального поля (LFP) с хорошим SNR. Во всех этих случаях метод пропускает шаги (а) и (б), вспомните раздел 2.3, и сразу переходим к пункту (c), поскольку нам нужна только процедура XPF без остальной части алгоритма GCFD. Мы будем называть эту усеченную версию рабочего процесса отсоединенной процедурой XPF .

Мы провели численное моделирование, чтобы оценить способность отдельного XPF справляться с этими ситуациями с помощью известных опорных сигналов. Эти тесты показали, что в этом режиме общее качество восстановления шаблона для синхронизированных источников значительно лучше, чем у более сложного полного алгоритма GCFD (см. Ниже).Более того, отделенный XPF может точно реконструировать источник при больших значениях p и q , протестированных до p, q = 5. Подробности см. В подразделе 3.1.

2,6. Общая фазовая синхронизация

Выше мы искали компоненты с межчастотной фазовой синхронизацией:

Более слабое состояние, называемое межчастотной фазовой синхронизацией , требует только постоянной разницы между адаптированными циклическими фазами сигналов:

Для поиска межчастотных компонентов с фазовой синхронизацией в сигнале E / MEG мы модифицируем формулу (3) для искажения частоты опорных компонентов.Выберем целое число K ≈10 и определим комплексные сигналы r ~ [q, k] как

| r ~ [q, k] (t) | = | r ~ (t) |, Arg (r ~ [q, k] (t)) = q · Arg (r ~ (t)) + kK2π (5)

для k = 0 .. K −1. Затем мы запускаем вышеуказанные алгоритмы для каждого k = 1 .. K −1 и ищем компоненты с наивысшим PLV среди всех прогонов.

Наш предварительный анализ показал, что распределение разностей фаз между компонентами довольно широкое, что указывает на то, что нет необходимости точно совмещать фазы обоих сигналов, чтобы иметь разность 0 или π.Аналогичное число K = 12 было успешно использовано в другом исследовании для оптимизации когерентности (Bayraktaroglu et al., 2012).

2,7. Симуляторы

Для тестов производительности алгоритмов мы выбрали p : q отношений, которые с наибольшей вероятностью демонстрируют межчастотную фазовую синхронизацию в записях Э / МЭГ человеческого мозга:

p: q = 1: 2,1: 3,1: 4,2: 1,2: 3,3: 1,3: 2,3: 4,4: 1,4: 3. (6)

Мы стремились к моделированию фазовых взаимодействий между тета-, альфа-, бета-колебаниями и низкими гамма-колебаниями.Некоторые из них, например альфа: бета (1: 2), ранее наблюдались в записях Э / МЭГ. Для каждого отношения p : q мы провели 100 независимых рандомизированных симуляций мозговой активности и проверили, насколько точным был наш алгоритм, восстанавливающий истинные синхронизированные источники.

Для каждого моделирования мы сначала сгенерировали 5 независимых пар перекрестно-синхронизированных колебательных сигналов с различным соотношением частот p : q . Процедура для каждой пары была следующей.Мы генерировали белый шум длительностью 150 секунд, дискретизированный с частотой 200 Гц. Затем этот шум подвергался полосовой фильтрации в диапазоне частот 9-11 Гц с использованием двух проходов фильтра Баттерворта, одного прямого и одного обратного. Такие два прохода позволяют нейтрализовать любые фазовые искажения, вызванные артефактами одного прохода фильтра (Mitra and Kuo, 2001). Затем мы исказили по частоте две копии этого сигнала на p и на q раз, соответственно. Это дало нам пару синхронизированных сигналов p : q в полосах частот около 10 p Гц и 10 q Гц.

Кроме того, мы использовали 100 взаимно независимых источников шума со спектром мощности 1/ f (так называемый розовый шум ). Такой спектр мощности типичен для записи Э / МЭГ мозга человека.

Каждый из 10 синхронизированных колебательных сигналов и 100 шумовых сигналов соответствует соответствующему диполю тока, случайно выбранному из узлов треугольной мозаичной корковой мантии. Ориентация диполя также была рандомизирована. Мы использовали реалистичную модель прямого проводника с тремя отсеками (Nolte and Dassios, 2005), основанную на главе Монреальского неврологического института (MNI) (Evans et al., 1994) для расчета смоделированных сигналов датчиков ЭЭГ по сигналам источников. Каждая моделированная запись ЭЭГ имела 64 канала, соответствующих стандартным положениям датчиков.

Кроме того, мы нормализовали отношения сигнал / шум (SNR) всех наших сигналов, которые мы определяем как отношение средней дисперсии сигналов по каналам для каждого проецируемого сигнального диполя и средней дисперсии по каналам для всего проецируемого сигнала. совокупный шум. Мы проверили производительность нашего алгоритма для значений SNR, равных 0.1, 0,5, 1,0, 2,0, см. Ниже.

Затем для каждого моделирования мы запускали алгоритм GCFD реконструкции источника, описанный в подразделах 2.2–2.4. Результирующие пространственные шаблоны для восстановленных источников в полосе частот f 1 затем сравниваются с истинными шаблонами, которые известны a priori по дизайну.

В дополнение к этим симуляциям мы также выполнили симуляции для случая 2: 3 (SNR = 0,5), смешивая пять компонентов в диапазоне частот 20 Гц, но соответствующие составляющие 30 Гц были получены путем искажения частоты других пяти составляющих 10 Гц, которые были независимыми. первых 10 Гц компонентов..

Обратите внимание, что восстановленные шаблоны не имеют определенного порядка, связанного с исходными шаблонами. Чтобы найти фактическую ошибку восстановления для каждого сигнала, требуется процедура сортировки. А именно, мы рассчитали все попарные расхождения паттернов между всеми восстановленными паттернами и всеми исходными паттернами. Затем мы использовали жадный алгоритм для сопоставления восстановленных шаблонов с исходными шаблонами: сначала мы находим пару восстановленного шаблона и исходного шаблона с наименьшим расхождением, а затем мы удаляем их оба из наборов шаблонов.Затем мы повторяем процедуру с оставшимися шаблонами, чтобы найти второе наилучшее совпадение и так далее, .

Каждая симуляция дает вектор из 5 чисел расходимости паттернов. Умножив на 100 симуляций, в итоге мы получим 500 чисел для каждого отношения частот p : q и каждого значения SNR. См. Результаты и обсуждение в подразделе 3.2 и на рисунке 3.

2.8.2. Эмпирические данные

Что касается эмпирических данных, нам не хватает информации о базовых шаблонах истинности, и поэтому мы не можем напрямую измерить расхождения между основными шаблонами истинности и предполагаемыми шаблонами.В этом случае мы скорее используем расхождение шаблона как меру сходства между двумя шаблонами, относящимися к компонентам с перекрестной частотной связью.

2.9. Реальные записи ЭЭГ

2.9.1. Состояние покоя

Алгоритм GCFD протестирован на данных ЭЭГ, полученных в Центре познания и принятия решений НИУ ВШЭ, Москва. Все экспериментальные процедуры были одобрены местным этическим комитетом. Участники подписали форму информированного согласия.В эксперименте ЭЭГ участвовали 32 здоровых человека (12 мужчин, правши, средний возраст 23 года). Данные ЭЭГ регистрировались с помощью 60 активных электродов BrainVision actiCHamp (Brain Products GmbH) по расширенной версии системы 10–20. Данные были дискретизированы с частотой 500 Гц. Активные каналы сравнивали со средним значением двух сосцевидных электродов. Электроокулограмма записывалась с помощью электродов, размещенных на наружном уголке глаза и ниже правого глаза. Записи ЭЭГ были отфильтрованы в автономном режиме в диапазоне частот 0.5–40 Гц. Спектральный анализ с помощью БПФ (быстрое преобразование Фурье) проводился с окном Хэммингса 3 секунды. Участники удобно рассаживались перед темным экраном в течение 10 минут, не сводя глаз с креста перед собой.

Для последовательного автономного анализа данные ЭЭГ были субдискретизированы до 200 Гц, длина данных составила 10 минут. Мы уменьшили размер сигнала, используя 5 самых сильных компонентов SSD в обоих интересующих частотных диапазонах p * f 1 ± 1 Гц и q * f 2 ± 1 Гц.Настройки для SSD были следующими: диапазон частот среза для полосового фильтра: p * f 1 ± 1 Гц и q * f 2 ± 1 Гц; диапазон частот среза для самых низких и самых высоких частот, определяющих фланкирующие интервалы, составлял p * f 1 ± 3 Гц и q * f 2 ± 3 Гц; Диапазон частот среза для полосового фильтра составлял p * f 1 ± 2 Гц и q * f 2 ± 2 Гц.Мы искали самые сильные синхронные компоненты для p : q , равных 2: 1 и 2: 3, и базовые частоты из альфа-диапазона частот (8–12 Гц). Например, максимальное значение PLV для p : q = 2: 3 могло быть достигнуто при базовой частоте 9,5 Гц, что означало бы, что наиболее синхронизированные 2: 3 компоненты находятся на частотах 19 Гц и 28,5 Гц.

2.9.2. Устойчивые визуальные вызванные потенциалы

Для демонстрации работы GCFD мы использовали данные ЭЭГ, полученные в Центре познания и принятия решений НИУ ВШЭ, Москва, с устойчивыми визуально вызванными потенциалами (SSVEP), которые были записаны для экспериментов BCI (Ишкан и Никулин , 2018).Все экспериментальные процедуры были одобрены местным этическим комитетом. Участники подписали форму информированного согласия. В эксперименте приняли участие 24 здоровых человека (возраст 18–41 год). ЭЭГ регистрировали с частотой дискретизации 1 кГц усилителем ActiCHamp с использованием программного обеспечения PyCorder (Brain Products) с 60 каналов actiCHamp. Полосовой фильтр с частотами отсечки 0,53 и 40 Гц был применен к необработанным данным для удаления составляющей постоянного тока и высокочастотных артефактов. Во время эксперимента испытуемые должны были смотреть на экран компьютера с одним периодически мерцающим кружком.Эта установка, как известно, вызывает периодические потенциалы, известные как устойчивые визуальные вызванные потенциалы (SSVEP), в зрительной коре головного мозга субъектов с той же частотой, что и частота мерцания (Friman et al., 2007). Эксперимент был разбит на 3-секундные сегменты. Для каждого сегмента частота мерцания была случайным образом выбрана из четырех фиксированных значений: 5,45, 8,57, 12, 15 Гц.

Для последовательного анализа GCFD мы объединили все 3-секундные пробные записи в один 75-секундный многоканальный сигнал для каждого объекта и каждой частоты мерцания.Поскольку необработанные данные были отфильтрованы с помощью фильтра высоких частот с частотой 0,53 Гц перед объединением, не было никаких смещений между эпохами, и, таким образом, последующая фильтрация не приводила к появлению артефактов, что также было подтверждено визуальным осмотром.

Мы уменьшили размер сигнала, используя 15 самых сильных компонентов SSD в обоих интересующих частотных диапазонах p * f 1 ± 1 Гц и q * f 2 ± 1 Гц. Для SSD использовались следующие настройки: диапазон частот среза полосового фильтра: p * f 1 ± 1 Гц и q * f 2 ± 1 Гц; диапазон частот среза для самых низких и самых высоких частот, определяющих интервалы фланкирования, составлял p * f 1 ± 3 Гц и q * f 2 ± 3 Гц; Диапазон частот среза для полосового фильтра составлял p * f 1 ± 2 Гц и q * f 2 ± 2 Гц.Для удобства вычислений в нашем анализе мы аппроксимировали реальные частоты мерцания 5,45, 8,57, 12, 15 Гц с целочисленными частотами 6, 9, 12, 15 Гц соответственно.

2.9.3. Статистическое тестирование

Мы использовали непараметрический критерий перестановки для оценки статистической значимости результатов (Maris and Oostenveld, 2007). В нашем подходе тестовая статистика была получена из GCFD, примененного к случайно переставленным данным.

Мы разделили записи и объединили сегменты в случайном порядке из данных, относящихся к поиску пространственного фильтра w , сохранив при этом порядок сегментов в опорном сигнале, который описан в разделе 2.3.1. Обратите внимание, что эта рандомизация была выполнена до нахождения пространственных фильтров w , так что все остальные шаги сохраняются, как в основном анализе.

Затем мы запустили наш алгоритм на переставленной записи и получили новый парный сигнал для опорного сигнала. Затем мы создали распределение перестановок, повторив эту процедуру 1000 раз и вычислив для каждой пары соответствующее значение фазовой синхронизации (1). Нулевая гипотеза при этом тесте на перестановку заключалась в том, что все переставленные пары и исходная пара принадлежали одному и тому же распределению.Наконец, мы вычислили P-значение для исходной пары сигналов, и если оно было меньше 0,05, мы пришли к выводу, что результат был статистически значимым.

Это часто используемый подход для непараметрического тестирования перестановок (Hesterberg et al., 2005; Maris et al., 2007), который сохраняет спектры сигналов и все шаги оптимизации, таким образом представляя надежную процедуру для управления эффектами переоснащение.

3. Результаты

3.1. Отдельный тест XPF

Сначала мы проверили, насколько точна процедура отсоединения XPF (вспомните Подраздел 2.3.3) восстанавливает пространственные структуры источников в сценарии, когда истинные источники предоставляются в качестве опорных сигналов, и, таким образом, нам нужно только найти компоненты с перекрестно-частотной связью в подходящей полосе. Обратите внимание, что это также действительное моделирование эксперимента, когда захватывающий сигнал известен из других источников, таких как кардиограмма, миограмма, колебательный сигнал от транскраниальной стимуляции переменным током, визуальный или слуховой сигнал и т. Д. Подробнее см. В подразделе 2.5. . За каждую пару

p: q = 1: 2,1: 3,1: 4,2: 1,2: 3,3: 1,3: 2,3: 4,4: 1,4: 3 (8)

и каждый SNR = 1.0, 0.5, 0.1 мы выполнили 100 симуляций, аналогичных описанным в подразделе 2.7. Результаты представлены на рисунке 2. Мы видим удивительно хорошие характеристики для всех SNR и для всех пар p : q с соответствующим расхождением модели <0,05.

Рисунок 2 . Точность восстановления паттерна оторванного XPF.

В этом тесте мы практически устранили все ошибки, связанные с производительностью алгоритма SSD на этапе первоначального извлечения эталонных компонентов.Как мы покажем позже, недостаточно чистое извлечение компонентов SSD может привести к ошибкам реконструкции для алгоритма GCFD, сравните рисунки 2, 4.

В целом результаты этого теста демонстрируют, что процедура оптимизации ядра работает хорошо для всех протестированных соотношений частот, которые часто встречаются в исследованиях синхронизации сигналов E / MEG.

3.2. Моделирование для алгоритма GCFD

Моделирование, основанное на реалистичном моделировании головы, показало, что алгоритм GCFD надежно восстанавливает перекрестно-частотные компоненты на разных частотах, относящиеся друг к другу через рациональные числа p : q до, по крайней мере, p, q ≤ 4.Это значительное улучшение по сравнению с базовым алгоритмом кросс-частотной декомпозиции (CFD) (Никулин и др., 2012), который был пригоден только для случая p = 1 и q ≤ 3.

На рисунке 3 показан пример реконструкции 5 смоделированных источников 30 Гц, синхронизированных с 5 другими источниками 20 Гц. В этом примере p : q = 3: 2 и SNR = 0,1 для полос частот 30 и 20 Гц. Рисунок 3 демонстрирует, что восстановленные топографии источников 30 и 20 Гц были очень похожи на смоделированные изображения.

Рисунок 3 . Шаблоны источников (SP) и восстановленные шаблоны (RP) для 5 пар смоделированных синхронизированных источников на 20 и 30 Гц. SNR = 0,1. Цветовая шкала в произвольных единицах.

Чтобы измерить общее качество восстановления шаблона алгоритма GCFD, мы выполнили серию из 100 симуляций для каждого из соотношений частот (6) p : q = 1: 2, 1: 3, 1: 4, 2: 1, 2: 3, 3: 1, 3: 2, 3: 4, 4: 1, 4: 3 и отношения сигнал / шум = 1,0, 0,5, 0,1. Результаты показаны на рисунке 4.

Рисунок 4 . Точность восстановления образов для всего GCFD.

Естественно, что по мере уменьшения отношения сигнал / шум для каждого фиксированного отношения p : q мы наблюдали постепенное снижение точности восстановления структуры. Однако для всех соотношений частот даже при SNR ≥0,1 средняя ошибка все еще была очень маленькой, не более 0,08. Результаты отдельного теста XPF, см. Подраздел 3.1, показывают, что основной источник снижения точности связан с недостаточной производительностью SSD.

В целом мы пришли к выводу, что для всех протестированных частот и SNR ≥0,1 точность восстановления структуры достаточна для анализа синхронизированных источников в реальных записях E / MEG.

При моделировании несвязанных источников мы наблюдали, что при SNR = 0,5 расходимость диаграмм составляла в среднем 0,33, что как минимум в 15 раз больше, чем расходимость диаграмм, характерных для связанных источников. Такие значения расхождения рисунка указывают на то, что извлеченные топографии сильно отличались от топографий исходных несвязанных источников.Это, в свою очередь, указывает на то, что при моделировании, когда источники не связаны, GCFD не может восстановить смоделированные компоненты.

3.3. Реальные записи ЭЭГ

3.3.1. Состояние покоя

Сначала мы проверили, как работает GCFD для записей ЭЭГ в состоянии покоя, описанных в 2.9.1. Мы выбрали 8 субъектов с наиболее выраженными пиками мощности в диапазоне частот альфа, бета и гамма и провели анализ GCFD для выявления синхронных источников с перекрестно-частотной связью. Базовые частоты были взяты из альфа-диапазона 8–12 Гц.На рисунке 5A показаны результаты для типичного объекта, для которого мы выполнили поиск в соотношении 2: 1 и 2: 3 с базовой частотой, равной 9,9 Гц. На рисунке 6A представлены все пары сигналов, восстановленные GCFD для всех участников.

Рисунок 5 . Примеры кросс-частотных синхронных колебаний, обнаруженных с помощью алгоритма GCFD для поиска 2: 1 и 2: 3. (A) Для данных состояния покоя. (B) Для записи с SSVEP 12 Гц.

Рисунок 6 .Пары всех компонентов (2: 1 и 2: 3) из всех предметов, извлеченных с помощью GCFD для поиска 2: 1 (слева) и 2: 3 (справа). (A) Для данных состояния покоя. (B) Для записи с SSVEP 12 Гц.

Для отношения частот 2: 1 большинство (92%) вычисленных значений фазовой синхронизации были статистически значимыми. Однако корреляция между PLV и дивергенцией паттернов не была особенно сильной ( R 2 = 0,49), что указывает на то, что только часть данных, вероятно, представляет связь из-за несинусоидальной формы нейронных колебаний.

Для соотношения частот 2: 3 только 20% PLV были статистически значимыми. Мы также проанализировали взаимосвязь между силой фазовой связи и релевантной расходимостью паттернов. Мы наблюдали отрицательную корреляцию для случая 2: 1 ( p -значение = 7 · 10 −6 ) и отсутствие корреляции для 2: 3 ( p -значение = 0,11).

3.3.2. Устойчивые визуальные вызванные потенциалы

Мы также протестировали GCFD на сигналах устойчивых визуальных вызванных потенциалов (SSVEP), описанных в 2.9.2. Цель состояла в том, чтобы продемонстрировать, что наш подход может найти гармоники, синхронизированные по фазе между частотами, сигналов SSVEP с частотами, относящимися друг к другу посредством рационального соотношения p : q для p, q ≤ 4. Мы выполнили GCFD анализ по 24 предметам с частотой мерцания 5,45, 8,57, 12 и 15 Гц. Мы использовали частоту визуальной стимуляции в качестве базовой частоты и установили соотношение p : q согласно исследованным гармоникам сигнала SSVEP.На рисунке 5B показаны результаты для типичного субъекта с частотой визуальной стимуляции 12 Гц, где выполнялись поиски 2: 1 и 2: 3. Мы наблюдали пары сигналов с похожими пространственными паттернами, которые предполагают, что соответствующие источники нейронов находятся в зрительной коре. Более того, мы наблюдали значительно высокие значения PLV между компонентами с разными частотами. Значимость результатов проверялась с помощью перестановочных тестов, описанных ранее в подразделе 2.9.3. Перестановочные тесты показали, что 44 и 28% пар были значимы для взаимодействий 2: 1 и 2: 3 соответственно.На рис. 6В показаны все пары сигналов, обнаруженные методом GCFD в записях ЭЭГ с частотой стимуляции 12 Гц для поиска 2: 1 и 2: 3. Дивергенция паттернов была рассчитана в соответствии с 7. Это указывает на сходство между двумя топографиями. Никакой существенной корреляции между PLV и расхождением паттернов не наблюдалось для 2: 1 ( p -значение = 0,10) и 2: 3 ( p -значение = 0,13).

4. Обсуждение

Мы представили новый алгоритм для обнаружения и выделения межчастотных фазово-синхронизированных нейронных компонентов.Обобщенная кросс-частотная декомпозиция способна восстановить как временные ходы синхронизированных нейронных компонентов, так и соответствующие пространственные фильтры и паттерны.

Мы показали, что GCFD способен обнаруживать синхронность между частотами, связанными рациональным соотношением p: q, для p, q ≤ 4. Новый метод расширяет предыдущий уровень техники — кросс-частотное разложение (CFD) ( Никулин и др., 2012) на более общий диапазон частотных пар. Однако для p, q > 4 обнаружение межчастотной синхронизации затруднительно, потому что область фазовой синхронизации очень узкая и возможная синхронизация, вероятно, будет скрыта шумом.Это общая проблема обнаружения межчастотных взаимодействий, которая не является специфической для алгоритма GCFD (Пиковский и др., 2001).

4.1. Ограничения предыдущих методов

Наиболее распространенный подход — вычисление межчастотной синхронизации в пространстве датчиков (Schanze and Eckhorn, 1997; Tass et al., 1998; Carlqvist et al., 2005; Palva et al., 2005; Nikulin and Brismar, 2006; Sauseng et al., 2008; Darvas et al., 2009; Siebenhühner et al., 2016). Одна из ловушек анализа в пространстве датчиков заключается в том, что топографии источника невозможно идентифицировать из-за проблемы смешения, связанной с объемной проводимостью.Другой подход (Tass et al., 2003) основан на инверсном моделировании сигналов источников, которые затем попарно проверяются на наличие межчастотной синхронизации путем вычисления значений фазовой синхронизации по всем парам вокселей мозга. Этот подход требует обширных исправлений статистических ошибок типа I. Более того, эти сравнения создают большую сложность нейронных отношений, которые, однако, не обязательно связаны с истинной нейронной сложностью. В случае обратного моделирования также важно обратить внимание на общую неоднозначность обратной реконструкции.

4,2. Преимущества и ограничения GCFD

Численное моделирование показало, что GCFD может восстанавливать взаимодействующие источники, даже когда они замаскированы очень сильным шумом (SNR = 0,1), см. Рисунок 4. Извлечение нелинейно взаимодействующих компонентов было замечательно хорошим, показывая только небольшую ошибку (<0,08 ) в восстановленных шаблонах даже в очень сложной ситуации с SNR = 0,1. В этом исследовании мы используем SSD, который является одним из лучших методов извлечения сигналов с низким отношением сигнал / шум (Никулин и др., 2011). GCFD зависит от производительности SSD, так как ошибки извлечения SSD для опорных сигналов могут влиять на качество окончательной реконструкции шаблона, см. Подразделы 2.3.2, 3.1. GCFD также имеет асимметрию производительности по сравнению с p и q swap из-за его зависимости от начального SSD. Мы показали при моделировании, что отдельный XPF, который использует уже доступные опорные сигналы, работает значительно лучше по сравнению со всем GCFD, см. Раздел 3.Однако GCFD не ограничивается использованием SSD для получения опорных сигналов. Здесь можно использовать компоненты, извлеченные с помощью другого подхода к разложению, такого как ICA, или непосредственно доступные сигналы, такие как кардиограмма, миограмма, визуальный или слуховой сигнал и т. Д. Это может быть особенно полезно при анализе межчастотных корково-мышечных взаимодействий, когда опорные сигналы получаются с поверхности. ЭМГ. Фактически, в недавнем обзоре подчеркивалась важность кросс-частотных взаимодействий для лучшего понимания корково-спинномозгового моторного контроля (Yang et al., 2017). Мы считаем, что метод GCFD может быть ценным подходом в этом отношении.

4.3. Подлинные и ложные перекрестно-частотные взаимодействия

При поиске межчастотной синхронизации всегда есть возможность обнаружить CFS не из-за подлинных взаимодействий нейронов, но также из-за несинусоидальной формы колебаний (Gaarder, Speck, 1967; Jürgens et al., 1995; Nikulin and Брисмар, 2006). Это связано с тем, что несинусоидальные волны представляют собой сумму синусоидальных волн на основной и гармонической частотах (которые являются целыми кратными базовой частоте), и эти синусоидальные волны затем будут демонстрировать кросс-частотную синхронизацию.Например, (Никулин и Брисмар, 2006) в численном эксперименте показали, что, когда сигнал ЭЭГ не является синусоидальным, он демонстрирует ложную альфа-бета фазовую связь.

Чтобы контролировать этот побочный эффект, мы вычислили расхождение паттернов между пространственными паттернами опорного сигнала и синхронизированными ритмическими компонентами. Если паттерны были похожи, мы считали их гармониками. Для случая 2: 1 мы наблюдали много подобных моделей с высоким PLV. Этого не было в случае связи 2: 3, где мы наблюдали меньшее количество подобных паттернов и средний PLV был ниже.

Мы показали, что GCFD может применяться для поиска фазовой связи в случаях, когда мы используем предварительно выбранные пики на основе спектров, как показано для состояния покоя на Рисунке 5A, а также для случаев, когда известна априорная информация об опорных спектрах, что и имеет место для эксперимента SSVEP, рисунок 5B. Все пары, найденные с помощью GCFD, представлены на рисунке 6. В экспериментах по ЭЭГ мы не обнаружили особенно сильной корреляции между сходством паттернов и силой межчастотной фазовой синхронизации.Это, в свою очередь, указывает на то, что извлеченные межчастотные взаимодействия маловероятны из-за присутствия гармоник, поскольку в этом случае корреляция между подобием структуры и значениями PLV будет очень сильной. Более того, чувствительность GCFD как к подлинным, так и к «гармоническим» межчастотным взаимодействиям имеет дополнительные преимущества, поскольку может позволить более точное извлечение несинусоидальных нейронных колебаний, важных для систем интерфейса мозг-компьютер, основанных на известном мю-ритме. иметь вторую и даже третью гармоники.Наличие межчастотных взаимодействий в динамике состояния покоя, как мы наблюдали в настоящем исследовании, является особенно интересным случаем, поскольку это может указывать на вычислительную готовность нейронных сетей к участию в обработке информации, распределенной по различным областям коры, производящим колебательные сигналы. активность на разных частотах.

В качестве направления для будущих исследований было бы интересно применить GCFD для исследования роли межчастотной фазовой синхронизации между различными сетями, демонстрируя сильную внутричастотную связь, в различных когнитивных задачах, предлагаемых для такой интеграции, e .г., в зрительной рабочей памяти (Siebenhühner et al., 2016). Наша работа демонстрирует, что алгоритм GCFD может быть легко использован для исследования таких сложных межчастотных взаимодействий.

Заявление об этике

Это исследование было проведено в соответствии с рекомендациями Комитета по этике HSE с письменного информированного согласия всех субъектов. Все субъекты дали письменное информированное согласие в соответствии с Хельсинкской декларацией. Протокол одобрен этическим комитетом НИУ ВШЭ.

Авторские взносы

DV разработал исследование, провел исследования, написал статью. ID провела исследование, написала статью. AM провел исследование, написал статью. Б.Г. и В.Н. разработали исследование, написали статью.

Финансирование

Работа выполнена при финансовой поддержке Центра биоэлектрических интерфейсов НИУ Высшая школа экономики, грант Правительства РФ, аг. № 14.641.31.0003. Первого автора частично поддержал конкурс «Юные математики России».

Заявление о конфликте интересов

Авторы заявляют, что исследование проводилось при отсутствии каких-либо коммерческих или финансовых отношений, которые могут быть истолкованы как потенциальный конфликт интересов.

Благодарности

Мы благодарим доктора Зафера Ишкан за обсуждение данных SSVEP.

Список литературы

Акияма, М., Теро, А., Кавасаки, М., Нисиура, Ю., Ямамагути, Ю. (2017). Распределение фаз тета-альфа ЭЭГ во фронтальной области для диссоциации зрительной и слуховой рабочей памяти. Sci. Реп. 7: 42776. DOI: 10.1038 / srep42776

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Байрактароглу, З., фон Карловиц-Гори, К., Курио, Г., Никулин, В. В. (2012). Дело не только в фазе: динамика амплитуды корково-мышечных взаимодействий. Neuroimage 64, 496–504. DOI: 10.1016 / j.neuroimage.2012.08.069

CrossRef Полный текст | Google Scholar

Байрактароглу, З., фон Карловиц-Гори, К., Лош, Ф., Нольте, Г., Курио, Г., Никулин, В. В. (2011). Оптимальная визуализация кортико-мышечной когерентности с помощью новой техники регрессии, основанной на многоканальной ЭЭГ и неректифицированной ЭМГ. Neuroimage 57, 1059–1067.DOI: 10.1016 / j.neuroimage.2011.04.071

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Беллуссио, М. А., Мизусеки, К., Шмидт, Р., Кемптер, Р., и Бужаки, Г. (2012). Межчастотная фаза-фазовая связь между тета- и гамма-колебаниями в гиппокампе. J. Neurosci. 32, 423–435. DOI: 10.1523 / JNEUROSCI.4122-11.2012

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Канолти, Р. Т., Эдвардс, Э., Далал, С. С., Солтани, М., Нагараджан, С.С., Кирш, Х.Э. и др. (2006). Высокая мощность гамма-излучения синхронизирована по фазе с тета-колебаниями в неокортексе человека. Наука 313, 1626–1628. DOI: 10.1126 / science.1128115

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Карлквист, Х., Никулин, В. В., Стрёмберг, Й. -О., и Брисмар, Т. (2005). Амплитуда и фазовое соотношение между альфа- и бета-колебаниями на электроэнцефалограмме человека. Med. Биол. Англ. Comput. 43, 599–607.DOI: 10.1007 / BF02351033

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Чайеб, Л., Лещинский, М., Аксмахер, Н., Хёне, М., Элгер, К. Э., и Фелл, Дж. (2015). Фазово-фазовая связь тета-гамма во время поддержания рабочей памяти в гиппокампе человека. J. Cogn. Neurosci. 6, 149–157. DOI: 10.1080 / 17588928.2015.1058254

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Дарвас, Ф., Миллер, К. Дж., Рао, Р. П., и Оджеманн, Дж.Г. (2009). Нелинейная межфазная связь между фазами обеспечивает связь между удаленными участками неокортекса человека. J. Neurosci. 29, 426–435. DOI: 10.1523 / JNEUROSCI.3688-08.2009

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Эдагава К. и Кавасаки М. (2017). Синхронизация бета-фазы в лобно-височно-мозжечковой сети при обучении слухово-моторному ритму. Sci. Отчет 7: 42721. DOI: 10.1038 / srep42721

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Эванс, А., Камбер, М., Коллинз, Д., и Макдональд, Д. (1994). «Вероятностный атлас нейроанатомии на основе МРТ», в Магнитно-резонансное сканирование и эпилепсия , ред. С.Д. Шорвон, Д.Р. Фиш, Ф. Андерманн, Г.М. Байддер и Х. Стефан (Нью-Йорк, Нью-Йорк: Спрингер), 263– 274.

Google Scholar

Фриман О., Волосяк И., Грейзер А. (2007). Многоканальное обнаружение устойчивых вызванных зрительных потенциалов для интерфейсов мозг-компьютер. EEE Trans. Биомед. Англ. 54, 742–750.DOI: 10.1109 / TBME.2006.889160

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Фристон, К. Дж., Бастос, А., Литвак, В., Стефан, К. Э., Фрис, П., и Моран, Р. Дж. (2012). DCM для комплексных данных: кросс-спектры, когерентность и фазовые задержки. Neuroimage 59, 439–455. DOI: 10.1016 / j.neuroimage.2011.07.048

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Halgren, E., Boujon, C., Clarke, J., Wang, C., and Chauvel, P.(2002). Быстро распределенные этапы лобно-теменно-затылочной обработки во время рабочей памяти у людей. Cereb. Cortex 12, 710–728. DOI: 10.1093 / cercor / 12.7.710

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Haufe, S., Meinecke, F., Görgen, K., Dähne, S., Haynes, J. -D., Blankertz, B., and Bießmann, F. (2014). Об интерпретации весовых векторов линейных моделей в многомерной нейровизуализации. Neuroimage 87, 96–110. DOI: 10.1016 / j.neuroimage.2013.10.067

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Хестерберг, Т., Мур, Д. С., Монаган, С., Клипсон, А., Эпштейн, Р., и МакКейб, Г. П. (2005). «Методы начальной загрузки и тесты перестановок», в Introduction to the Practice of Statistics, 5th Edn. , ред. W. H. McCabe, P. Farace, T. Ward, D. Swearengin и B. Donnellan (Нью-Йорк, Нью-Йорк: W.H. Freeman & Co.), 1–70.

Google Scholar

Ховард, М., Риццуто, Д., Каплан, Дж., Madsen, J., Lisman, J., Aschenbrenner-Scheibe, R., et al. (2003). Гамма-колебания коррелируют с нагрузкой на рабочую память человека. Cereb. Cortex 13, 1369–1374. DOI: 10.1093 / cercor / bhg084

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Hyafil, A., Fontolan, L., Kabdebon, C., Gutkin, B., and Giraud, A. -L. (2015). Кодирование речи связанными корковыми тета- и гамма-колебаниями. Элиф 4: e0621. DOI: 10.7554 / eLife.06213

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Хювяринен, А., Карунен, Дж., И Оя, Э. (2001). Независимый компонентный анализ. Нью-Йорк, Нью-Йорк: John Willey and Sons, Inc.

Ишкан З., Никулин В. В. (2018). Устойчивое состояние визуального вызванного потенциала (ssvep) на основе интерфейса мозг-компьютер (bci) при различных возмущениях. PLoS ONE 13: e01. DOI: 10.1371 / journal.pone.01

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Jürgens, E., Rösler, F., Hennighausen, E., and Heil, M.(1995). Стимул-индуцированные гамма-колебания: гармоники альфа-активности? Нейроотчет 6, 813–816.

PubMed Аннотация | Google Scholar

Лозано-Сольдевилья, Д., Тер Хюрн, Н., Остенвельд, Р. (2016). Колебания нейронов с несинусоидальной морфологией вызывают паразитную связь между фазой и амплитудой и направленность. Перед. Comput. Neurosci. 10:87. DOI: 10.3389 / fncom.2016.00087

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Марис, Э., Шоффелен, Дж. М., и Фрис, П. (2007). Непараметрическая статистическая проверка различий когерентности. J. Neurosci. Методы 163, 161–175. DOI: 10.1016 / j.jneumeth.2007.02.011

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Mezeiová, K., and Paluš, M. (2012). Сравнение когерентности и фазовой синхронизации электроэнцефалограммы сна человека. Clin. Neurophysiol. 123, 1821–1830. DOI: 10.1016 / j.clinph.2012.01.016

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Митра, С.К., и Куо, Ю. (2001). Цифровая обработка сигналов: компьютерный подход . Нью-Йорк, штат Нью-Йорк: Колледж Макгроу-Хилл.

Google Scholar

Никулин В. В., Брисмар Т. (2006). Фазовая синхронизация альфа- и бета-колебаний на электроэнцефалограмме человека. J. Neurosci. 137, 647–657. DOI: 10.1016 / j.neuroscience.2005.10.031

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Никулин В. В., Нольте Г. и Курио Г.(2011). Новый метод надежного и быстрого выделения нейрональных колебаний ЭЭГ / МЭГ на основе пространственно-спектральной декомпозиции. Neuroimage 55, 1528–1535. DOI: 10.1016 / j.neuroimage.2011.01.057

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Никулин В. В., Нольте Г., Курио Г. (2012). Межчастотная декомпозиция: новый метод изучения взаимодействия нейронных колебаний с разными частотами. Clin. Neurophysiol. 123, 1353–1360. DOI: 10.1016 / j.clinph.2011.12.004

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Нольте, Г., Бай, О., Уитон, Л., Мари, З., Ворбах, С., и Халлет, М. (2004). Определение истинного взаимодействия мозга по данным ЭЭГ с использованием мнимой части когерентности. Clin. Neurophysiol. 115, 2292–2307. DOI: 10.1016 / j.clinph.2004.04.029

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Палва, Дж. М., и Палва, С.(2011). Функциональные роли фазовой синхронизации альфа-диапазона в локальных и крупномасштабных корковых сетях. Front Psychol. 2: 204. DOI: 10.3389 / fpsyg.2011.00204

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Палва, Дж. М., и Палва, С. (2017). Функциональное интегрирование по частотам колебаний за счет межчастотной фазовой синхронизации. Eur. J. Neurosci. doi: 10.1111 / ejn.13767 [Epub перед печатью].

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Парк, ул., Lee, D. S., Kang, E., Kang, H., Hahm, J., Kim, J. S., et al. (2016). Формирование визуальных воспоминаний, контролируемых гамма-мощностью, синхронизированной по фазе с альфа-колебаниями. Sci. Отчет 6: 28092. DOI: 10.1038 / srep28092

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Пиковский А., Розенблюм М. и Куртс Дж. (2001). Синхронизация — универсальная концепция нелинейных наук . Кембридж: Издательство Кембриджского университета.

Google Scholar

Розенблюм, М., Пиковский А., Куртс Дж., Шефер К. и Тасс П. А. (2001). Фазовая синхронизация: от теории к анализу данных. Handb. Биол. Phys. 4, 279–321. DOI: 10.1016 / S1383-8121 (01) 80012-9

CrossRef Полный текст | Google Scholar

Саусенг П., Климеш В., Грубер В. Р. и Бирбаумер Н. (2008). Межчастотная фазовая синхронизация: мозговой механизм согласования памяти и внимания. Neuroimage 40, 308–317. DOI: 10.1016 / j.neuroimage.2007.11.032

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Шанце, Т.и Экхорн Р. (1997). Фазовая корреляция между ритмами, присутствующими на разных частотах: спектральные методы, применение к микроэлектродным записям от зрительной коры и функциональные последствия. Внутр. J. Psychophysiol. 26, 171–189. DOI: 10.1016 / S0167-8760 (97) 00763-0

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Schittkowski, K. (1988). «Решение нелинейных задач наименьших квадратов с помощью универсального метода SQP», в Trends in Mathematical Optimization, International Series of Numerical Mathematics , Vol.84, ред. К.-Х. Хоффманн, Ж.-Б. Hiriart Urruty, C. Lemarechal и J. Zowe (Бостон, Массачусетс: Биркхойзер).

Зибенхюнер, Ф., Ван, С. Х., Палва, Дж. М., и Палва, С. (2016). Межчастотная синхронизация соединяет сети быстрых и медленных колебаний при поддержании зрительной рабочей памяти. Элиф 5: e13451. DOI: 10.7554 / eLife.13451

PubMed Аннотация | CrossRef Полный текст | Google Scholar

ТАСС, П., Физелер, Т., Даммерс, Дж., Долан, К., Моросан, П., Майтаник М. и др. (2003). Синхронизационная томография: метод трехмерной локализации синхронизированных по фазе популяций нейронов в головном мозге человека с помощью магнитоэнцефалографии. Phys. Rev. Lett. 90: 088101. DOI: 10.1103 / PhysRevLett.90.088101

PubMed Аннотация | CrossRef Полный текст | Google Scholar

ТАСС П., Розенблюм М. Г., Вейле Дж., Куртс Дж., Пиковский А., Фолькманн Дж. И др. (1998). Обнаружение фазовой синхронизации n: m из зашумленных данных: приложение к магнитоэнцефалографии. Phys. Rev. Lett. 81, 3291–3294.

Варела Ф., Лашо Ж. -П., Родригес Э. и Мартинери Дж. (2001). Сеть мозга: фазовая синхронизация и крупномасштабная интеграция. Нат. Rev. Neurosci. 2, 229–239. DOI: 10.1038 / 35067550

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Womelsdorf, T., Schoffelen, J. -M., Oostenveld, R., Singer, W., Desimone, R., Engel, A., et al. (2017). Модуляция нейронных взаимодействий посредством нейрональной синхронизации. Cereb. Cortex. 316, 1609–1612. DOI: 10.1126 / science.1139597

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Янг, Ю., Девальд, Дж. П. А., ван дер Хельм, Ф. К. Т., и Схоутен, А. К. (2017). Выявление нейронной связи в сенсомоторной системе: направленность и нелинейность. евро. Дж. Neurosci . DOI: 10.1111 / ejn.13692. [Epub перед печатью].

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Новые идеи и лучшие практики для успешного использования разложения эмпирических мод, итеративной фильтрации и производных алгоритмов

  • 1.

    Брейсуэлл, Р. Н. и Брейсвелл, Р. N. Преобразование Фурье и его приложения Vol. 31999 (McGraw-Hill, Нью-Йорк, 1986).

    MATH Google ученый

  • 2.

    Чиконе, А. Нестационарное разложение сигнала для чайников. в Достижения в области математических методов и высокопроизводительных вычислений 69–82 (Спрингер, Нью-Йорк, 2019).

  • 3.

    Cohen, L. Частотно-временной анализ Vol.778 (Prentice Hall, Нью-Йорк, 1995).

    Google ученый

  • 4.

    Добеши, И., Лу, Дж. И Ву, Х. Т. Синхронизированные вейвлет-преобразования: инструмент, подобный эмпирическому разложению мод. Заявл. Comput. Гармонический Анал. 30 , 243–261. https://doi.org/10.1016/j.acha.2010.08.002 (2011).

    MathSciNet Статья МАТЕМАТИКА Google ученый

  • 5.

    Auger, F. et al. Переназначение частоты и времени и синхронизация: обзор. Сигнальный процесс IEEE. Mag. 30 , 32–41. https://doi.org/10.1109/MSP.2013.2265316 (2013).

    ADS Статья Google ученый

  • 6.

    Добеши, И., Ван, Й. и Ву, Х. Т. Консефт: Концентрация частоты и времени посредством многолучевого синхронизированного преобразования. Philos. Пер. R. Soc. Математика.Phys. Англ. Sci. 374 , 20150193. https://doi.org/10.1098/rsta.2015.0193 (2016).

    ADS MathSciNet Статья МАТЕМАТИКА Google ученый

  • 7.

    Huang, N.E. et al. Эмпирическое разложение по модам и гильбертовый спектр для нелинейного и нестационарного анализа временных рядов. Proc. R. Soc. Лондон. Сер. Математика. Phys. Англ. Sci. 454 , 903–995. https://doi.org/10.1098 / rspa.1998.0193 (1998).

    ADS MathSciNet Статья МАТЕМАТИКА Google ученый

  • 8.

    Flandrin, P. Частотно-временный анализ Vol. 10 (Академическая пресса, Лондон, 1998).

    MATH Google ученый

  • 9.

    Хуанг Н.Э. Введение в преобразование Гильберта-Хуанга и связанные с ним математические проблемы (World Scientific, Сингапур, 2014).

    Книга Google ученый

  • 10.

    Wu, Z. & Huang, N. E. Ансамблевое разложение эмпирических мод: метод анализа данных с использованием шума. Adv. Адаптировать. Data Anal. 1 , 1–41. https://doi.org/10.1142/S179353690

    47 (2009 г.).

    Артикул Google ученый

  • 11.

    ур Рехман, Н., Парк, К., Хуанг, Н. Э. и Мандич Д. P. Emd через memd: многомерное вычисление стандартного emd с помощью шума. Adv. Адаптировать. Data Anal. 5 , 1350007 (2013).

    MathSciNet Статья Google ученый

  • 12.

    Йе, Дж. Р., Ши, Дж. С. и Хуанг, Н. Е. Разложение эмпирических мод дополнительных ансамблей: новый метод анализа данных с улучшенным шумом. Adv. Адаптировать. Data Anal. 2 , 135–156. https://doi.org/10.1142/S17935360422 (2010).

    MathSciNet Статья Google ученый

  • 13.

    Торрес, М. Э., Коломинас, М. А., Шлоттауэр, Г. и Фландрин, П. Полное разложение эмпирических мод по ансамблю с адаптивным шумом. в 2011 Международная конференция IEEE по акустике, речи и обработке сигналов (ICASSP) , 4144–4147, https://doi.org/10.1109/ICASSP.2011.5947265 (IEEE, Нью-Йорк, 2011).

  • 14.

    Zheng, J., Cheng, J. & Yang, Y. Частичное разложение по ансамблю эмпирических мод: улучшенный метод с шумоподавлением для исключения смешивания мод. Сигнальный процесс. 96 , 362–374. https://doi.org/10.1016/j.sigpro.2013.09.013 (2014).

    Артикул Google ученый

  • 15.

    Ур Рехман, Н. и Мандич, Д. P. Свойство банка фильтров многомерной эмпирической разложения по модам. IIEEE Trans. Сигнальный процесс. 59 , 2421–2426 (2011).

    ADS MathSciNet Статья Google ученый

  • 16.

    Lang, X. et al. Быстрое многомерное разложение по эмпирическим модам. Доступ IEEE 6 , 65521–65538. https://doi.org/10.1109/ACCESS.2018.2877150 (2018).

    Артикул Google ученый

  • 17.

    Лин, Л., Ван, Й. и Чжоу, Х. Итерационная фильтрация как альтернативный алгоритм для эмпирического разложения по модам. Adv. Адаптировать. Data Anal. 1 , 543–560. https://doi.org/10.1142/S179353690

    8X (2009 г.).

    MathSciNet Статья Google ученый

  • 18.

    Чиконе, А. и Чжоу, Х. Численный анализ итеративной фильтрации с новыми эффективными реализациями на основе fft. Номер. Математика. (2020).

  • 19.

    Хуанг, К., Янг, Л. и Ван, Ю. Сходимость основанного на свертке-фильтрации алгоритма для эмпирического разложения по модам. Adv. Адаптировать. Data Anal. 1 , 561–571. https: // doi.org / 10.1142 / S179353690

    05 (2009 г.).

    MathSciNet Статья Google ученый

  • 20.

    Ван, Й. и Чжоу, З. О сходимости итеративной фильтрации эмпирического разложения по модам. Экскурсии Гармонический Анал. 2 , 157–172, https://doi.org/10.1007/978-0-8176-8379-5_8 (Биркхойзер, Бостон, 2013 г.).

  • 21.

    Чиконе, А. и Делл’Аква, П. Исследование граничных условий в методе итерационной фильтрации для разложения нестационарных сигналов. J. Comput. Прил. Математика. 373 , 112248, https://doi.org/10.1016/j.cam.2019.04.028 (2020).

  • 22.

    Чиконе, А., Гарони, С. и Серра-Капиццано, С. Спектральный анализ и анализ сходимости дискретного метода alif. Linear Algebra Appl. 580 , 62–95. https://doi.org/10.1016/j.laa.2019.06.021 (2019).

    MathSciNet Статья МАТЕМАТИКА Google ученый

  • 23.

    Чиконе, А.Итерационная фильтрация как прямой метод разложения нестационарных сигналов. Номер. Алгоритмы , https://doi.org/10.1007/s11075-019-00838-z (2020).

  • 24.

    Чиконе, А. и Чжоу, Х. Одна или две частоты? итеративная фильтрация отвечает. Препринт (2020).

  • 25.

    Чиконе, А., Лю, Дж. И Чжоу, Х. Адаптивная локальная итерационная фильтрация для разложения сигнала и мгновенного частотного анализа. Заявл. Comput. Гармонический Анал. 41 , 384–411. https://doi.org/10.1016/j.acha.2016.03.001 (2016).

    MathSciNet Статья МАТЕМАТИКА Google ученый

  • 26.

    Cicone, A. & Wu, H.-T. Анализ сходимости адаптивной локально-итерационной фильтрации и метода просеивания. Отправлено (2020).

  • 27.

    Чиконе, А. и Чжоу, Х. Метод многомерной итерационной фильтрации для разложения многомерных нестационарных сигналов. Номер. Математика. Теория Методы Прил. 10 , 278–298. https://doi.org/10.4208/nmtma.2017.s05 (2017).

    MathSciNet Статья МАТЕМАТИКА Google ученый

  • 28.

    Papini, E. et al. Многомерная итерационная фильтрация: новый подход к исследованию турбулентности плазмы в численном моделировании. J. Физика плазмы. (2020).

  • 29.

    Чиконе, А. Многомерная быстрая итерационная фильтрация для разложения нестационарных сигналов. Препринт (2020).

  • 30.

    Хуанг Н. Э. и Ву З. Обзор преобразования Гильберта-Хуанга: метод и его приложения к геофизическим исследованиям. Rev. Geophys. 46 , https://doi.org/10.1029/2007RG000228 (2008).

  • 31.

    Боуман, Д. К. и Лиз, Дж. М. Преобразование Гильберта-Хуанга: спектральный метод высокого разрешения для нелинейных и нестационарных временных рядов. Сейсмол. Res. Lett. 84 , 1074–1080. https: // doi.org / 10.1785 / 0220130025 (2013).

    Артикул Google ученый

  • 32.

    Тэри, Дж. Б., Эррера, Р. Х., Хан, Дж. И ван дер Баан, М. Спектральная оценка — что нового? что следующее?. Rev. Geophys. 52 , 723–749. https://doi.org/10.1002/2014RG000461 (2014).

    ADS Статья Google ученый

  • 33.

    Baykut, S., Akgül, T., İnan, S. & Seyis, C.Наблюдение и удаление суточных квазипериодических компонентов в данных о почвенном радоне. Radiat. Измер. 45 , 872–879. https://doi.org/10.1016/j.radmeas.2010.04.002 (2010).

    CAS Статья Google ученый

  • 34.

    Цолис, Г. С. и Ксенос, Т. Д. Качественное исследование сейсмо-ионосферных предвестников до землетрясения 6 апреля 2009 г. в Л’Акуиле, Италия. Нат. Опасности Earth Syst. Sci. 10 , 133–137, https: // doi.org / 10.5194 / nhess-10-133-2010 (2010).

  • 35.

    Huang, J. Y. et al. Временная диаграмма косейсмической деформации, рассчитанная по записям ускорения с использованием схемы коррекции базовой линии, полученной с помощью EMD: новый подход, подтвержденный для землетрясения Тохоку 2011 года. Bull. Сейсмол. Soc. Являюсь. 103 , 1321–1335. https://doi.org/10.1785/0120120278 (2013).

    Артикул Google ученый

  • 36.

    Чен, К.H. et al. Поверхностная деформация и сейсмический отскок: последствия и приложения. Surv. Geophys. 32 , 291. https://doi.org/10.1007/s10712-011-9117-3 (2011).

    ADS Статья Google ученый

  • 37.

    Барман, К., Гхош, Д., Синха, Б. и Деб, А. Обнаружение предшественников радона, вызванных землетрясениями, с помощью преобразования Гильберта Хуанга. J. Appl. Geophys. 133 , 123–131.https://doi.org/10.1016/j.jappgeo.2016.08.004 (2016).

    ADS Статья Google ученый

  • 38.

    Wang, D., Hwang, C. & Shen, W. Исследования аномальных гравитационных сигналов перед 71 сильным землетрясением на основе четырехлетних записей сверхпроводящего гравиметра. Геодезия Геодин. 8 , 319–327. https://doi.org/10.1016/j.geog.2017.07.002 (2017).

    Артикул Google ученый

  • 39.

    Chen, C. et al. Идентификация сигналов землетрясений по записям уровня грунтовых вод методом hht. Geophys. J. Int. 180 , 1231–1241. https://doi.org/10.1111/j.1365-246X.2009.04473.x (2010).

    ADS Статья Google ученый

  • 40.

    Баттиста, Б. М., Кнапп, К., МакГи, Т. и Гебель, В. Применение эмпирической модовой декомпозиции и преобразования Гильберта-Хуанга к данным сейсмического отражения. Геофизика 72 , h39 – h47. https://doi.org/10.1190/1.2437700 (2007).

    ADS Статья Google ученый

  • 41.

    Chen, Y. Структурная фильтрация с разделением по падению с использованием преобразования сейслета и адаптивного эмпирического разложения мод на основе фильтра падения. Geophys. J. Int. 206 , 457–469. https://doi.org/10.1093/gji/ggw165 (2016).

    ADS Статья Google ученый

  • 42.

    Васудеван, К. и Кук, Ф. А. Эмпирическая модификация каркасных данных глубинных сейсмических данных земной коры: теория и приложения. J. Geophys. Res. Твердая Земля 105 , 7845–7856. https://doi.org/10.1029/1999JB5 (2000).

    Артикул Google ученый

  • 43.

    Робертс, П. Х., Ю., З. Дж. И Рассел, К. Т. О 60-летнем сигнале от ядра. Geophys. Astrophys. Fluid Dyn. 101 , 11–35.https://doi.org/10.1080/030601083820 (2007).

    ADS Статья Google ученый

  • 44.

    Джексон, Л. П. и Маунд, Дж. Э. Геомагнитная вариация в десятилетних временных масштабах: что мы можем узнать из эмпирического разложения по модам ?. Geophys. Res. Lett. 37 , https://doi.org/10.1029/2010GL043455 (2010).

  • 45.

    Yu, ZG, Anh, V., Wang, Y., Mao, D. & Wanliss, J. Моделирование и моделирование горизонтальной составляющей геомагнитного поля с помощью дробных стохастических дифференциальных уравнений в сочетании с эмпирическим режимом разложение. J. Geophys. Res. Space Phys. 115 , https://doi.org/10.1029/2009JA015206 (2010).

  • 46.

    Materassi, M. et al. Переход к экваториальной границе аврорального овала: предварительные результаты многомасштабного статистического анализа. Ann. Geophys. 61 , 55. https://doi.org/10.4401/ag-7801 (2019).

    Артикул Google ученый

  • 47.

    Spogli, L. et al. Роль внешних драйверов в возникновении низкоширотных ионосферных мерцаний, выявленная с помощью многомасштабного анализа. J. Космическая погода Космический климат. 9 , A35, https://doi.org/10.1051/swsc/2019032 (2019).

  • 48.

    Piersanti, M. et al. Адаптивная локальная итерационная фильтрация: многообещающий метод анализа нестационарных сигналов. J. Geophys. Res. Space Phys. 123 , 1031–1046. https://doi.org/10.1002/2017JA024153 (2018).

    ADS Статья Google ученый

  • 49.

    Spogli, L. et al. Роль внешних драйверов в возникновении низкоширотных ионосферных мерцаний выявлена ​​с помощью многомасштабного анализа. Азиатско-Тихоокеанская радионаучная конференция URSI 2019, AP-RASC 2019, 8738254 (2019).

  • 50.

    Huang, N.E. et al. Новое спектральное представление данных о землетрясениях: спектральный анализ Гильберта станции tcu129, Чи-Чи, Тайвань, 21 сентября 1999 г. Bull. Сейсмол. Soc. Являюсь. 91 , 1310–1338. https://doi.org/10.1785/0120000735 (2001).

    Артикул Google ученый

  • 51.

    Loh, C.H., Wu, T.C. и Huang, N.E. Применение метода эмпирического разложения мод-спектров Гильберта для определения характеристик движения грунта вблизи разлома и откликов конструкции. Bull. Сейсмол. Soc. Являюсь. 91 , 1339–1357. https://doi.org/10.1785/0120000715 (2001).

    Артикул Google ученый

  • 52.

    Zhang, R. R., Ma, S., Safak, E. & Hartzell, S. Анализ преобразований Гильберта-Хуанга динамических записей и записей движения землетрясений. J. Eng. Мех. 129 , 861–875. https://doi.org/10.1061/(ASCE)0733-9399(2003)129:8(861) (2003).

    Артикул Google ученый

  • 53.

    Zhang, R. R., Ma, S. & Hartzell, S.Сигнатуры сейсмического источника при описании характеристик землетрясения в Нортридже, Калифорния, 1994 г., на основе EMD. Bull. Сейсмол. Soc. Являюсь. 93 , 501–518. https://doi.org/10.1785/0120010285 (2003).

    Артикул Google ученый

  • 54.

    Янг, Дж. Н., Лей, Й., Лин, С. и Хуанг, Н. Идентификация собственных частот и демпфирования высотных зданий на месте с использованием данных о вибрации окружающего ветра. Дж.Англ. Мех. 130 , 570–577. https://doi.org/10.1061/(ASCE)0733-9399(2004)130:5(570) (2004).

    Артикул Google ученый

  • 55.

    Францке К. Многомасштабный анализ индексов электросвязи: климатический шум и анализ нелинейных тенденций. Нелинейный процесс. Geophys. 16 , 65–76. https://doi.org/10.5194/npg-16-65-2009 (2009 г.).

    ADS Статья Google ученый

  • 56.

    Ли, Т. и Уарда, Т. Б. М. Дж. Прогнозирование климатических нестационарных колебательных процессов с эмпирической модовой декомпозицией. J. Geophys. Res. Атмос. 116 , https://doi.org/10.1029/2010JD015142 (2011).

  • 57.

    Эзер, Т. и Корлетт, У. Б. Ускоряется ли повышение уровня моря в Чесапикском заливе? Демонстрация нового подхода к анализу данных об уровне моря. Geophys. Res. Lett. 39 , https://doi.org/10.1029/2012GL053435 (2012).

  • 58.

    Францке К. Нелинейные тренды, дальнодействующая зависимость и климатические шумовые свойства температуры поверхности. J. Clim. 25 , 4172–4183. https://doi.org/10.1175/JCLI-D-11-00293.1 (2012).

    ADS Статья Google ученый

  • 59.

    Эзер, Т., Аткинсон, Л. П., Корлетт У. Б. и Бланко, Дж. L. Вызванное Гольфстримом повышение уровня моря и его изменчивость вдоль США. среднеатлантическое побережье.. J. Geophys. Res. Океаны 118 , 685–697. https://doi.org/10.1002/jgrc.20091 (2013).

  • 60.

    Даффи Д. Г. Применение преобразования Гильберта-Хуанга в наборы метеорологических данных. Приложение «Преобразование Гильберта-Хуанга» 203–221 , https://doi.org/10.1142/9789814508247_0009 (World Scientific, 2014).

  • 61.

    Хуанг Н. Э., Шен З. и Лонг С. Р. Новый взгляд на нелинейные волны на воде: спектр Гильберта. Annu.Rev. Fluid Mech. 31 , 417–457. https://doi.org/10.1146/annurev.fluid.31.1.417 (1999).

    ADS MathSciNet Статья Google ученый

  • 62.

    Террадас, Дж., Оливер, Р. и Баллестер, Дж. Л. Применение статистических методов для анализа солнечных корональных колебаний. Astrophys. J. 614 , 435 (2004).

    ADS Статья Google ученый

  • 63.

    Мортон, Р. Дж., Эрдели, Р., Джесс, Д. Б. и Матиудакис, М. Наблюдения за режимами колбасы в магнитных порах. Astrophys. J. Lett. 729 , Л18. https://doi.org/10.1088/2041-8205/729/2/L18 (2011).

    ADS Статья Google ученый

  • 64.

    Hofmann-Wellenhof, B., Lichtenegger, H. & Wasle, E. Глобальные навигационные спутниковые системы GNSS: GPS, ГЛОНАСС, Galileo и др. (Springer, New York, 2007).

    Google ученый

  • 65.

    Ghobadi, H. et al. Распутывание эффектов ионосферной рефракции и дифракции в необработанной фазе gnss с помощью метода быстрой итеративной фильтрации. GPS Solut. (2020).

  • 66.

    Hillier, A., Morton, R. J. & Erdélyi, R. Статистическое исследование поперечных колебаний в неподвижном выступе. Astrophys. J. Lett. 779 , Л16. https: // doi.org / 10.1088 / 2041-8205 / 779/2 / L16 (2013).

    ADS Статья Google ученый

  • 67.

    Wang, C. et al. Деконволюция гетерогенности субклеточных выпячиваний и динамики основных актиновых регуляторов по данным визуализации живых клеток. Нат. Commun. 9 , https://doi.org/10.1038/s41467-018-04030-0 (2018).

  • 68.

    Чиконе, А., Лю, Дж. И Чжоу, Х. Алгоритмы обнаружения гиперспектрального химического шлейфа, основанные на многомерной итеративной декомпозиции фильтрации. Фил. Пер. R. Soc. A: Математика. Phys. Англ. Sci. 374 , 2015.0196, https://doi.org/10.1098/rsta.2015.0196 (2016).

  • 69.

    Ян, А. К., Пэн, К. К. и Хуанг, Н. Е. Причинное разложение в системе взаимной причинности. Нат. Commun. 9 , 3378. https://doi.org/10.1038/s41467-018-05845-7 (2018).

    ADS CAS Статья PubMed PubMed Central Google ученый

  • 70.

    Коста, М., Голдбергер, А. Л. и Пенг, К. К. Нарушение асимметрии сердцебиения человека: необратимость потери времени при старении и болезнях. Phys. Rev. Lett. 95 , 198102. https://doi.org/10.1103/PhysRevLett.95.198102 (2005).

    ADS CAS Статья PubMed Google ученый

  • 71.

    Cicone, A. & Wu, H.-T. Как нелинейный частотно-временной анализ может помочь надежно определить мгновенную частоту сердечных сокращений и мгновенную частоту дыхания с помощью фотоплетизмографии. Перед. Physiol. 8 , 701 (2017).

    Артикул Google ученый

  • 72.

    Cummings, D. A. et al. Бегущие волны в распространении геморрагической лихорадки денге в Таиланде. Nature 427 , 344. https://doi.org/10.1038/nature02225 (2004).

    ADS CAS Статья PubMed Google ученый

  • 73.

    Лян, Х., Бресслер, С. Л., Баффало, Э. А., Десимон, Р. и Фрис, П. Разложение эмпирических мод полевых потенциалов от макаки v4 в визуальном пространственном внимании. Biol. Кибернет. 92 , 380–392. https://doi.org/10.1007/s00422-005-0566-y (2005).

    Артикул МАТЕМАТИКА Google ученый

  • 74.

    Ян, А. К., Хуанг, Н. Э., Пэн, К. К. и Цай, С. Дж. Влияют ли времена года на частоту возникновения депрессии? Использование данных запроса поисковой системы в Интернете как показатель человеческого влияния. PLOS ONE 5 , https://doi.org/10.1371/journal.pone.0013728 (2010).

  • 75.

    Wu, C.H. et al. Распознавание частоты в интерфейсе мозга и компьютера на основе ssvep с использованием эмпирической разложения по модам и уточненного обобщенного перехода через нуль. J. Neurosci. Методы 196 , 170–181. https://doi.org/10.1016/j.jneumeth.2010.12.014 (2011).

    Артикул PubMed Google ученый

  • 76.

    Грегориу, Г. Г., Готтс, С. Дж. И Дезимон, Р. Типовая синхронизация нервной активности в fef с v4 во время внимания. Нейрон 73 , 581–594. https://doi.org/10.1016/j.neuron.2011.12.019 (2012).

    CAS Статья PubMed PubMed Central Google ученый

  • 77.

    Hu, K., Lo, M. T., Peng, C. K., Liu, Y. & Novak, V. Нелинейный динамический подход показывает долгосрочное влияние инсульта на регуляцию мозгового кровотока во многих временных масштабах. PLoS Comput. Биол. 8 , e1002601. https://doi.org/10.1371/journal.pcbi.1002601 (2012).

    MathSciNet CAS Статья PubMed PubMed Central Google ученый

  • 78.

    Zheng, Y., Wang, G., Li, K., Bao, G. & Wang, J. Прогнозирование эпилептических припадков с использованием фазовой синхронизации на основе двумерной эмпирической декомпозиции мод. Clin. Neurophysiol. 125 , 1104–1111.https://doi.org/10.1016/j.clinph.2013.09.047 (2014).

    Артикул PubMed Google ученый

  • 79.

    Хассан, А. Р. и Бхуйян, М. И. Х. Автоматическая оценка сна с использованием статистических функций в области emd и методов ансамбля. Биокибернет. Биомед. Англ. 36 , 248–255. https://doi.org/10.1016/j.bbe.2015.11.001 (2016).

    Артикул Google ученый

  • 80.

    Парей А., Эль Бадауи М., Гийе Ф. и Тандон Н. Динамическое моделирование цилиндрической зубчатой ​​пары и применение статистического анализа, основанного на эмпирической модовой декомпозиции, для раннего обнаружения локализованного дефекта зуба. J. Sound Vib. 294 , 547–561. https://doi.org/10.1016/j.jsv.2005.11.021 (2006).

    ADS Статья Google ученый

  • 81.

    Лю, Х., Чен, К., Тиан, Х. К. и Ли, Й. Ф. Гибридная модель для прогнозирования скорости ветра с использованием эмпирической декомпозиции мод и искусственных нейронных сетей. Возобновляемая энергия 48 , 545–556. https://doi.org/10.1016/j.renene.2012.06.012 (2012).

    Артикул Google ученый

  • 82.

    Вэй, Ю. и Чен, М. С. Прогнозирование краткосрочного пассажиропотока метро с эмпирической декомпозицией по модам и нейронными сетями. Transp. Res. Часть C-Emerg. Technol. 21 , 148–162. https://doi.org/10.1016/j.trc.2011.06.009 (2012).

    Артикул Google ученый

  • 83.

    An, N., Zhao, W., Wang, J., Shang, D. и Zhao, E. Использование нейронной сети с прямым выходом с несколькими выходами и фильтрацией сигналов на основе эмпирического разложения по модам для прогнозирования спроса на электроэнергию. Energy 49 , 279–288. https://doi.org/10.1016/j.energy.2012.10.035 (2013).

    Артикул Google ученый

  • 84.

    Sfarra, S. et al. Улучшение обнаружения тепловых мостов в зданиях с помощью инфракрасной термографии на месте: возможности инновационных математических инструментов. Энергия и строительство. 182 , 159–171. https://doi.org/10.1016/j.enbuild.2018.10.017 (2019).

    Артикул Google ученый

  • 85.

    Lei, Y., Lin, J., He, Z. & Zuo, M.J. Обзор эмпирической разложения мод при диагностике неисправностей вращающегося оборудования. мех. Syst. Сигнальный процесс. 35 , 108–126. https://doi.org/10.1016/j.ymssp.2012.09.015 (2013).

    ADS Статья Google ученый

  • 86.

    Ю., Л., Ван, С. и Лай, К. К. Прогнозирование цены на сырую нефть с помощью парадигмы обучения ансамблю нейронной сети на основе EMD. Energy Econ. 30 , 2623–2635. https://doi.org/10.1016/j.eneco.2008.05.003 (2008).

    Артикул МАТЕМАТИКА Google ученый

  • 87.

    Чжан, X., Лай, К. и Ван, С. Ю. Новый подход к анализу цен на сырую нефть, основанный на эмпирической декомпозиции по модам. Energy Econ. 30 , 905–918.https://doi.org/10.1016/j.eneco.2007.02.012 (2008).

    Артикул Google ученый

  • 88.

    Чжан, Х., Ю, Л., Ван, С. и Лай, К. К. Оценка воздействия экстремальных явлений на цену сырой нефти: метод анализа событий на основе EMD. Energy Econ. 31 , 768–778. https://doi.org/10.1016/j.eneco.2009.04.003 (2009).

    CAS Статья Google ученый

  • 89.

    Abdelouahad, A. A., El Hassouni, M., Cherifi, H. & Aboutajdine, D. Уменьшенная оценка качества эталонного изображения на основе статистики в области эмпирической модовой декомпозиции. Обработка видео сигнала изображения. 8 , 1663–1680 (2014).

    Артикул Google ученый

  • 90.

    Ся, Й., Чжан, Б., Пей, В. и Мандич, Д. П. Двумерное многомерное эмпирическое разложение по модам с приложениями для объединения многомасштабных изображений. IEEE Access 7 , 114261–114270 (2019).

    Артикул Google ученый

  • 91.

    Ли, X., Су, Дж. И Ян, Л. Обнаружение зданий на изображениях sar на основе двумерного алгоритма эмпирической разложения мод. в IEEE Geoscience and Remote Sensing Letters (2019).

  • 92.

    Рато, Р. Т., Ортигейра, М. Д. и Батиста, А. Г. О hht, его проблемах и некоторых решениях. мех.Syst. Сигнальный процесс. 22 , 1374–1394 (2008).

    ADS Статья Google ученый

  • 93.

    Huang, N. E. Устройство для разложения эмпирических мод, способ и изделие для анализа биологических сигналов и выполнения аппроксимации кривой (2004). Патент США 6738734.

  • 94.

    Huang, N.E. et al. Доверительный предел для эмпирического разложения по модам и гильбертова спектрального анализа. Proc. R. Soc. Лондон. Сер. A: Математика. Phys. Англ. Sci. 459 , 2317–2345 (2003).

    ADS MathSciNet Статья Google ученый

  • 95.

    Dätig, M. & Schlurmann, T. Производительность и ограничения преобразования Гильберта-Хуанга (hht) в приложении к нерегулярным волнам на воде. Ocean Eng. 31 , 1783–1834 (2004).

    Артикул Google ученый

  • 96.

    Риллинг, Г., Фландрин, П., Гонсалвес, П. et al. Об эмпирической модовой декомпозиции и ее алгоритмах. В семинар IEEE-EURASIP по нелинейной обработке сигналов и изображений , Vol. 3, 8–11 (НСИП-03, Градо (I), 2003).

  • 97.

    Лю З. Новый подход к расширению границ для эмпирической декомпозиции мод. В Международная конференция по интеллектуальным вычислениям , 299–304 (Спрингер, Нью-Йорк, 2006).

  • 98.

    Ван, Дж., Лю, В.& Zhang, S. Подход к устранению конечных эффектов emd посредством расширения зеркала в сочетании с методом опорных векторов. чел. Ubiquit. Comput. 23 , 443–452 (2019).

    Артикул Google ученый

  • 99.

    Meng, E. et al. Надежный метод прогнозирования нестационарного водотока на основе улучшенной модели emd-svm. J. Hydrol. 568 , 462–478 (2019).

    ADS Статья Google ученый

  • 100.

    Сталлоне, А., Чиконе, А. и Матерасси, М. Новые идеи и передовые методы успешного использования эмпирической модовой декомпозиции, итеративной фильтрации и производных алгоритмов. Дополнительный материал. Sci. Отчет (2020).

  • 101.

    Брионгос, Дж. В., Арагон, Дж. М. и Паланкар, М. К. Структура фазового пространства и анализ гидродинамики псевдоожиженного слоя с разными разрешениями: Часть I — подход EMD. Chem. Англ. Sci. 61 , 6963–6980.https://doi.org/10.1016/j.ces.2006.07.023 (2006).

    CAS Статья Google ученый

  • 102.

    Суини-Рид, К. М. и Насуто, С. Дж. Новый подход к обнаружению синхронизации в eeg, основанный на эмпирическом разложении по модам. J. Comput. Neurosci. 23 , 79–111. https://doi.org/10.1007/s10827-007-0020-3 (2007).

    CAS Статья PubMed Google ученый

  • 103.

    Сарлис, Н. В., Скордас, Э. С., Минцелас, А. и Пападопулу, К. А. Микромасштаб, средний и макромасштаб в глобальной сейсмичности, идентифицированной эмпирическим разложением мод и их мультифрактальными характеристиками. Sci. Реп. 8 , 9206. https://doi.org/10.1038/s41598-018-27567-y (2018).

    ADS CAS Статья PubMed PubMed Central Google ученый

  • 104.

    Yun, S. M. et al. Анализ аномалий уровня подземных вод в зоне разлома в Корее, вызванных местными и прибрежными землетрясениями. Geosci. J. 23 , 137–148. https://doi.org/10.1007/s12303-018-0062-8 (2019).

    ADS Статья Google ученый

  • 105.

    Дзевонски, А. М., Чоу, Т. А. и Вудхаус, Дж. Х. Определение параметров очага землетрясения на основе данных формы волны для исследования глобальной и региональной сейсмичности. Дж.Geophys. Res. Твердая Земля 86 , 2825–2852. https://doi.org/10.1029/JB086iB04p02825 (1981).

    Артикул Google ученый

  • 106.

    Экстрём, Г., Неттлз, М. и Дзевонски, А. М. Глобальный проект cmt 2004–2010: тензоры центроидного момента для 13 017 землетрясений. Phys. Планета Земля. Интерьеры 200 , 1–9. https://doi.org/10.1016/j.pepi.2012.04.002 (2012).

    ADS Статья Google ученый

  • 107.

    Materassi, M. & Mitchell, C. Вейвлет-анализ амплитудных мерцаний GPS: тематическое исследование. Radio Sci. 42 (2007).

  • 108.

    Alberti, T. et al. Временное разделение при взаимодействии солнечного ветра и магнитосферы во время ст. День Святого Патрика в 2013 и 2015 годах. J. Geophys. Res. Space Phys. 122 , 4266–4283. https://doi.org/10.1002/2016JA023175 (2017).

  • 109.

    Пан, Н., Ман, В. и Ун, М.P. Точное удаление базового дрейфа в ЭКГ с использованием разложения по эмпирическим модам. in 2007 Совместное заседание 6-го Международного симпозиума по неинвазивной визуализации функциональных источников мозга и сердца и Международной конференции по функциональной биомедицинской визуализации , 177–180 (IEEE, 2007).

  • 110.

    Chen, H. J., Chen, C. C., Tseng, C. Y. и Wang, J. H. Влияние приливных триггеров на сейсмичность на Тайване, выявленное методом эмпирической разложения по модам. Нат.Опасности Earth Syst. Sci. 12 , 2193. https://doi.org/10.5194/nhess-12-2193-2012 (2012).

    ADS Статья Google ученый

  • 111.

    Матчарашвили Т., Телеска Л., Челидзе Т., Джавахишвили З. и Жукова Н. Анализ временных изменений землетрясений на Кавказе с 1960 по 2011 гг. Тектонофизика 608 , 857–865. https://doi.org/10.1016/j.tecto.2013.07.033 (2013).

    ADS Статья Google ученый

  • 112.

    Фан, X. и Лин, М. Мультимасштабный мультифрактальный анализ отклоненных от тренда флуктуаций рядов магнитуд землетрясений в Южной Калифорнии. Phys. A: Стат. Мех. Прил. 479 , 225–235. https://doi.org/10.1016/j.physa.2017.03.003 (2017).

    Артикул Google ученый

  • 113.

    Nenadic, Z. & Burdick, J.W. Обнаружение всплесков с помощью непрерывного вейвлет-преобразования. IEEE Trans. Биомед. Англ. 52 , 74–87 (2004).

    Артикул Google ученый

  • 114.

    Yang, H.-W. et al. Метод минимальной длины дуги для удаления всплесков в разложении по эмпирическим модам. IEEE Access 7 , 13284–13294 (2019).

    Артикул Google ученый

  • 115.

    Хартен, А., Энгквист, Б., Ошер, С., Чакраварти, С. Р. Практически не колебательные схемы с равномерно высокой точностью, III. в против ветра и схемах высокого разрешения , 218–290 (Springer, 1987).

  • 116.

    Meneveau, C. & Sreenivasan, K. Мультифрактальная природа турбулентной диссипации энергии. J. Fluid Mech. 224 , 429–484 (1991).

    ADS Статья Google ученый

  • 117.

    Мацек, В. М., Ваврзашек, А. Мультифрактальная турбулентность на скачке уплотнения. in AIP Conference Proceedings , Vol. 1216, 572–575 (Американский институт физики, 2010).

  • 118.

    Meneveau, C. & Sreenivasan, K. R. Мультифрактальная природа турбулентной диссипации энергии. J. Fluid Mech. 224 , 429–484 (1991).

    ADS Статья Google ученый

  • 119.

    Frisch, U.И Колмогоров А. Н. Турбулентность: наследие А. Н. Колмогорова (Cambridge University Press, Кембридж, 1995).

    Книга Google ученый

  • 120.

    Матерасси М., Верник А. В. и Йорданова Е. Статистика в p-модели. Chaos Solit. Фракталы 30 , 642–655 (2006).

    ADS Статья Google ученый

  • 121.

    Марш, Э.& Tu, C.-Y. Перемежаемость, негауссова статистика и фрактальное масштабирование mhd-флуктуаций в солнечном ветре. Нелинейный процесс. Geophys. 4 , 101–124 (1997).

    ADS Статья Google ученый

  • 122.

    Мацек, В. М. Мультифрактальность и перемежаемость солнечного ветра. Нелинейный процесс. Geophys. 14 , 695–700 (2007).

    ADS Статья Google ученый

  • 123.

    Гжесяк М. Анализ случайных каскадных процессов в каспах земной магнитосферы. Acta Geophys. Полон. 48 , 241–261 (2000).

    Google ученый

  • 124.

    Музи, Ж.-Ф., Бакри, Э. и Арнеодо, А. Мультифрактальный формализм, пересмотренный с помощью вейвлетов. Внутр. J. Bifurcation Chaos 4 , 245–302 (1994).

    ADS MathSciNet Статья Google ученый

  • 125.

    Macek, W. M. & Wawrzaszek, A. Мультифрактальная двухуровневая модель канторного набора для медленной турбулентности солнечного ветра во внешней гелиосфере во время солнечного максимума. Нелинейный процесс. Geophys. 18 , 287 (2011).

    ADS Статья Google ученый

  • 126.

    Фардж, М. Вейвлет-преобразования и их приложения к турбулентности. Annu. Rev. Fluid Mech. 24 , 395–458 (1992).

    ADS MathSciNet Статья Google ученый

  • 127.

    Гонсалес А.О., Джуниор О.М., Менкони В.Э. и Домингес М.О. Вейвлет-коэффициенты Добеши: инструмент для изучения флуктуаций межпланетного магнитного поля. Geofís. Int. 53 , 101–115 (2014).

    Google ученый

  • 128.

    Kampers, G. et al. Распутывание стохастических сигналов, наложенных на короткие локализованные колебания. Phys. Lett. А 384 , 126307 (2020).

    MathSciNet CAS Статья Google ученый

  • Сравнительное исследование методов частотно-временного разложения для обнаружения неисправностей в асинхронных двигателях с использованием анализа вибрации во время переходных процессов при запуске

    Асинхронные двигатели являются критически важными компонентами для большинства отраслей промышленности, и для обнаружения неисправностей необходим мониторинг состояния.Существует несколько методов диагностики неисправностей асинхронных двигателей, и анализ сигналов переходной вибрации при запуске не так широко используется, как другие методы, такие как анализ сигнатуры тока двигателя. Анализ вибрации дает диагностику неисправностей, сосредоточенную на локализации спектральных компонентов, связанных с неисправностями. Таким образом, в данной статье представлено сравнительное исследование различных методологий частотно-временного анализа, которые могут быть использованы для обнаружения неисправностей в асинхронных двигателях, анализирующих сигналы вибрации во время переходного процесса при запуске.Изучаемые методологии — это частотно-временное распределение Габора (TFDG), частотно-временная скалограмма Морле (TFMS), классификация множественных сигналов (MUSIC) и быстрое преобразование Фурье (FFT). Анализируемые вибрационные сигналы: один сломанный стержень ротора, два сломанных стержня, неуравновешенность и дефекты подшипников. Полученные результаты показали возможность обнаружения неисправностей в асинхронных двигателях с помощью частотно-временного спектрального анализа, применяемого к сигналам вибрации, и предложенная методика применима, когда она не имеет сигналов тока, а имеет только сигналы вибрации.Кроме того, методика применяется в двигателях, которые не питаются напрямую от линии питания, в таких случаях анализ токовых сигналов не рекомендуется из-за плохого качества токовых сигналов.

    1. Введение

    Асинхронные двигатели являются одними из наиболее часто используемых машин в мире. Применения разнообразны, а преимущества их использования многочисленны. Около половины электроэнергии, потребляемой промышленностью в США, используется асинхронными двигателями; Фактически, 89% двигателей в производстве — электродвигатели [1].Они также присутствуют в различных видах транспорта. В результате они являются основными элементами в современном индустриальном мире. Отсюда возникает необходимость в быстрой и точной диагностике неисправностей для предупреждения остановки работы в процессах, в которых используются эти машины. Отказ асинхронных двигателей может происходить в любом из трех основных компонентов: роторе, статоре и подшипниках [2]. Фактически, 38% отказов происходит в статоре, 10% — в роторе и около 40% представляют собой механические отказы, включая повреждение подшипников, перекос, эксцентриситет и изгиб вала [3].

    Самыми популярными методами обнаружения неисправностей в асинхронных двигателях являются сигнатурный анализ тока двигателя (MCSA) и анализ вибрации. MCSA позволяет неинвазивную диагностику неисправностей в режиме онлайн [4]. В этом методе используется датчик на эффекте Холла для измерения сигналов тока статора и система сбора данных для регистрации сигнала [5]. Затем этот токовый сигнал анализируется для определения характерных черт и характеристик компонентов, связанных с различными неисправностями, которые могут усиливаться во время переходного процесса запуска, поскольку двигатель работает в напряженных условиях [6].С другой стороны, методы анализа вибрации используются для диагностики неисправностей асинхронных двигателей с использованием сигналов вибрации по трем пространственным осям [7]; этот метод особенно подходит для определения механических неисправностей. Измерение вибрации производится с использованием акселерометров в качестве основных датчиков. Затем вибрационные сигналы регистрируются системой сбора данных [5]. На вибрации асинхронного двигателя влияют изменения магнитодвижущей силы, вызванные неисправностями в машине или неисправностями, вызывающими ненормальное вращение двигателя.Это неинвазивный метод, который позволяет легко найти место неисправности [8]. Эти два метода могут использоваться как во время переходного режима запуска, так и в установившемся режиме работы. В зависимости от того, какой режим работы используется для контроля состояния двигателя, существуют определенные характеристики, связанные с различными состояниями неисправности.

    Набор методов диагностики неисправностей асинхронных двигателей путем анализа переходных вибрационных сигналов при запуске не так широко используется по сравнению с методами, которые анализируют токовые сигналы.Анализ вибрации и MCSA дают диагностику неисправностей, сфокусированную на местоположении спектральных компонентов, связанных с неисправностями, с использованием преобразования Фурье, которое переводит сигнал из временной области в частотную область, отображая все частотное содержание сигнала, но не позволяет наблюдать эволюции частотного содержания сигнала во времени. Это является причиной расширения возможностей преобразования Фурье, таких как линейное частотно-временное разложение (кратковременное преобразование Фурье и вейвлет-преобразование), квадратичное частотно-временное разложение и распределения время-частотной энергии, которые позволяют эволюцию частотного содержания на всем протяжении длительность сигнала во времени.Это очень полезно для нестационарных сигналов, таких как сигналы, полученные от переходного процесса запуска двигателя, потому что сигнатуры, связанные с неисправностями, развиваются со временем, и их частотный состав не остается постоянным, а изменяется во время переходного процесса запуска. Чтобы найти признаки, связанные с неисправностями двигателя, на MCSA использовались различные инструменты для частотно-временного разложения, позволяющие отслеживать эволюцию таких частот во времени. Примерами таких разложений являются кратковременное преобразование Фурье [9–12], дискретное вейвлет-преобразование [12–15], непрерывное вейвлет-преобразование [16–19], преобразование Гильберта [20, 21], преобразование Гильберта-Хуанга [ 20, 21], распределение Вигнера-Вилля [22–27], распределение Чоя – Вильямса [26–28] и классификация множественных сигналов (MUSIC) [5].Некоторые из этих инструментов работают вместе с классификаторами искусственного интеллекта для принятия решений о компонентах или сигнатурах, которые присутствуют в сигналах для идентификации ошибок и их серьезности, таких как искусственные нейронные сети (ИНС), нечеткая логика, нечеткие нейронные сети и генетические алгоритмы [6, 10, 14, 16, 17, 24, 29]. Гарсия-Перес и др. [5] представили исследование по обнаружению множественных неисправностей в асинхронном двигателе путем применения MUSIC к токовому сигналу в установившемся режиме.Впоследствии Гарсия-Перес и др. [30] расширил метод обнаружения множественных неисправностей в асинхронном двигателе с помощью MUSIC, включая звуковые сигналы наряду с сигналами вибрации, также в установившемся режиме. Родригес-Донате и др. [31] разработали метод идентификации множественных неисправностей в асинхронном двигателе, напрямую подключенном к электросети, на основе дискретного вейвлет-преобразования (DWT), применяемого к переходному процессу вибрации при запуске. Pilloni et al. [19] представили сравнительное исследование различных методологий, включая быстрое преобразование Фурье (FFT), преобразование Гильберта (HT), DWT, непрерывное вейвлет-преобразование (CWT) и распределение Вигнера-Вилля (WVD), применяемое к сигналу тока статора в асинхронные двигатели для обнаружения неисправностей как в установившемся, так и в переходном режимах.Гарсия-Перес и др. [32] представили экспериментальное исследование частотно-временных характеристик эволюции во время переходного процесса запуска токового сигнала в асинхронном двигателе с частично сломанной штангой ротора при подаче непосредственно в электросеть с использованием MUSIC. Большинство этих методов использовалось для анализа сигналов тока статора. В случае вибрационных сигналов не проводится много исследований по применению методов частотно-временного разложения для анализа, где в основном используются БПФ [33] и распределение Чжао-Атласа-Маркса (ZAM) [34] для частотно-временного разложения. был использован.Следовательно, существует необходимость исследовать пригодность методов частотно-временного разложения для выявления неисправностей двигателя во время переходного процесса при запуске с использованием сигналов вибрации, применяя спектральный анализ с высоким разрешением в качестве метода MUSIC.

    Вклад этой работы — сравнительное исследование различных методологий частотно-временного анализа, которые могут быть использованы для обнаружения неисправностей в асинхронных двигателях, анализирующих сигналы вибрации во время переходного процесса запуска. Предлагаемые методологии — это частотно-временное распределение Габора (TFDG), частотно-временная скалограмма Морле (TFMS), MUSIC и FFT.Выбор TFDG и TFMS основан на их способности уменьшать помехи, также известные как перекрестные члены между параллельными развивающимися гармониками. MUSIC — это техника, используемая в MCSA, которая дала наилучшие результаты благодаря очень хорошему разрешению по частоте. БПФ используется в качестве эталона для сравнения с другими методологиями. Анализируемые вибрационные сигналы в данной статье связаны со следующими неисправностями двигателя: поломка одного стержня ротора, поломки двух стержней, дисбаланса и дефектов подшипников.

    2.Описание устраняемых неисправностей

    В этой статье рассматриваются три распространенных неисправности асинхронных двигателей: состояние дисбаланса (UNB), неисправность подшипников (BDF) и поломка стержней ротора (BRB).

    2.1. Дисбаланс (UNB)

    Механическая балансировка в асинхронном двигателе включает в себя всю конструкцию ротора, которая состоит из множества частей, включая вал, пластинки ротора, концевые головки, стержни ротора, концевые соединители, стопорные кольца и вентиляторы. Эти многие элементы должны быть спроектированы и изготовлены для конечного узла, обеспечивающего стабильную прецизионную балансировку.Когда двигатель правильно сбалансирован и выровнен, амплитуда частоты, связанная с неисправностью дисбаланса, практически не изменяется и остается ограниченной до определенного уровня. Однако механический дисбаланс в асинхронном двигателе вызывает небольшую радиальную вибрацию конструкции статора. Уровень вибрации достигает максимума, когда частота вращения равна собственной частоте системы, определяемой выражением, где — коэффициент жесткости, а — масса дисбаланса [35, 36]. Кроме того, этот вибрационный сигнал колеблется с частотой вращения, уровень вибрации увеличивается, как и амплитуда частоты вращения, и то же самое происходит с его гармониками [37].Анализ сигналов вибрации может обеспечить быстрый и простой способ получения информации, позволяющей диагностировать наличие дисбаланса в асинхронном двигателе. Номинальная скорость двигателя, обычно выражаемая в оборотах в минуту, предоставляется производителем. В асинхронных двигателях эта скорость немного ниже синхронной скорости, которая связана с частотой электрического питания следующим образом: где — число полюсов двигателя, а константа «120» используется для выражения синхронной скорости двигателя в оборотах. -поминутные единицы.

    2.2. Неисправности подшипников (BDF)

    Некоторые авторы [38] дают обзор причин и ожидаемых частот вибрации подшипников качения. Различные частоты, связанные с вращением двигателя, могут быть рассчитаны на основе геометрии подшипника, например, частоты прохождения элементов внутреннего и внешнего кольца, частота вращения сепаратора и частота вращения тел качения. Дефект на внешнем кольце вызывает импульс каждый раз, когда тела качения соприкасаются с дефектом.Скорость ротора () — это частота вращения внутренней дорожки качения, которая должна быть частотой вала. Физическое явление вибрации, генерируемой в телах качения, таких как подшипники, в исправном состоянии можно объяснить как комбинацию различных источников, таких как модуляция из-за неравномерной нагрузки, изгибные режимы подшипников, а также вибрации и шум, вызванные оборудованием. Предполагается, что нагрузка на подшипник представляет собой неуравновешенную силу. Следовательно, радиальная нагрузка перемещается по окружности внешнего кольца при вращении вала.Одиночная радиальная нагрузка преобразуется в распределенную нагрузку, поскольку внутреннее кольцо находится в контакте с более чем одним шариком во время вращения. Однако для состояния неисправности подшипника, когда дефект одной поверхности подшипника ударяется о сопрягаемую поверхность, создается импульс, который вызывает резонансы в системе. При этом дефект контактирует с одним из тел качения и находится в центре зоны нагрузки на линии действия приложенной радиальной нагрузки. Механическая система симметрична относительно линии приложенной нагрузки.При вращении подшипника удары происходят с частотой внешней дорожки качения (), определяемой по формуле [39], где — угол контакта между поверхностями подшипника, — диаметр сепаратора подшипника и измеряется от центра шарика до противоположного шарика. центр, — диаметр шарика, — количество шариков в подшипнике.

    2.3. Сломанные стержни ротора (BRB)

    В случае стержней ротора известно, что симметричные токи в симметричном роторе асинхронного двигателя индуцируют результирующее прямое вращающееся магнитное поле с синхронной скоростью со здоровыми стержнями ротора.Сломанные стержни ротора приводят к асимметрии ротора; затем возникает вращающееся назад поле с частотой скольжения по отношению к ротору. Взаимодействие вращающегося в обратном направлении поля ротора с полем статора вызывает колебательный момент и колебательную скорость, и частота этого колебания равна, где это колебание действует как частотная модуляция на частоте вращения, а частота неисправности () появляется в спектре колебаний. [40]: где — частота питания, — это скольжение двигателя на единицу, — это скорость ротора, и — положительные целые числа.Скольжение определяется как относительная механическая скорость двигателя по отношению к синхронной скорости двигателя следующим образом:

    3. Теоретические основы
    3.1. Музыкальный алгоритм

    Методы подпространства известны как методы высокого разрешения, которые обнаруживают частоты с низким отношением сигнал / шум. Методы подпространства предполагают, что сигнал с дискретным временем может быть представлен комплексными синусоидами в шуме [5], поскольку где — количество выборочных данных, — комплексная амплитуда комплексной синусоиды th, — ее частота и является последовательностью белого шума. с нулевым средним и дисперсией.Этот метод использует разложение по собственным векторам для получения двух ортогональных подпространств. Матрица автокорреляции зашумленного сигнала представляет собой сумму матриц автокорреляции сигнала и шума (и, соответственно): где — количество частот, а показатель степени обозначает эрмитовское транспонирование. — единичная матрица, а — вектор сигнала, заданный формулой Из условия ортогональности обоих подпространств псевдоспектр MUSIC задается формулой где — собственный вектор шума. Это выражение показывает пики, которые точно соответствуют частотам основных синусоидальных компонентов, где.

    3.2. Частотно-временное распределение Габора

    Расширенная версия STFT (кратковременное преобразование Фурье) представляет собой частотно-временное распределение Габора (TFDG), которое использует тип окна Гаусса и FT (преобразование Фурье) для достижения времени -частотный анализ [41]. У TFDG есть недостаток компромисса, как у STFT, вызванный фиксированной шириной окна, но он имеет лучшее разрешение по частоте, чем STFT.

    TFDG описывается следующим уравнением: Как и в непрерывном случае, дискретный TFDG идентичен дискретному STFT с конкретной характеристикой окна Гаусса.Дискретный TFDG может расширяться как линейная комбинация коэффициентов Габора и базовых функций [42, 43]. Для конечного набора данных разложение Габора получается из того, где массив является периодическим по периоду и с периодом. Последовательность известна как окно синтеза. Массив коэффициентов Габора можно найти через TFDG: где последовательность — это окно анализа. Преобразование Зака ​​используется для получения коэффициентов Габора. Дискретное преобразование Зака ​​периодизированного окна определяется как одномерное дискретное преобразование Фурье последовательности: где и — параметры настройки, — период и — длина выборки.

    3.3. Скалограмма Морле

    Поскольку непрерывное вейвлет-преобразование ведет себя как разложение ортонормированного базиса, можно показать, что оно сохраняет энергию: где — энергия. Это приводит нас к определению скалограммы как квадрата модуля непрерывного вейвлет-преобразования. Это распределение энергии сигнала на шкале времени, связанное с мерой.

    Что касается вейвлет-преобразования, временное и частотное разрешение скалограммы связано через принцип Гейзенберга-Габора: временное и частотное разрешение зависят от рассматриваемой частоты [44].

    Разрешение по частоте явно зависит от частоты, поскольку оно увеличивается с. Интерференционные составляющие скалограммы ограничены теми областями частотно-временной плоскости, где перекрываются соответствующие автоскалограммы (составляющие сигнала). Следовательно, если два компонента сигнала находятся достаточно далеко друг от друга в частотно-временной плоскости, их перекрестная скалограмма по существу равна нулю.

    Вейвлет Морле является наиболее популярным комплексным вейвлетом, используемым на практике, материнский вейвлет которого определяется как где — центральная частота материнского вейвлета.Обратите внимание, что этот термин используется для исправления ненулевого среднего комплексной синусоиды, и им можно пренебречь, когда. Поэтому в некоторых исследованиях определение материнского вейвлета вейвлета Морле дается где центральная частота. Вейвлет Морле имеет форму, очень похожую на преобразование Габора. Важное отличие состоит в том, что оконная функция также масштабируется параметром масштабирования, в то время как размер окна в преобразовании Габора является фиксированным [45].

    4. Проверка предлагаемых методов

    Для проверки предлагаемой методологии генерируется синтетический сигнал, как указано в (17), с целью имитации некоторых гармоник вибрации, присутствующих в реальных сигналах электродвигателя.Синусоидальный сигнал состоит из трех чистых синусоидальных сигналов с постоянной частотой 80, 670 и 700 Гц, а также синусоидального сигнала с переменной частотой в диапазоне от 0 Гц до 56,7 Гц от 0 до 2 с, а затем остается с постоянной частотой. К сигналу также добавляется нормально распределенный случайный шум. Компоненты постоянной частоты, расположенные на 670 и 700 Гц, используются для оценки производительности метода для различения близких компонентов. Синусоида с переменной частотой имитирует пусковой переходный процесс, достигающий установившегося состояния на 56.7 Гц, что близко к постоянной составляющей частоты 80 Гц. Наконец, добавлен гауссов шум (), чтобы оценить поведение обрабатываемого метода для сигналов с низким отношением сигнал / шум. Синтетический сигнал квантуется с частотой дискретизации 1,5 кГц, что составляет 4096 отсчетов с общим временем работы 2,73 с. Также синтетический сигнал имеет отношение сигнал / шум, равное SNR = -3,6 дБ: где — синтетический сигнал,,,, и Рисунок 1 показывает результаты процесса проверки для синтетического сигнала во временной области и во временной области. частотное разложение, полученное обработанными методами.На рисунке 1 (а) изображен синтетический сигнал во временной области. Истинное (теоретическое) частотно-временное разложение показано на рисунке 1 (b). Частотно-временное разложение обработанных методов показано на рисунке 1 (c) для STFT, на рисунке 1 (d) для TFDG, на рисунке 1 (e) для TFMS и на рисунке 1 (f) для MUSIC.

    Как видно из рисунка 1 (c), поведение STFT не является хорошим методом частотно-временного разложения, когда отношение сигнал / шум низкое; Также очень трудно различить две близкие частоты на 670 и 700 Гц, тогда как синусоида переменной частоты едва видна, а в установившемся состоянии она неотличима от спектральной составляющей 80 Гц.С другой стороны, другие предложенные методы позволяют отличить спектральные составляющие от фонового шума. Эти три метода четко определяют временную эволюцию синусоиды переменной частоты, и также отчетливо видна составляющая 80 Гц. Тем не менее, методы TFDG и MUSIC обнаруживают близкие спектральные компоненты, расположенные на 670 и 700 Гц, но метод TFMS не может дать четкий результат в этой области, и MUSIC может отображать три частоты без какого-либо шума в своем спектре.Наконец, делается вывод, что MUSIC является лучшим частотно-временным разложением из четырех протестированных методов, где полученный спектр менее подвержен низкому отношению сигнал / шум.

    5. Экспериментальная установка

    Испытательный стенд, используемый для тестирования двигателей с различными типами неисправностей, и система сбора данных, используемая для регистрации сигналов, показаны на рисунке 2. Несколько асинхронных двигателей с короткозамкнутым ротором, модель WEG 00136APE48T, из 1 л.с. (745,7 Вт) используются для проверки исправных и неисправных состояний двигателя.Двигатели имеют два полюса, 28 бар, они питаются напряжением 220 В переменного тока при 60 Гц, а приложенная нагрузка представляет собой обычный генератор переменного тока. Сигналы вибрации регистрируются с помощью трехосного акселерометра на базе микроэлектромеханических систем (модель LIS3L02AS4) от STMicroelectronics. Для сбора данных (DAS) используется 12-разрядный четырехканальный аналого-цифровой преобразователь с последовательным выходом (ADS7841). Эта система сбора данных использует частоту дискретизации 1,5 кГц, и во время переходного процесса при запуске получается 4096 отсчетов.На рисунках 2 (b) и 2 (c) представлены вид спереди и сбоку асинхронного двигателя, соответственно, с указанием положения акселерометра и ориентации его осей.

    5.1. Неисправности двигателя

    Состояние UNB возникает, когда механическая нагрузка асинхронного двигателя распределяется неравномерно, в результате чего центр масс выходит за пределы вала двигателя. На рисунке 3 показан шкив со смещенной от центра массой, используемый для создания состояния UNB на асинхронном двигателе. Сигнатура UNB в сигнале вибрации обычно имеет форму увеличенной амплитуды вдоль частоты ротора, находясь в данном случае на 56.7 Гц.


    Для проведения теста на неисправность подшипника его искусственно повреждают путем просверливания отверстия диаметром 1,191 мм на его внешнем кольце с помощью вольфрамового сверла. На рисунке 4 показан искусственно поврежденный подшипник модели 6203-2ZNR, использованный в этом эксперименте. Частота характерных дефектов вибрации наружного кольца подшипника качения рассчитывается по формуле (2). Исследуемый асинхронный двигатель имеет частоту ротора Гц, а испытательный подшипник имеет восемь шариков по 6 штук.Диаметр 5 мм и диаметр сепаратора подшипника 28 мм с углом контакта; таким образом, дефект частоты внешней дорожки качения шарового паса () составляет 174,1 Гц.


    Как уже упоминалось, частоты, характерные для BRB, зависят от колебания скорости с частотой 2. Состояние сломанного стержня создается искусственно путем сверления одного отверстия диаметром 7,938 мм без повреждения вала ротора. На рисунке 5 изображен используемый ротор с одним BRB. Двигатель работает со скоростью 3402 об / мин в системе 60 Гц.Гармоники, характерные для неисправности BRB, получаются сначала путем включения фактических значений данных скорости двигателя в (4), чтобы найти значение скольжения (), которое можно использовать в (3) для получения частот гармоник, связанных с BRB.


    5.2. Методология

    На рисунке 6 изображена блок-схема предлагаемой методологии. Во-первых, испытательный стенд устанавливается с асинхронным двигателем в различных условиях: исправный, один и два сломанных стержня ротора, неуравновешенный шкив и неисправность подшипника на внешнем кольце.Затем начинается процесс сбора данных, чтобы получить начальный переходный процесс вибраций через трехосный акселерометр. Во время переходного процесса при запуске регистрируется 4096 отсчетов на частоте 1,5 кГц за время сбора данных 2,73 с. После завершения процесса регистрации переходного процесса при запуске полученные сигналы вибрации обрабатываются и анализируются. На этом этапе применяются методологии частотно-временного разложения TFDG, TFMS и MUSIC, которые сравниваются с STFT. Наконец, по результатам спектрограмм частотно-временного разложения определяется состояние двигателя.Кроме того, проводится качественная и количественная оценка распределений, используемых для оценки их производительности, по сравнению с STFT.


    6. Результаты и обсуждение

    В этом разделе представлены результаты, полученные после анализа сигналов вибрации с помощью методов частотно-временного разложения, TFDG, TFMS и MUSIC, включая сравнение с STFT. Эти вибрационные сигналы регистрируются при пусковых переходных процессах двигателей в пяти различных условиях, а именно: исправное состояние, одна сломанная штанга ротора, две сломанные штанги ротора, дисбаланс и дефекты подшипников.Наилучшие результаты получаются из сигнала вибрации по оси, и это связано с тем, что вибрации в асинхронном двигателе обычно являются радиальными колебаниями (вертикальными или осевыми) из-за радиальных сил, действующих на статор и ротор, связанных с магнитными потоками. вход или выход из металлических поверхностей в асинхронном двигателе, а также наличие компонентов спектрального потока, создаваемых распределениями плотности тока, пазами статора и ротора, а также магнитное насыщение, которое вносит дополнительные нежелательные компоненты в радиальные силы [7].Результаты представлены в четырех случаях исследования и дан качественный анализ состояния работы двигателя.

    Пример исследования: Здоровый . На рис. 7 представлено частотно-временное разложение STFT, TFDG, TFMS и MUSIC сигнала для здорового случая. Для этого случая исследования полоса частот между 400 Гц и 700 Гц имеет некоторые едва заметные изменения, связанные с ранее существовавшими эксцентриситетами в двигателе, которые заметны только после переходного процесса запуска, когда достигается установившийся режим.В спектрограммах для исследуемого случая нет других значимых частотных компонентов, и эти спектрограммы становятся эталоном для сравнения неисправных состояний двигателя.

    Пример исследования: сломанные стержни ротора . Как упоминалось ранее, неисправность в сломанных стержнях ротора можно обнаружить, наблюдая за изменением частоты на спектрограмме. Из (3) и полученных спектрограмм наблюдается и наличие гармоники (617,1 Гц) неисправности частоты BRB, близкой к частоте 640 Гц, показанной на спектрограммах здорового случая.На рисунке 8 (a) показана спектрограмма STFT, и имеется значительная полоса частот около 620–655 Гц, но гармоника (617,1 Гц) неисправности частоты BRB четко не обнаруживается. На рисунке 8 (b) представлена ​​спектрограмма TFDG, значимая частота составляет около 640 Гц, поэтому гармоника не обнаруживается. На рисунке 8 (c) показана спектрограмма TFMS, и это наихудший метод, потому что значительная полоса частот находится в районе 610–690 Гц, поэтому ошибка частоты BRB не обнаруживается. На рисунке 8 (а) показана спектрограмма MUSIC, где гармоника (617.1 Гц) неисправности частоты BRB четко определяется, когда режим запуска заканчивается и начинается установившееся состояние (отмечено белым).

    На рисунке 9 показаны спектрограммы частотно-временного разложения STFT, TFDG, TFMS и MUSIC для случая стержня с двумя сломанными роторами. Для этого случая исследования ошибка частоты BRB, когда и (87 Гц), и другая гармоника и (263,7 Гц) присутствуют в большинстве полученных спектрограмм (отмечены белым цветом). На рисунке 9 (а) показана спектрограмма STFT; однако ошибка частоты BRB и гармоники в 87 Гц и 263.7 Гц не наблюдаются четко, как в других методах. На рисунке 9 (b) показаны спектрограммы TFDG, но в этом методе обе частоты лучше наблюдаются с меньшими шумовыми помехами, и эти частоты показывают лучшее разрешение как STFT. На рисунке 9 (c) показана спектрограмма TFMS, где во время запуска в установившемся режиме слегка наблюдается только сбой частоты BRB. На рисунке 9 (d) представлена ​​спектрограмма MUSIC, и этот метод обеспечивает лучший просмотр для исследуемого случая с ошибкой частоты BRB и его гармониками (87 Гц и 263.7 Гц) во время завершения запуска и устойчивых запусков. Но также гармоника в 617,1 Гц немного обнаруживается в начале установившегося режима.

    Пример исследования: дисбаланс . На рисунке 10 показан анализ STFT, TFDG, TFMS и MUSIC для несбалансированного случая. В этом случае скорость двигателя в оборотах в минуту соответствует частотной составляющей в Гц.

    Как видно из рисунка 10, имеется четко выраженная частотная составляющая около 56,7 Гц.Эта частотная составляющая связана со скоростью ротора, и ее повышенное значение указывает на наличие дисбаланса в рабочем состоянии. Обратите внимание, что в здоровом случае нет значимых частотных компонентов на 56,7 Гц на частотно-временных спектрограммах, демонстрирующих наличие этой неисправности. Для всех методов анализа: STFT, TFDG, TFMS и MUSIC, соответствующая частота с этой ошибкой четко видна (отмечена белым цветом). Эта неисправность также способствует образованию пиков в полосе частот, связанных с эксцентриситетом двигателя, но то, что делает возможной идентификацию, — это увеличение амплитуды спектральной составляющей, которая связана с вращением ротора, и MUSIC обеспечивает лучшая визуализация частотной составляющей, связанной с неисправностью.

    Пример исследования: дефекты подшипников . На рисунке 11 показаны спектрограммы частотно-временного разложения STFT, TFDG, TFMS и MUSIC для случая дефектов подшипников. Как упоминалось ранее, дефект на внешнем кольце вызывает импульс каждый раз, когда элемент качения контактирует с дефектом. Таким образом, частота, связанная с этой неисправностью, связана с вращением вала, а частота, связанная с неисправностью внешней дорожки качения (), составляет 174,1 Гц. MUSIC — единственный метод, способный обнаружить эту частоту в 3-й гармонике (522 Гц) в конце переходного процесса при запуске и начале установившегося режима (отмечено белым цветом).

    Для количественной оценки эффективности различных методов спектральной оценки представлено сравнение обнаруживаемости в децибелах. Обнаруживаемость рассчитывается как среднее отношение амплитуд между пиковой амплитудой для исправных и неисправных состояний спектральных частот, присутствующих в области эволюции. Сравнительное исследование обобщено в таблице 1, и в исследовании оценивается эффективность метода спектральной оценки MUSIC при обнаружении сломанной шины ротора, механического дисбаланса и неисправностей подшипников по сравнению с другими методами.

    92 819

    Состояние STFT TFDG TFMS МУЗЫКА

    Здоровый 10 7 11 12
    Сломанный стержень ротора 12 9 13 21
    Механический дисбаланс 15 10 6 Неисправность 28
  • 928 928 928 928 928 928 928 928 928 928 928 928 928
  • 21 32

    Таблица 1 показывает, что MUSIC обеспечивает лучшую обнаруживаемость трех изученных неисправностей в асинхронном двигателе во время переходного режима запуска, поскольку обеспечивает большую обнаруживаемость для все условия.

    7. Выводы

    Была показана возможность обнаружения неисправностей в асинхронных двигателях с помощью частотно-временного спектрального анализа, предложенного в этой статье, применительно к сигналам вибрации. Методология, предложенная в этой статье, применима, когда она не имеет сигналов тока, а имеет только сигналы вибрации. Эта методика также применяется в двигателях, которые не питаются напрямую от линии питания; в таких случаях анализ текущих сигналов не рекомендуется из-за плохого качества текущего сигнала.Точно так же с использованием этой методологии могут быть обнаружены неисправности, так как MCSA выполняется при мониторинге тока асинхронного двигателя. Метод частотно-временного разложения, который обеспечивает лучшие результаты, — это MUSIC, который имеет более высокое разрешение по частоте и способен обнаруживать частоты и их гармоники, связанные с устраненными неисправностями в сильно зашумленном вибрационном сигнале. Для дальнейшего развития может быть включена система классификации для автоматического обнаружения неисправностей. Кроме того, анализ, применяемый к объединению данных от датчиков ускорения и тока, может дать улучшенную методологию обнаружения неисправностей в асинхронных двигателях.

    Конфликт интересов

    Авторы заявляют об отсутствии конфликта интересов в отношении публикации данной статьи.

    Благодарности

    Это исследование было частично поддержано стипендией CONACYT 237491, грантом Университета Гуанахуато SEP PIFI 2014 и Университетом Вальядолида, проект 061/130251.

    19i_contents.PDF

    % PDF-1.4 % 1 0 объект > / Контуры 2 0 R / Метаданные 3 0 R / AcroForm 4 0 R / Страницы 5 0 R / OpenAction 6 0 R / Тип / Каталог >> эндобдж 7 0 объект > эндобдж 2 0 obj > эндобдж 3 0 obj > транслировать Acrobat PDFWriter 4.05 для Windows 2007-10-10T10: 47: 38 + 02: 002003-08-14T10: 06: 32-04: 002007-10-10T10: 47: 38 + 02: 00 Приложение Microsoft Word / pdf

  • BA&H User
  • 19i_contents.PDF
  • uuid: c35a2175-7e23-45e6-b247-4576459cf979uuid: 882e4405-de5a-40be-a0e8-247ab1a55ded конечный поток эндобдж 4 0 obj > / Кодирование> >> >> эндобдж 5 0 obj > эндобдж 6 0 obj > эндобдж 8 0 объект > эндобдж 9 0 объект > эндобдж 10 0 obj > эндобдж 11 0 объект > эндобдж 12 0 объект > эндобдж 13 0 объект > / XObject> >> / Аннотации [29 0 R] / Родитель 5 0 R / MediaBox [0 0 595 842] >> эндобдж 14 0 объект > / ProcSet [/ PDF / Text / ImageB] >> / Тип / Страница >> эндобдж 15 0 объект > / ProcSet [/ PDF / Text / ImageB] >> / Тип / Страница >> эндобдж 16 0 объект > / ProcSet [/ PDF / Text / ImageB] >> / Тип / Страница >> эндобдж 17 0 объект > / ProcSet [/ PDF / Text / ImageB] >> / Тип / Страница >> эндобдж 18 0 объект > / ProcSet [/ PDF / Text / ImageB] >> / Тип / Страница >> эндобдж 19 0 объект > / ProcSet [/ PDF / Text / ImageB] >> / Тип / Страница >> эндобдж 20 0 объект / S / GoToR >> эндобдж 21 0 объект > эндобдж 22 0 объект / S / GoToR >> эндобдж 23 0 объект > эндобдж 24 0 объект > транслировать xVRH} W /

    & * ^ FR˞4 # fFf7 | jz6aTxx

    Bva% `* [[q! G0lt = s ڟ ~> 3 F0bN gj9″ jPinМs3LYYq1kmxn> (҆z (0T2t [goDGu>%

    .

    alexxlab

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *