Как построить обучающую базу ЭКГ для нейросети
В данной статье приводятся преимущества применения искусственных нейронных сетей в неявных задачах медицинской диагностики, таких как анализ электрокардиосигналов. Объясняются основы обучения и самоорганизации биологических и искусственных нейронных сетей. Предлагаются два основных варианта построения структуры нейронных сетей для анализа электрокардиосигналов: многослойный персептрон и модульная структура нейронной сети. Представлены особенности и недостатки обоих вариантов. Для каждой структуры нейронной сети показаны принципы построения и особенности обучающей базы данных.
Введение
Исследования по искусственным нейронным сетям (далее нейронные сети) связаны с тем, что способ обработки информации человеческим мозгом в корне отличается от методов, применяемых обычными цифровыми компьютерами. Мозг представляет собой чрезвычайно сложный, нелинейный, параллельный компьютер (систему обработки информации). Он обладает способностью организовывать свои структурные компоненты, называемые нейронами, так, чтобы они могли выполнять конкретные задачи (такие как распознавание образов, обработку сигналов органов чувств, моторные функции) во много раз быстрее, чем могут позволить самые быстродействующие современные компьютеры. [1]
При рождении мозг имеет совершенную структуру, позволяющую строить собственные правила на основании того, что мы называем «опытом». Опыт накапливается с течением времени, и особенно масштабные изменения происходят в первые два года жизни человека. В этот период формируется остов общей структуры. Однако развитие на этом не прекращается - оно продолжается до последних дней жизни человека. Понятие развития нейронов связано с понятием пластичности мозга — способности настройки нервной системы в соответствии с окружающими условиями. Именно пластичность играет самую важную роль в работе нейронов в качестве единиц обработки информации в человеческом мозге. Аналогично, в искусственных нейронных сетях работа проводится с искусственными нейронами. В общем случае нейронная сеть представляет собой машину, моделирующую способ обработки мозгом конкретной задачи. Эта сеть обычно реализуется с помощью электронных компонентов или моделируется программой, выполняемой на цифровом компьютере. [1]
Многолетние исследования, проводимые с самыми различными явными алгоритмами, показали, что медицинские задачи, имеющие неявный характер, решаются явными методами с точностью и удобством, совершенно недостаточными для широкого практического использования в конкретных задачах диагностики, прогнозирования и принятия решений [2].
Неявные задачи медицины явились идеальным полем для применения нейросетевых технологий, и именно в этой области наблюдается наиболее яркий практический успех нейроинформационных методов. Электрокардиографическая диагностика является одной из таких задач. В последнее время ведутся активные работы, как в России, так и за рубежом, по разработке более точных и быстрых алгоритмов классификации электрокардиограмм. Большая часть работ направлена на использование нейронных сетей. В них с помощью обучения нейронной сети соответствующими выборками (иногда с предварительной обработкой), добиваются устойчивого распознавания типов ЭКГ и выявления нарушений [3].
Процедура, используемая для процесса обучения, называется алгоритмом обучения. Эта процедура выстраивает в определенном порядке синаптические веса нейронной сети для обеспечения необходимой структуры взаимосвязей нейронов [1].
Изменение синаптических весов представляет собой традиционный метод настройки нейронных сетей. Этот подход очень близок к теории линейных адаптивных фильтров, которая уже давно заявила о себе и применяется в различных областях деятельности человека. Однако нейронные сети могут изменять собственную топологию. Это обусловлено тем фактом, что нейроны в человеческом мозге постоянно отмирают, а новые синаптические связи постоянно создаются.
Основной проблемой, при построении качественной системы нейросетевого анализа электрокардиосигнала (ЭКС) является выбор архитектуры данной системы и создание для неё обучающей базы данных, содержащей достаточный объём экспериментальных данных.
Материалы и методы
При постановке задачи для обучения искусственных нейронных сетей исходят из того, что диагностическая система должна выбирать один или несколько предполагаемых диагнозов из заданного набора на основании параметров входного сигнала.
Из обучающей базы берется текущий пример (образ ЭКС) с установленным диагнозом (изначально, первый). Его входные характеристики (представляющие в совокупности вектор входных сигналов) подаются на входные синапсы обучаемой нейронной сети. Обычно каждое значение входного сигнала, обрабатываемого образа ЭКС, подается на один соответствующий входной синапс.
В общем случае нейронная сеть работает по следующей циклической процедуре:
- Нейронная сеть производит заданное количество тактов функционирования, при этом вектор входных сигналов распространяется по связям между нейронами.
- Измеряются сигналы, выданные теми нейронами, которые считаются выходными.
- Производится интерпретация выданных сигналов, и вычисляется ошибка, характеризующая различие между выданным сетью ответом и требуемым ответом, имеющимся в примере. Чем меньше ошибка, тем лучше распознан пример, тем ближе выданный сетью ответ к требуемому. Ошибка равная нулю означает, что требуемое соответствие вычисленного и известного ответов достигнуто. Заметим, что только что инициализированная (необученная) нейронная сеть может выдать правильный ответ только совершенно случайно.
- Если ошибка примера равна нулю, ничего не предпринимается. В противном случае на основании ошибки вычисляются поправочные коэффициенты для каждого синаптического веса матрицы связей, после чего производится подстройка синаптических весов (обратное функционирование). В коррекции весов синапсов и заключается обучение.
- Осуществляется переход к следующему примеру задачника и вышеперечисленные операции повторяются.
Проход по всем примерам обучающей выборки с первого по последний считается одним циклом обучения. Для обучения нейронных сетей берут достаточно большую выборку примеров, данные для которых желательно получать из реальных записей ЭКС с подтвержденными диагнозами.
Рассмотрим два основных варианта организации нейронной сети, которые можно предложить для автоматизированного анализа электрокардиографических сигналов. Первым вариантом можно считать архитектуру схожую с классическим описанием многослойного персептрона (рис.1) [1].
Как видно из рисунка 1, представленная нейронная сеть является полносвязной, т.е. каждый нейрон одного слоя связан со всеми нейронами соседних слоёв. Многослойные персептроны имеют три отличительных признака: 1. Каждый нейрон сети имеет нелинейную функцию активации. Важно подчеркнуть, что данная нелинейная функция является гладкой (т.е. всюду дифференцируемой). Самой популярной формой функции, удовлетворяющей этому требованию, является сигмоидальная, определяемая логистической функцией.
Использование логистической функции мотивировано биологически, так как в ней учитывается восстановительная фаза реального нейрона [1].
2. Сеть содержит один или несколько скрытых слоев нейронов, не являющихся частью входа или выхода сети. Эти нейроны позволяют сети обучаться решению сложных задач, последовательно извлекая наиболее важные признаки из входного образа.
3. Сеть обладает высокой степенью связности, реализуемой посредством синаптических соединений.
Комбинация всех этих свойств наряду со способностью к обучению на собственном опыте обеспечивает вычислительную мощность многослойного персептрона в задачах анализа ЭКС. Вторым вариантом организации нейронной сети для автоматизированного анализа электрокардиографических сигналов можно считать модульную структуру, представленную на рисунке 2.
Данный вариант нейронной сети состоит из нескольких параллельно расположенных нейросетевых модулей, построенных на основе структуры многослойного персептрона (рис. 1). Можно выделить следующие особенности предложенной структуры:
- Нейроны различных нейросетевых модулей не соединены между собой;
- Каждый нейросетевой модуль направлен на распознавание одной патологии;
- Сигнал образа ЭКС поступает на все нейросетевые модули одновременно;
- Каждый нейросетевой модуль может иметь свою архитектуру (количество скрытых слоёв и число нейронов);
Такая организация нейронной сети имеет биологическое обоснование, т.к. отделы головного мозга подобным образом разделены по функциональному назначению (слух, зрение, моторные функции и т.п.). Преимущество данной структуры состоит в том, что каждый модуль концентрирует свои ресурсы на распознавание только одной патологии, что скорее всего должно уменьшить вероятность ошибки неверного заключения для всей системы в целом. Также модульная организация системы позволит увеличивать количество доступных для распознавания патологий без переобучения всей системы.
Несмотря на явные преимущества второго варианта организации нейросетевого анализатора кардиопатологий, его отдельные модули не имеют информации обо всех разновидностях патологий. Поэтому применять его возможно только после исследования и сравнения обоих вариантов.
Обсуждение результатов
В качестве источника входных данных для нейросетевого анализатора электрокардиографических сигналов был выбран одноканальный регистратор электрокардиограммы (ЭКГ), производящий регистрацию ЭКС в одном из стандартных отведений от конечностей.
Одноканальная запись ЭКГ выбрана с целью сведения до минимума сложности аппаратной части и процедуры регистрации. Тем самым можно снизить стоимость комплексов регистрации ЭКГ и их использования. Стандартная процедура анализа ЭКГ требует использования двенадцати отведений, но в тоже время, любые патологические изменения электрической активности сердца должны оказывать своё влияние на все отведения ЭКГ в большей или меньшей степени [3].
Для исследований систем нейросетевого анализа ЭКС, необходимо создать обучающие базы данных, содержащие примеры всех анализируемых разновидностей патологий и состояния нормы.
В качестве обучающей базы данных для структуры нейронной сети типа «многослойный персептрон» (рис.1) была предложена структура, приведённая в таблице 1.
Таблица 1. Структура обучающей базы данных для многослойного персептрона
Такая база данных отличается сложностью построения и повышенными требованиями к вычислительным ресурсам компьютера. Причём при большом объёме исходных данных требуется значительное время на обучение системы (порядка 12 часов).
В качестве обучающей базы данных для модульной структуры нейронной сети (рис.2) можно использовать раздельное обучение каждого нейросетевого модуля, что требует создания нескольких баз данных для каждой патологии в отдельности (таблица 2).
Таблица 2. Обобщённая структура обучающих баз данных для модульной структуры нейросети
Такая база данных позволит обучать каждый нейросетевой модуль отдельно, что является более удобным с точки зрения распределения времени и менее требовательно к вычислительным ресурсам компьютера.
Для заполнения разработанных баз данных была использована открытая информационная система «PhysioNET», содержащая большое количество записей ЭКС больных и здоровых людей с аннотациями и диагнозами врачей-специалистов.
В дальнейшем предполагается проведение исследований различных типов нейронных сетей с целью выявления её наилучшей архитектуры и создания экспериментального нейросетевого анализатора ЭКС.
Созданную и обученную нейронную сеть предполагается использовать совместно с одноканальным регистратором ЭКС в бытовых системах автоматизированного анализа функционального состояния сердечно-сосудистой системы, а также при проведении массовых экспресс исследований для выделения «групп риска».
Источники
- Хайкин С. Нейронные сети: полный курс, 2e издание. : Пер. с анrл. - М. Издательский дом «Вильямс», 2006. - 1104 с. : ил., ISBN 5845908906
- Переверзев-Орлов В.С. Советчик специалиста. Опыт разработки партнерской системы // М.: Наука, 1990.- 133 с.
- Исаков Р.В., Лукьянова Ю.А., Сушкова Л.Т. Оптимизация структуры нейронных сетей для обработки электрокардиосигнала. // Биомедицинская радиоэлектроника, 2008 , №6, c.9-14
(c) Роман Исаков, Юлия Лукьянова
Для цитирования в научных публикациях:
Исаков Р.В., Лукьянова Ю.А. Построение обучающих баз данных для нейросетевого анализатора электрокардиографических данных . – Биомедицинская радиоэлектроника, 2009, №12, с. 34-38