© С.Д. Богомолов, С.В. Киселев, А.П. Медведев,
В.М. Назаров, 2003 г.
УДК 616.8—089
Поступила 11.11.2000 г.
С. Д. Богомолов, С. В. Киселев, А. П. Медведев, В. М. Назаров
Государственная медицинская академия, Нижний Новгород
Применение искусственных нейронных сетей для прогнозирования в хирургии
В последнее время сильно возрастает значение информационного обеспечения деятельности, в том числе медицинской. Это становится движущим фактором развития науки, что обусловливает разработку и внедрение разных информационных систем.
Разработка математических методов решения медико-биологических задач началась в XX веке — исследователи изобрели много способов проверки гипотез и выводов. В 60-е годы были разработаны методы анализа, общим признаком которых явилось наличие явных алгоритмов принятия решений. Наиболее популярные методы до сих пор активно используются в теоретической медицине, однако в клинической практике они не нашли широкого применения. Вопросы прогнозирования в хирургии, и в частности в кардиохирургии, получили развитие, благодаря работам А.Н.Амосова, В.И.Бураковского, Ю.Л.Шевченко, Н.Н.Шихвердиева [1, 2 и др.].
Многолетние исследования, проводимые с различными явными алгоритмами, показали, что медицинские задачи, имеющие неявный характер (а таких задач большинство), решаются явными методами с точностью и удобством, неприемлемыми для широкого практического использования в конкретных задач диагностики, прогнозирования и принятия решений.
Поиски и изучение неявных алгоритмов, позволяющих автоматически накапливать и затем использовать опыт при обучении, продолжаются уже более 100 лет. Однако первые серьезные попытки создания нейронных сетей были сделаны в 40—50-х гг., когда У.Маккалок и У.Питтс выдвинули основное положение теории работы головного мозга. В дальнейшем их идеи блестяще развил Ф.Розенблатт, который сформулировал принципы нейродинамики [3]. В связи с появлением относительно дешевой компьютерной техники произошла своего рода революция в мире вычислительной математики и кибернетики, приведшая к формированию новой науки — нейроинформатики. Неявные задачи медицины и биологии явились идеальным полем для применения нейросетевых технологий, и именно в этой области наблюдается наиболее яркий практический успех нейроинформационных методов.
Рассмотрим, что представляет собой искусственная нейронная сеть и каковы принципы ее функционирования. Нейронная сеть, которая является основой работы самообучающихся нейропрограмм, представляет собой совокупность «нейронов» — простых элементов, связанных между собой определенным образом. «Нейроны» и межнейронные связи задаются при помощи программирования на обычном компьютере. Структура взаимосвязей между «нейронами» в нейрокомпьютере или нейропрограмме аналогична таковой в биологических объектах. Искусственный «нейрон» имеет коммуникации с другими «нейронами» через «синапсы», передающие сигналы от других «нейронов» к данному («дендриты») или от данного «нейрона» к другим («аксон»). Несколько «нейронов», связанных между собой определенным образом, и образуют нейронную сеть.
Нейросеть, так же, как и мозг, ее биологический аналог, должна иметь каналы для связи с внешним миром. Одни каналы обеспечивают поступление информации из внешнего мира на нейросеть, другие выводят информацию из нейросети во внешней мир. Поэтому одни «нейроны» сети рассматриваются как входные, другие — как выходные. Часть «нейронов» может не сообщаться с внешним миром, а взаимодействовать с входными, выходными и такими же «нейронами».
Рис. 1. Формальный «нейрон»
|
|
На рис. 1 представлен «нейрон» с группой «синапсов». «Нейрон» состоит из двух функциональных блоков: входного сумматора и собственно «нейрона», или преобразователя. Функционирование «нейрона» происходит следующим образом. В текущий момент времени через входные «синапсы» (на рисунке их 3) на «нейрон» направляются сигналы от других «нейронов» и/или из внешнего мира.
Каждый «синапс» имеет параметр, называемый весом «синапса» и представляющий какое-либо число. Сигнал, проходящий через «синапс», умножается на вес этого «синапса». в зависимости от веса сигнал может быть усилен (модуль веса >1) или ослаблен (модуль веса <1) по амплитуде. Сигналы от всех «синапсов», ведущих к данному нейрону, принимает сумматор.
Сумматор производит суммирование всех пришедших сигналов и подает на преобразователь одно число — полученную сумму. Величина этого числа будет зависеть как от величин исходных сигналов, так и от весов «синапсов». «Нейрон», получивший это число, преобразует его согласно своей функции, в результате которой получается другое число, и отправляет его по «аксону» всем остальным «нейронам» через соответствующие «синапсы». Последующие «нейроны» производят с полученными сигналами такие же операции, лишь с тем различием, что, во-первых, веса их «синапсов» могут быть уже другими, во-вторых, другие «нейроны» могут иметь другой вид функции преобразования. Эта функция, называемая характеристической, имеет вид:
f(X)=X/(C+TXT),
где Х — сигнал, поступаемый с сумматора, С — константа, называемая характеристикой «нейрона». Экспериментальным путем получено, что оптимальный диапазон характеристики для решения подаляющего большинства задач составляет от 0,1 до 0,8 (рис. 2).
Рис. 2. График характеристической функции
|
|
Выбор функции такого вида обусловлен ее гладкостью, непрерывностью на всем диапазоне переменных значений Х, диапазон значений всегда ограничен.
В случае эмуляции нейросети на обычном компьютере все математические операции осуществляет программа. Таким образом, нейронная сеть, получающая на входе некоторый сигнал, способна после прохода его по «нейронам» выдавать на выходе определенный ответ, который зависит от весовых коэффициентов всех «нейронов» и от самого сигнала. Обучение нейронной сети происходит на обучающей выборке, состоящей из примеров, каждый из которых представляет собой типовую задачу с индивидуальным набором условий и конкретным ответом. Например, в качестве входных сигналов в примере могут использоваться формализованные определенным образом данные исследования одного больного (анамнез, жалобы, данные объективного обследования, дополнительных методов исследования), тогда заранее известным ответом в этом примере может быть либо диагноз, либо прогноз наступления какого-либо исхода, осложнения (естественно, для этого нужен катамнез). Несколько примеров с разными ответами образуют задачник, который располагается в базе данных. Каждая запись в базе данных является примером.
Не останавливаясь на математических алгоритмах, подробно описанных в работах А.Н.Горбаня и Д.А.Россиева [4—7], приведем общий обучающий алгоритм для нейросети: сначала из обучающей выборки берется пример, его входные параметры подаются на входные «синапсы» обучаемой нейросети. Затем нейросеть производит заданное количество тактов функционирования, при этом вектор входных сигналов распространяется по связям между «нейронами» (прямое функционирование). Измеряются сигналы, выданные теми «нейронами», которые считаются выходными. После этого производится интерпретация выданных сигналов и вычисляется оценка, характеризующая различие между выданным сетью ответом и требуемым ответом, имеющимся в примере. Если оценка примера равна нулю, ничего не предпринимается. В противном случае на основании оценки вычисляются поправочные коэффициенты для каждого синаптического веса матрицы связей, после чего производится подстройка синаптических весов (обратное функционирование). В коррекции весов синапсов и заключается обучение. В завершение осуществляется переход к следующему примеру задачника, и вышеперечисленные операции повторяются.
Итак, определим преимущества нейросетевых экспертных систем перед обычными.
Нейросети принимают решения на основе опыта, приобретаемого ими самостоятельно.
Решение, принимаемое нейросетью, не является категоричным. Сеть выдает решение вместе со степенью уверенности в нем, что оставляет пользователю возможность критически оценивать ее ответ.
Нейросеть позволяет моделировать ситуацию принятия решения.
Нейросети дают ответ очень быстро (доли секунды), что позволяет использовать их в различных динамических системах, требующих незамедлительного принятия решения, например при интраоперационном нейромониторинге.
Возможности нейросетей (коррекция классификационной модели, минимизация обучающих параметров и др.) позволяют определять направления научного поиска.
Очевидно, что все вышеизложенное доказывает необходимость, актуальность и востребованность использования искусственных нейронных сетей для решения медицинских задач. По нашему мнению, использование нейросетевых технологий открывает качественно иной уровень изучения процессов в такой стохастической системе, как человеческий организм. Особенно полезными нам кажутся возможности моделирования при ургентных состояниях, встречающихся в хирургической практике, (таких как черепно-мозговая травма, например), а также возможности прогнозирования, поскольку степень воздействия на организм при хирургических вмешательствах крайне высока, и было бы не лишним иметь инструмент, помогающий предвидеть течение событий после разных способов воздействия.
Учитывая это, мы стали применять нейросети для решения задач предикции при некоторых нозологических формах, лечение которых чаще бывает оперативным. Так, на кафедре неврологии, нейрохирургии и медицинской генетики НГМА в рамках изучения болевого синдрома в поясничной области было исследовано его течение у 295 больных остеохондрозом поясничного отдела позвоночника. Часть из них, в основном, пациенты неврологического отделения железнодорожной больницы на ст. Горький, лечилась консервативно (n=105); другая часть, пациенты нейрохирургического отделения ОКБ им. Н.А.Семашко, была прооперирована (n=190) в разные сроки.
В качестве входных сигналов были взяты: данные официального анамнеза (3 признака), субъективное описание больным своей боли (3 признака), объективные характеристики течения болевого феномена (2 признака), некоторые данные анамнеза, касающиеся развития болевого синдрома (2 признака), данные неврологического осмотра (10 признаков), информация о типе лечения (2 признака). В качестве выходного сигнала для одной нейросети был выбран 1 признак — показанность хирургического вмешательства; для другой — результат лечения, т.е. наличие или отсутствие боли в пояснице после проведенного лечения.
Опыты с первой нейросетью были начаты раньше, так как не требовали наличия собранного катамнеза. Была использована трехслойная сеть, количество «нейронов» составило 52. все работы производились на нейроимитаторах, разработанных красноярской научной группой «НейроКомп», объединяющей ученых-математиков и медиков (красноярский ВЦ СО РАН, КГТУ, КрасГМА). В процессе работы нейросеть обучалась плохо, что связано, видимо, с неадекватным количеством входных параметров, а также необъективностью и внутренней неоднородностью выходного сигнала.
Вторая нейросеть по структуре была идентична первой, поэтому ее ждали те же проблемы. Для исключения их был разработан специальный опросник для больного с поясничной болью, состоящий из 2 частей (заполняемой пациентом и врачом соответственно) и содержащий 136 опций. Одновременно был начат сбор катамнеза с тем, чтобы повысить объективность выходного параметра для обучения нейросети. В настоящее время отдаленные результаты прослежены у 32 пациентов со средним сроком после операции 38 мес. При сборе катамнеза акцент делался на динамику болевого синдрома, а для объективной оценки результатов лечения использовалась созданная нами экспертная система «Диск-эксперт 2.00», работающая с использованием жесткого алгоритма на основе теоремы Байеса. Несмотря на малое количество катамнестических наблюдений, была создана трехслойная нейросеть с числом «нейронов» — 138, которая была обучена и протестирована. Обучение прошло без каких —либо сложностей, однако специфичность и чувствительность (68 и 72% соответственно) кажутся нам недостаточно хорошими, поэтому мы планируем улучшить эти показатели, продолжив сбор катамнеза. Таким образом, данная нейросеть способна прогнозировать наличие или отсутствие болевого синдрома при поясничном остеохондрозе позвоночника после хирургического лечения, т.е. прогнозировать результат операции.
Нейросетевые технологии применяются и на кафедре госпитальной хирургии НГМА. Так, нейросеть была использована для прогнозирования исходов хирургического вмешательства и течения послеоперационного периода у больных, перенесших операцию протезирования клапанов сердца. Входными сигналами служили дооперационные и интраоперационные факторы. Из дооперационных показателей вводились следующие: вид порока, его длительность, клинико-функциональный класс по NYHA, кардиоторакальный индекс, индекс Мура, данные электрокардиограммы в формализованном виде, данные ультразвукового исследования сердца конечно-диастолический размер, фракция выброса левого желудочка, размеры полостей левого и правого предсердий, правого желудочка, степень стеноза/дилатации пораженного клапана, степень кальциноза), данные лабораторных исследований, учитывалась причина развития порока, степень активности процесса и срок госпитализации пациента до операции. В качестве интраоперационных факторов были введены данные о длительности искусственного кровообращения, времени пережатия аорты, применении гипотермии, объеме кардиоплегирующего раствора, о восстановлении сердечной деятельности, о виде операции, применяемом протезе клапана, его размере и о сроке пребывания в отделении реанимации после операции. В качестве выходных сигналов сети выступали следующие: «Без осложнений»; «Легкие осложнения»; «Более тяжелые осложнения, потребовавшие срока госпитализации после операции более 27 суток»; «Тяжелые осложнения, приведшие к летальному исходу»; «Летальный исход во время операции».
Была получена 5-слойная нейросеть с общим количеством «нейронов» — 130. в качестве обучающей выборки использовалась база данных о 187 пациентах, оперированных в Нижегородском кардиохирургическом центре в 1997—1998 гг. Чувствительность и специфичность при тестировании на 52 примерах составили 74 и 62% соответственно, что заставляет нас искать пути более достоверной формализации входных сигналов нейросети и корректнее выбирать выходные параметры. Наиболее значимыми сигналами для прогнозирования исходов протезирования клапанов сердца оказались: причина развития порока сердца, степень активности процесса, показатели ритма сердца, фракция выброса левого желудочка, степень кальциноза клапана, уровень ЦИК в крови, лейкоцитов крови, применение гипотермии во время операции, вид операции, характер восстановления сердечной деятельности и срок пребывания в отделении реанимации.
Литература
- Бураковский В. И., Лищук В. А., Стороженко И. Н. Клинико-математический подход к изучению острых расстройств кровообращения после операций на сердце. (Роль математического моделирования в изучении патологии кровообращения). В кн.: Применение математических моделей в клинике сердечно-сосудистой хирургии. М, 1980; с. 93—120.
- Шевченко Ю. Л., Шихвердиев Н. Н., Оточкин А. В. и др. Возможности прогнозирования исхода заболеваний при кардиохирургических вмешательствах. Вестн хир 1990; 9: 3—5.
- Розенблатт Ф. Принципы нейродинамики. Перцептроны и теория механизмов мозга. Под ред. С.М. Осовца М: Мир; 1965.
- Горбань А.Н., Россиев Д.А. Нейронные сети на персональном компьютере. Новосибирск: Наука; 1996.
- Горбань А.Н., Дунин-Барковский В.Л., Миркес Е.М. и др. Нейроинформатика. Новосибирск: Наука; 1998.
- Gordan A.N., Rossiev D.A., Gilev S.E. et al. Medical and physiological applications of MultiNeuron neural simulator. In: Proceedings of World Congress on Neural Networks-1995 (WCNN`95). V.1. Washington; 1995; p.170—175.
- Gordan A.N., Rossiev D.A., Gilev S.E. et al. «NeuroComp» group: neural-networks software and its application. Russian Academy of Sciences, Krasnoyarsk Computing Center. Preprint N8. Krasnoyarsk, 1995.
|