Возможности искусственного интеллекта в прогнозировании поражения коронарных артерий

Резюме

Цель - изучить возможность применения нейросетевого анализа для прогнозирования факта и степени поражения коронарного русла. В задачу исследования входило сравнение точности обученной модели нейронной сети на входных структурированных данных и ЭКГ-записей с заключением врача-кардиолога.

Материал и методы. 120 пациентов, которым была выполнена коронарография в плановом или экстренном порядке.

Ключевые критерии включения: пациенты мужского или женского пола старше 18 лет; результаты коронарографии; снятая за сутки и/или менее до коронарографии электрокардиографическая (ЭКГ) лента.

Ключевые критерии исключения: нарушения ритма на ЭКГ в виде фибрилляции предсердий, атриовентрикулярной (АВ) узловой и желудочковой тахикардии в момент записи; ранее проведенное стентирование и/или шунтирование коронарных артерий.

Для прогнозирования поражения коронарного русла использовался метод нейросетевого анализа. Машинное обучение проводили с включением клинических, лабораторных, инструментальных (ЭКГ-изображение) признаков (суммарно 23 показателя). Для решения задач классификации использована нейронная сеть, принимающая на вход структурированные данные и изображение и подающая на выходе мультифакторную характеристику магистральных коронарных артерий.

Соотношение в примерах обучение/тест составило 100/20. Использовался метод обучения "с учителем" на имеющихся данных, в которых были известны исходы (данные коронароангиографии), а параметры нейронной сети подстраивали так, чтобы минимизировать ошибку методом обратного распространения. Для данного эксперимента на основании тестовой выборки были созданы 20 задач. К каждой задаче было приложено ЭКГ-изображение.

5 врачей-кардиологов, ежедневно курирующих пациентов с острым коронарным синдромом, по отдельности, оценивали патологию коронарного русла по каждой магистральной коронарной артерии и прогнозировали необходимость выполнения реваскуляризации.

Результаты нейронной сети на тестовой выборке, состоящей из 20 пациентов: AUC score - 0,74, точность (accuracy) - 80%, прецизионная точность (precision) - 63%, полнота (recall) - 55%, f1 score (гармоническое среднее между точностью и полнотой) - 59%.

Средние показатели ответов врачей-кардиологов: accuracy - 76%, precision - 48%, recall - 55%, AUC score - 0,68, f1 score - 49%. Лучшие значения врачей-кардиологов: accuracy - 76%, precision - 48%, recall - 67%, AUC score - 0,72, f1 score - 56%.

Заключение. Нейросетевой анализ подготовленных клинических, лабораторных и инструментальных данных позволяет настроить параметры сети для последующего точного прогнозирования поражения коронарных артерий. Полученные результаты в виде оценки AUC score позволяют говорить о применимости метода в диагностике патологии коронарного русла. На тестовой выборке нейронная сеть работает эффективнее, чем врачи-кардиологи в среднем. Только один из пяти специалистов смог приблизиться к точности обученной модели нейронной сети.

Ключевые слова:коронарные артерии; нейронные сети; глубокое обучение

Финансирование. Исследование не имело спонсорской поддержки.

Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.

Для цитирования: Абдуалимов Т.П., Обрезан А.Г. Возможности искусственного интеллекта в прогнозировании поражения коронарных артерий // Кардиология: новости, мнения, обучение. 2022. Т. 10, № 1. С. 34-39. DOI: https://doi.org/10.33029/2309-1908-2022-10-1-34-39

Перспективное использование искусственного интеллекта (ИИ) и машинного обучения в кардиологии заключается в том, чтобы предоставить набор инструментов для повышения эффективности работы кардиолога. Внедрение в клиническую практику полигеномного секвенирования и потоковой передачи биометрических данных с мобильных устройств вскоре потребует от кардиологов интерпретации и практического применения информации из многих разрозненных областей биомедицины [1-4].

В то же время постоянно растущая нагрузка требует от врачей и систем здравоохранения более высокой операционной эффективности [5]. Пациенты тоже начинают требовать более быстрого и индивидуального подхода [6, 7]. Количество данных, с которыми приходится работать специалисту, все время увеличивается, требуется их более сложная интерпретация, ожидается повышение эффективности работы врачей.

Возможно, решить эту проблему поможет машинное обучение, которое улучшит каждый этап курации пациентов: от исследований и открытий до диагностики и выбора терапии. В результате клиническая практика станет более эффективной, удобной, персонализированной. Кроме того, в ближайшем будущем данные будут собираться не исключительно в медицинских учреждениях, а будут аккумулироваться из многочисленных систем регистрации медицинских параметров (носимые информационные устройства).

Благодаря использованию передового компьютерного оборудования, например графических процессоров (GPU) и модулей тензорной обработки (TPU), а также увеличению объема доступных данных для обучения алгоритмы на основе глубокого обучения постепенно превосходят предыдущие методы и набирают все большую популярность в исследованиях.

Помимо вычислительных мощностей, еще одним важным достижением, расширяющим возможности машинного обучения, стало получение и хранение данных. "Большие данные" - термин, используемый для описания все более крупных и сложных наборов данных, которые составляют основу моделей машинного обучения.

В наше время наблюдается рост доступности и использования больших объемов информации. Это стало возможно с появлением электронных медицинских карт, имплантируемых электронных устройств и современных носимых мониторов, причем каждый из них записывает беспрецедентно большие объемы биологических данных в каждую секунду [8].

С целью уточнения возможности эффективности применения искусственного интеллекта (ИИ) в оценке патологии коронарного русла нами проведено данное исследование.

Материал и методы

В исследовании приняли участие 120 пациентов, которым осуществлялась коронарография (КАГ) в плановом или экстренном порядке. Показания к КАГ верифицированы согласно рекомендациям Европейского общества кардиологов (ЕОК). Исследование выполнено в соответствии со стандартами надлежащей клинической практики (Good Clinical Practice) и принципами Хельсинкской декларации. Определены нижеследующие критерии включения и исключения.

Основные критерии включения: подписание до проведения исследования информированного согласия, в том числе на проведение статистической обработки данных истории болезни, возраст >18 лет, наличие показаний (плановых или экстренных) к выполнению КАГ, наличие документированной электрокардиографической (ЭКГ) записи (скорость 25 мм), выполненной за сутки и/или менее до КАГ.

Ключевые критерия исключения: нарушения ритма на ЭКГ в виде фибрилляции предсердий, атриовентрикулярной (АВ) узловой или желудочковой тахикардии в момент записи; ранее проведенное стентирование и/или шунтирование коронарных артерий (КА); наличие выраженных помех и артефактов на снятой ЭКГ, регистрация ЭКГ более 24 ч перед КАГ; любое хирургическое или медицинское состояние, которое, по мнению исследователя, могло бы значительно помешать работе алгоритма машинного обучения применительно к точности результатов.

Врач, проводящий исследование, анализировал данные медицинской карты (жалобы, анамнез, объективные, лабораторные и инструментальные данные) и вносил эти результаты в базу данных машинного обучения в бинарном формате.

На первом этапе сбора данных по каждому наблюдению структурированные параметры вносили в табличную форму, а также вводили изображения ЭКГ-записи в формате jpeg в базу данных.

Для обучения нейронных сетей использовали многочисленные морфометрические, объективные, лабораторные и инструментальные данные пациентов. Такими данными были возраст, пол, диагноз острый (ОКС) или хронический коронарный синдром (ХКС), патология сегмента ST на ЭКГ, наличие или отсутствие сопутствующей патологии (сахарного диабета, гипертонической болезни, ожирения, анемии, острого нарушения мозгового кровообращения, атеросклероза, аритмии, дислипидемии), отягощенная наследственность, наличие вредных привычек (курение, злоупотребление алкоголем), присутствие стрессовых факторов, низкая физическая активность, менопауза, повышенное питание.

Вышеописанные факторы фиксировались в структурированном бинарном виде (0, 1) в табличном формате. Регистрация ЭКГ проводилась с использованием одного вида аппарата, запись передавали оператору машинного обучения в электронном виде в формате jpeg. Таким образом, для выработки алгоритма обучения нейронной сети суммарно были использованы 22 параметра (ключевые признаки).

Нейронная есть обучалась на данных, полученных при анализе коронарограмм. В качестве таргетных значений взяты наличие атеросклероза КА, стеноз или субокклюзия ствола левой КА, окклюзия, субокклюзия или стеноз передней межжелудочковой артерии, окклюзия, субокклюзия или стеноз огибающей артерии, окклюзия, субокклюзия или стеноз правой КА, выполненное стентирование или рекомендованное аортокоронарное шунтирование (АКШ) по результатам КАГ. Значения стеноза КА были внесены в таблицу в цифровом виде в процентах, далее переведены в бинарный вид (1 - стеноз >50%), остальные показатели заполнялись в бинарном виде по наличию или отсутствию поражения. Вышеописанные таргетные значения предсказывал обученный алгоритм машинного обучения.

Алгоритму необходимо было решить задачу классифицирования поражений КА, спрогнозировать отсутствие или наличие стенозов и их выраженность. Для классификации поражений КА по системе "0;1" использована нейронная сеть, принимающая на вход структурированные данные и изображение, на выходе получена мультифакторная классификация КА. Соотношение в примерах на обучение и тест составило 100/20. Прогнозирование и оценка результатов проведены на тестовой выборке.

Пациенты в тестовой выборке были с нетипичной клинической картиной и сложной патологией КА. Данное условие взято специально для проверки работы алгоритма в условиях реальной клинической практики.

В качестве программного обеспечения для построения архитектуры нейронной сети использованы наборы библиотек для языка программирования Python (pandas - для работы с табличными данными; tensorflow - для конструирования нейронных сетей и их обучения). Использовался метод "обучения с учителем" на имеющихся данных, в которых были известны исходы, а параметры нейронной сети подстраивали так, чтобы минимизировать ошибку.

Проводился анализ структурированных табличных данных обучающей выборки, состоящей из 100 пациентов (табл. 1).

Таблица 1. Анализ структурированных табличных данных обучающей выборки, состоящей из 100 пациентов

Красным отмечены прогнозируемые при помощи нейросетевого анализа параметры.

Средний возраст пациентов составил 64 года, от 31 года до 89 лет. Распределение по полу - 52 мужчины, 48 женщин. Медианное значение возраста мужчин меньше, чем у женщин. У 62 из 100 человек верифицирован ОКС. У 19 пациентов с ОКС диагностирован подъем сегмента ST. У 53 пациентов из 62 с ОКС определялись типичные ангинозные боли.

В задачу исследования входило сравнение точности обученной модели нейронной сети на входных структурированных данных и ЭКГ-записей врачей-кардиологов.

Для данного эксперимента на основании тестовой выборки были созданы 20 задач. К каждой задаче было приложено ЭКГ-изображение. 5 врачей-кардиологов, ежедневно курирующих пациентов с ОКС, по отдельности прогнозировали необходимость выполнения реваскуляризации и оценивали патологию коронарного русла по каждой магистральной КА.

Полученные данные загружали в таблицу. Проведено сравнение с правильными ответами по данным инвазивной КАГ. За основной метод расчета ошибки был взят AUC score.

Результаты

На вход нейронной сети одновременно поступали ЭКГ-изображения размером (200x200x1) и структурированные табличные данные. На выходе нейронная сеть прогнозировала мультиуровневые значения пораженных коронарных значений в вероятностном виде.

В качестве слоев нейронной сети для обработки изображений были взяты полносвязные, сверточные, батч-нормализирующие (слой пакетной нормализации), dropout (слой исключения). Для обработки структурированных данных взяты только полносвязные слои. Внутри нейронной сети использовался связывающий объединяющий слой (concatenate layer) для обобщения весов изображения и датасета. После обобщающего слоя - 2 полносвязных слоя. Выходной слой состоит из 13 нейронов для предсказаний по каждому параметру. В качестве оптимизатора взят Adam (алгоритм оптимизации адаптивной скорости обучения путем вычисления экспоненциального скользящего среднего градиента и квадратичного градиента), лосс-функция - бинарная кросс-энтропия. Обучение производили на 100 эпохах (1 эпоха - 1 прямой проход и 1 обратный проход всех обучающих примеров). Размер батча (количества обучающих примеров за одну итерацию) - 8, размер валидационной выборки 0.1. Подбор параметров и структуры нейронной сети проведен опытным путем. В качестве отправной метрики для оценки качества модели выбрана AUC (площадь под ROC-кривой).

На тестовой выборке, состоящей из 20 пациентов, результат нейронной сети составил: AUC score - 0,74, точность (accuracy) - 80%, прецизионная точность (precision) - 63%, полнота (recall) - 55%, f1 score - 59%.

Средние показатели ответов врачей-кардиологов: accuracy - 76%, precision - 48%, recall - 55%, AUC score -0,68, f1 score - 49%. Лучшие значения среди врачей-кардиологов: AUC score - 0,72, accuracy - 76%, precision - 48%, recall - 67%, f1 score - 56% (табл. 2).

Таблица 2. Результат нейронной сети

Обсуждение

В проведенном исследовании использовали относительно небольшое количество данных: 22 признака, ЭКГ-изображения, полученные у 120 больных. В связи с этим была построена архитектура нейронной сети с небольшим количеством параметров.

Результат многуровневой классификации предполагаемых поражений по каждой магистральной КА выбранной архитектурой нейронной сети показал хорошее качество модели (AUC=0,74). Созданная модель нейросетевого анализа позволяет с достаточно высокой вероятностью прогнозировать поражение магистральных КА.

Ежегодно благодаря трудам исследователей появляется большое количество моделей для оценки сердечно-сосудистого риска. Большинство моделей основаны на данных рандомизированных клинических и регистровых исследований. Однако только небольшая часть моделей используется в реальной клинической практике. Очевидно, что вместо создания очередной нежизнеспособной модели необходим качественно иной подход. В проведенном исследовании использовали относительно небольшое количество данных: 22 признака, ЭКГ-изображения, полученные у 130 лиц. В связи с этими была построена архитектура нейронной сети с небольшим количеством параметров.

Нейронные сети видят закономерности, не доступные человеку. Внедрение ИИ в медицинскую диагностику ведется уже давно.

Полученные результаты позволяют говорить о возможном практическом применении метода нейросетевого анализа в клинической практике. Важным дополнительным преимуществом нейросетевого анализа данных является тот факт, что при курации ХКС у кардиологов нет надежных инструментов для несомненного направления на КАГ. В этих условиях ИИ позволяет верно интерпретировать совокупность данных и нацелить врача на выполнение интервенционной технологии. Также особо стоит отметить, что у пациентов старческого возраста вне симптомов, с ограниченными возможностями выполнения стресс-тестирования по факту ХКС методика глубокого машинного обучения дает неоценимую перспективу своевременного направления больного на КАГ.

Заключение

Нейросетевой анализ подготовленных клинических, лабораторных и инструментальных данных позволяет настроить параметры сети для последующего прогнозирования поражения магистральных КА. Обученная нами нейронная сеть прогнозирует поражение магистральных КА с чувствительностью 63%, специфичностью - 88%, AUC - 0,74. Полученные результаты в виде оценки AUC score позволяют говорить о работоспособности метода при диагностике патологии магистральных КА. На тестовой выборке нейронная сеть работает эффективнее, чем в среднем врачи-кардиологи, и, что особенно важно, позволяет нацелить врача на выполнение инвазивных методов обследования в тех случаях, когда для этого решения недостаточно вводных данных. Только 1 из 5 специалистов смог приблизиться к точности обученной модели нейронной сети.

Литература/References

1. Kuo F.C., Mar B.G., Lindsley R.C., Lindeman N.I. The relative utilities of genome-wide, gene panel, and individual gene sequencing in clinical practice. Blood. 2017; 130: 433-9.

2. Muse E.D., Barrett P.M., Steinhubl S.R., Topol E.J. Towards a smart medical home. Lancet. 2017; 389: 358.

3. Steinhubl S.R., Muse E.D., Topol E.J. The emerging field of mobile health. Sci Transl Med. 2015; 7: 283rv3.

4. Shameer K., Badgeley M.A., Miotto R., Glicksberg B.S., Morgan J.W., Dudley J.T. Translational bioinformatics in the era of real-time biomedical, health care and wellness data streams. Brief Bioinform 2017; 18: 105-24.

5. Konstam M.A., Hill J.A., Kovacs R.J., et al. The academic medical system: reinvention to survive the revolution in health care. J Am Coll Cardiol. 2017; 69: 1305-12.

6. Steinhubl S.R., Topol E.J. Moving from digitalization to digitization in cardiovascular care: why is it important, and what could it mean for patients and providers? J Am Coll Cardiol. 2015; 66: 1489-96.

7. Boeldt D.L., Wineinger N.E., Waalen J., et al. How consumers and physicians view new medical technology: comparative survey. J Med Internet Res. 2015; 17: e215.

8. Wasserlauf J., You C., Patel R., et al. Smartwatch performance for the detection and quantification of atrial fibrillation. Circ Arrhythm Electrophysiol. 2019; 12: e006834.

Материалы данного сайта распространяются на условиях лицензии Creative Commons Attribution 4.0 International License («Атрибуция - Всемирная»)

ГЛАВНЫЙ РЕДАКТОР
ГЛАВНЫЙ РЕДАКТОР
Обрезан Андрей Григорьевич
Доктор медицинских наук, профессор, заведующий кафедрой госпитальной терапии медицинского факультета Санкт-Петербургского государственного университета, главный врач группы клиник «СОГАЗ МЕДИЦИНА», Санкт-Петербург, Российская Федерация

Журналы «ГЭОТАР-Медиа»