Mathematical methods in machine learning for predicting response to treatment in patients with severe bullous dermatoses

Cover Page


Cite item

Full Text

Open Access Open Access
Restricted Access Access granted
Restricted Access Subscription or Fee Access

Abstract

BACKGROUND: Machine learning is widely used in medicine, specifically dermatology, to predict response to treatment and disease severity and activity. Until recently, these assessments in patients with bullous dermatoses were primarily performed by direct immunofluorescence image analysis, and machine learning was not used to integrate the findings of genetic and immunological tests.

AIM: This study aimed to create a model for predicting resistance to systemic glucocorticoids in patients with bullous dermatoses and classify the patients as steroid-resistant or steroid-sensitive based on genomic (HLA-DRB1, HLA-DQB1, glucocorticoid receptor [GR] A3669G β isoform, expression of α/β isoforms) and non-genomic (cytokines, chemokines, granulysin) data using machine learning.

METHODS: The study included 150 patients with bullous dermatoses and 92 donors for genetic testing, as well as 67 patients and 43 donors for cytokine/chemokine and granulysin tests. The following methods were used: logistic regression, support vector machine, decision tree, random forest, gradient boosting, and ROC analysis.

RESULTS: Logistic regression showed the highest accuracy (Recall 1, Precision 0.938, ROC-AUC 0.992). GRα isoform expression above 36.7 U was associated with the risk of bullous dermatosis of >50% (odds ratio: 1.116). The support vector machine identified significant HLA alleles and the A3669G polymorphism. The random forest and CatBoost confirmed the prognostic value of IL-15, IL-4, CXCL8, and granulysin in predicting resistance (ROC-AUC up to 0.879).

CONCLUSION: The formula based on GRα isoform expression accurately stratifies patients based on their risk of bullous dermatosis. Machine learning methods classify patients by resistance to systemic glucocorticoids based on the major histocompatibility complex (HLA) and immunological markers. Blister fluid analysis is a promising tool for early prediction of response to treatment and personalized therapy.

Full Text

Обоснование

Использование методов машинного обучения в медицине набирает обороты и используется для выполнения широкого круга задач, в частности для прогнозирования ответа больных на терапию, а также тяжести течения множества различных заболеваний, включая дерматологические. Доступ к большим наборам данных (например, электронные медицинские карты, базы изображений, омиксные данные) позволил улучшить алгоритмы машинного обучения [1].

Исследователи идентифицировали пять областей применения искусственного интеллекта в дерматологии: классификация заболеваний с использованием изображений клинической картины пациента; или дерматопатологических снимков; оценка кожных высыпаний с помощью мобильных приложений; совершенствование крупных эпидемиологических исследований; персонализированная терапия [1].

Основные методы машинного обучения можно разделить на следующие категории: supervised learning (обучение с учителем), unsupervised learning (обучение без учителя) и reinforcement learning (обучение с подкреплением). К первой категории, например, может относиться классификация пигментных новообразований на злокачественные и доброкачественные соответственно, которые на сегодняшний день исследованы достаточно хорошо [1, 2]. Так, данный алгоритм вначале обучался на размеченных изображениях меланомы и доброкачественных пигментных новообразований, после чего компьютер обобщал полученную информацию на новом наборе изображений кожи. Вторая категория подразумевает наличие только входных неразмеченных данных, что позволяет выявлять неизвестные кластеры и аномалии в данных. Обучение с подкреплением представляет собой отдельную категорию машинного обучения, основанную на взаимодействии с окружающей средой посредством методов проб и ошибок: примером является алгоритм программы AlphaGo, включающий в себя нейросети, алгоритм Monte Carlo Tree Search, обучение с подкреплением и глубокое обучение [3].

Кроме того, были адаптированы алгоритмы для диагностики псориаза, акне и дерматитов с помощью свёрточных нейронных сетей, которые непосредственно работают с фотографиями различных высыпаний на коже и могут распознавать края и текстуру изображений [4]. Проводимые исследования использовали публичные датасеты, такие как ISIC, DermNet NZ, ImageNet, а также данные из университетов, однако проблема дублирования и качества изображений в наборах данных приводила к смещению и переоценке производительности моделей [4].

В дерматологии чаще всего используются методы статистического обучения, в часγmтности линейная регрессия, логистическая регрессия, метод k-ближайших соседей (k-Nearest Neighbors, k-NN), метод опорных векторов (Support Vector Machine, SVM), случайный лес (Random Forest, RF) и обработка естественного языка (Natural Language Processing, NLP). Так, например, метод k-соседей применяется для классификации и регрессии данных, основываясь на анализе ближайших k-соседей, с использованием альтернативных правил голосования для повышения точности классификации, как описано в исследовании D. Coomans и соавт. [5]. SVM использует данные для различных классификаций, находя гиперплоскость, которая разделяет группы согласно определённым признакам [6]. Случайный лес генерирует сеть случайных деревьев решений для того, чтобы определить наиболее распространённый результат среди всех случайно сгенерированных деревьев решений [7]. Обработка естественного языка анализирует большие объёмы текста с целью выявления схожих признаков [8].

Акантолитическая пузырчатка и буллёзный пемфигоид входят в группу аутоиммунных буллёзных дерматозов, в основе патогенеза которых лежит образование аутоантител к структурам кожи, что приводит к появлению пузырей [9, 10]. Синдром Стивенса–Джонсона / токсический эпидермальный некролиз представляют собой тяжёлые лекарственно-индуцированные заболевания кожи, при которых поражаются кожа и слизистые оболочки глаз, носовой и ротовой полости, а также половых органов [11]. Препаратами первой линии для лечения буллёзных дерматозов являются системные глюкокортикоиды, однако у части больных может развиться резистентность к данным препаратам, обусловленная как геномными, так и негеномными механизмами, что оказывает влияние на тактику ведения таких пациентов [12–14]. Несмотря на незначительную распространённость, акантолитическая пузырчатка, буллёзный пемфигоид, синдром Стивенса–Джонсона / токсический эпидермальный некролиз являются трудно диагностируемыми и жизнеугрожающими заболеваниями, приводящими к ранней инвалидизации, в связи с чем ранее выявление, а также правильный выбор тактики лечения являются важной задачей врача-дерматовенеролога, в решении которой могут быть применены и алгоритмы машинного обучения.

Цель исследования ― оценить прогностическую модель для предсказания резистентности к системным глюкокортикоидам у больных буллёзными дерматозами, а также систему разделения больных буллёзными дерматозами на стероидрезистентных и стероидчувствительных на основании полученных лабораторных данных по геномным [HLA-DRB1, DQB1, полиморфизм A3669G β-изоформы ГР (глюкокортикоидный рецептор), экспрессия α- и β-изоформ ГР] и негеномным (цитокиновый и хемокиновый профили, гранулизин) механизмам, используя методы машинного обучения, для повышения точности ранней диагностики данных заболеваний и, следовательно, своевременного назначения персонализированной терапии с использованием иммуносупрессивных, цитостатических и биологических препаратов.

Методы

Дизайн исследования

Выполнено одномоментное неконтролируемое многоцентровое исследование. Исследование выполнено в три этапа.

На первом этапе проводился отбор больных с диагнозами акантолитической пузырчатки, буллёзного пемфигоида, синдрома Стивенса–Джонсона / токсического эпидермального некролиза. Диагноз устанавливался на основании жалоб пациентов, данных анамнеза, клинической картины, гистологического, иммуногистохимического методов исследования, иммуноферментного анализа, реакций прямой и непрямой иммунофлюоресценции. Больные акантолитической пузырчаткой и буллёзным пемфигоидом проходили обследование и лечение в Клинике кожных и венерических болезней имени В.А. Рахманова ФГАОУ ВО «Первый Московский государственный медицинский университет имени И.М. Сеченова» Минздрава России (Сеченовский Университет) [далее ФГАОУ ВО Первый МГМУ им. И.М. Сеченова Минздрава России (Сеченовский Университет)], больные синдромом Стивенса–Джонсона / токсическим эпидермальным некролизом ― в городской клинической больнице № 24 Департамента здравоохранения города Москвы.

Анализ крови здоровых доноров проводился в Центре крови ФГАОУ ВО Первый МГМУ им. И.М. Сеченова Минздрава России (Сеченовский Университет). Всего в исследовании принимали участие 92 здоровых донора с отсутствием тяжёлых сопутствующих заболеваний (например, онкологии, сердечно-сосудистых заболеваний, диабета, заболеваний печени и почек). Донор не должен был иметь активных инфекционных заболеваний (например, гриппа, острой респираторной вирусной инфекции и т.д.), а также принимать определённые лекарственные средства (например, антибиотики, противовирусные средства, вакцины) за месяц до анализа крови.

Анализ образцов сыворотки и пузырной жидкости проводился на кафедре молекулярной фармакологии и радиобиологии имени П.В. Сергеевича в ФГАОУ ВО «Российский национальный исследовательский медицинский университет имени Н.И. Пирогова» Минздрава России.

У всех больных проводился забор крови из кубитальной вены в активную фазу (до начала лечения) и ремиссию заболевания. Все больные акантолитической пузырчаткой получали начальную дозу системного глюкокортикоида 80–100 мг/сут с последующим медленным снижением до достижения поддерживающей дозы 10 мг/сут [15]. Больным буллёзным пемфигоидом назначали по 40–60 мг/сут системного глюкокортикоида. Дозировку снижали медленно, по 10 мг в неделю, до достижения 20 мг/сут, которую больные получали в течение месяца, после чего дозу снижали на 1/4 таблетки с еженедельным увеличением кратности снижения препарата [16]. Больные синдромом Стивенса–Джонсона / токсическим эпидермальным некролизом получали пульс-терапию метилпреднизолоном в дозе 1000 мг внутривенно 1 раз в день в течение 3 дней, а также внутривенное введение раствора калия, натрия и магния хлорида (400,0 мл), на курс 5–10 вливаний [17].

Второй этап состоял из лабораторной части, которая включала взятие сыворотки с целью проведения полимеразной цепной реакции в режиме реального времени для HLA-типирования, оценки частоты встречаемости HLA-DRB1 и HLA-DQB1 аллелей I и II класса на уровне высокого и низкого разрешения у больных буллёзными дерматозами; у больных акантолитической пузырчаткой, буллёзным пемфигоидом и синдромом Стивенса–Джонсона / токсическим эпидермальным некролизом с помощью иммуноферментного анализа оценивали экспрессию α- и β-изоформ ГР; содержание цитокинов, в частности фактора некроза опухоли-α (tumor necrosis factor-alpha TNF-α), интерлейкинов (interleukin, IL) 15, 10 и 4, хемокинов CCL11, CXCL8 и гранулизина в сыворотке и пузырной жидкости.

На третьем этапе исследования проводили статистическую обработку полученных данных с применением корреляционного анализа, а также методов машинного обучения с целью прогнозирования у больных тяжёлыми буллёзными дерматозами возможного развития неадекватного ответа на терапию системными глюкокортикоидами (рис. 1, схема 1).

 

Рис. 1. Дизайн исследования. АП ― акантолитическая пузырчатка; БП ― буллёзный пемфигоид; ССД/ТЭН ― синдром Стивенса–Джонсона / токсический эпидермальный некролиз; ПЦР ― полимеразная цепная реакция; ИФА ― иммуноферментный анализ; СР(+)/СР(-) ― наличие/отсутствие стероидной резистентности.

Fig. 1. Study design. АП, acantholytic pemphigus; БП, bullous pemphigoid; ССД/ТЭН, Stevens-Johnson syndrome / toxic epidermal necrolysis; ПЦР, polymerase chain reaction; ELISA, enzyme immunoassay; CP(+)/CP(-), the presence/absence of steroid resistance.

 

В группу по оценке распространённости HLA-DRB1 и HLA-DQB1 аллелей, экспрессии α- и β-изоформ ГР, а также полиморфизма A3669G β-изоформы ГР входило 150 больных буллёзными дерматозами, из них 107 (71,3%) больных акантолитической пузырчаткой [86 (57,3%) ― вульгарной пузырчаткой, 13 (8,67%) ― листовидной пузырчаткой, 6 (4%) ― паранеопластической пузырчаткой, 2 (1,4%) ― вегетирующей пузырчаткой]; 29 (19,3%) ― буллёзным пемфигоидом; 14 (9,33%) ― синдромом Стивенса–Джонсона / токсическим эпидермальным некролизом (группа тяжёлых буллёзных аллергических реакций). В группу контроля вошли 92 здоровых донора (рис. 2).

 

Рис. 2. Распределение больных буллёзными дерматозами по диагнозам. ВП ― вульгарная пузырчатка; ВегП ― вегетирующая пузырчатка; ЛП ― листовидная пузырчатка; ПНП ― паранеопластическая пузырчатка; БП ― буллёзный пемфигоид; ССД/ТЭН ― синдром Стивенса–Джонсона / токсический эпидермальный некролиз.

Fig. 2. Distribution of patients with bullous dermatoses by diagnosis. ВП, vulgar pemphigus; ВегП, vegetative pemphigus; ЛП, leaf-shaped pemphigus; ПНП, paraneoplastic pemphigus; БП, bullous pemphigoid; ССД/ТЭН, Stevens-Johnson syndrome / toxic epidermal necrolysis.

 

В группу, в которой оценивалось содержание цитокинового и хемокинового профиля в сыворотке и пузырной жидкости, а именно TNF-α, IL-15, IL-10, IL-4, CXCL8, CCL11 и гранулизина, было включено 67 больных буллёзными дерматозами, из них 43 больных акантолитической пузырчаткой, 11 ― буллёзным пемфигоидом, 13 ― синдромом Стивенса–Джонсона / токсическим эпидермальным некролизом, а также 43 здоровых донора. Данное распределение было связано с тем, что на момент включения в исследование не у всех пациентов на коже наблюдались свежие пузыри (см. рис. 1, схема 2).

Для всех без исключения диагнозов характерным было преобладание пациентов женского пола, что в свою очередь может указывать на бóльшую уязвимость женщин в случае заболевания буллёзными дерматозами. Так, все пациенты с паранеопластической пузырчаткой были женского пола (n=6), при этом в группе больных листовидной пузырчаткой соотношение мужчин и женщин было практически одинаковым (рис. 3).

 

Рис. 3. Распределение пациентов с буллёзными дерматозами и группы здоровых добровольцев по полу (столбчатая диаграмма). ВП ― вульгарная пузырчатка; ЛП ― листовидная пузырчатка; ПНП ― паранеопластическая пузырчатка; ВегП ― вегетирующая пузырчатка; БП ― буллёзный пемфигоид; ССД/ТЭН ― синдром Стивенса–Джонсона / токсический эпидермальный некролиз.

Fig. 3. Distribution of patients with bullous dermatoses and groups of healthy volunteers by gender (bar chart). ВП, vulgar pemphigus; ЛП, leaf-shaped pemphigus; ПНП, paraneoplastic pemphigus; ВегП, vegetative pemphigus; БП, bullous pemphigoid; ССД/ТЭН, Stevens-Johnson syndrome / toxic epidermal necrolysis.

 

Средний возраст больных буллёзным пемфигоидом и паранеопластической пузырчаткой составил 60 лет и 63,5 года соответственно. Для группы листовидной пузырчатки было характерно бимодальное распределение возраста пациентов в двух интервалах ― 30–44 и 58–72 года. Средний возраст больных вульгарной пузырчаткой составил 53 года. Наибольший возрастной размах наблюдался у больных синдромом Стивенса–Джонсона / токсическим эпидермальным некролизом: возраст самого молодого пациента в этой группе составил 19 лет, наиболее пожилого ― 92 года. Возраст всех пациентов составил в среднем 53,66 года (рис. 4).

 

Рис. 4. Распределение пациентов с буллёзными дерматозами и группы здоровых добровольцев по возрасту (скрипичная диаграмма). ССД/ТЭН ― синдром Стивенса–Джонсона / токсический эпидермальный некролиз.

Fig. 4. Distribution of patients with bullous dermatoses and groups of healthy volunteers by age (violin diagram). ССД/ТЭН, Stevens-Johnson syndrome / toxic epidermal necrolysis.

 

Критерии соответствия

Критерии включения пациентов в исследование: наличие письменного информированного согласия пациента на участие в исследовании; мужчины и женщины старше 18 лет; подтверждённые гистологически и иммуногистохимически, а также на основании клинической картины диагнозы акантолитической пузырчатки, буллёзного пемфигоида, синдрома Стивенса–Джонсона / токсического эпидермального некролиза; наличие свежих пузырей на коже (не более 1–3 дней); соответствие больных критериям стероидной резистентности [18].

Критерии включения здоровых добровольцев в исследование: мужчины и женщины старше 18 лет; отсутствие хронических или острых заболеваний, включая аутоиммунные заболевания, онкологические процессы, сердечно-сосудистые события (ишемическая болезнь сердца, инфаркт миокарда и т.д.), хронические заболевания печени (цирроз, гепатит) и почек (хроническая почечная недостаточность), а таже инфекционные процессы [острая респираторная вирусная инфекция, вирус иммунодефицита человека (ВИЧ), туберкулёз, гепатиты B, C и т.д.]; отсутствие приёма системных антибиотиков, антимикотиков, противовирусных препаратов, а также иммуносупрессоров, иммуномодуляторов, цитостатиков и вакцин за месяц до забора крови; подписанное здоровым добровольцем информированное согласие на участие в исследовании и забор крови.

Критерии невключения пациентов в исследование: возраст младше 18 лет; пациенты, которые по какой-либо причине не смогли завершить участие в исследовании (отсутствие комплаенса, невозможность получения достаточного количества пузырной жидкости и/или сыворотки); несоответствие диагнозу (например, выявление ошибочного диагноза после включения больного в исследование при повторной верификации диагноза с помощью гистологии, иммуногистохимии, а также реакции прямой/непрямой иммунофлюоресценции); приём антибиотиков, противовирусных, иммуносупрессивных, иммуномодулирующих препаратов, а также вакцин на момент забора крови в активную стадию заболевания согласно критериям D.F. Murrell и соавт. (2008) [18].

Критерии невключения здоровых доноров в исследование: возраст младше 18 лет; наличие каких-либо дерматологических заболеваний, которые могли бы исказить результаты исследования, а также аутоиммунных, эндокринных, онкологических заболеваний, сердечно-сосудистых событий, инфекций (острая респираторная вирусная инфекция, ВИЧ, гепатиты B, C, туберкулёз); приём антибиотиков, антимикотиков, противовирусных препаратов, иммуносупрессивных или иммуномодулирующих средств, а также вакцин в течение 4 последних недель; непредоставление информированного согласия на участие в исследовании и забора сыворотки; беременность и лактация.

Критерии исключения для основной и контрольной группы: желание пациента или здорового добровольца прекратить участие в исследовании после первоначального включения; невозможность получения достаточного объёма сыворотки и/или пузырной жидкости после включения в исследование (из-за технических трудностей или недостаточного объёма пузырной жидкости); развитие интеркуррентных состояний, которые могут повлиять на концентрацию цитокинов и хемокинов (например, инфекция, в том числе острая респираторная вирусная; сердечно-сосудистые события, например инфаркт миокарда).

Критерии стероидной резистентности для больных акантолитической пузырчаткой и буллёзным пемфигоидом

Наличие стероидной резистентности у больных акантолитической пузырчаткой оценивалось с помощью консенсуса D.F. Murrell и соавт. [18], согласно которому она характеризовалась появлением новых высыпаний, продолжением увеличения старых элементов или отсутствием заживления старых высыпаний, несмотря на трёхнедельную монотерапию преднизолоном в дозе 0,75–1,5 мг/кг в день или в сочетании со следующими препаратами:

  • циклофосфамид в дозе 2 мг/кг в день в течение 12 недель;
  • азатиоприн в дозе 2,5 мг/кг в день в течение 12 недель;
  • метотрексат в дозе 20 мг в неделю в течение 12 недель;
  • или микофенолата мофетил в дозе 3 г в день в течение 12 недель.

В проводимом исследовании стероидная резистентность чаще всего встречалась в группе вульгарной пузырчатки ― у 30/86 пациентов, реже ― у больных листовидной пузырчаткой, буллёзным пемфигоидом и синдромом Стивенса–Джонсона / токсическим эпидермальным некролизом. Так, в группе листовидной пузырчатки только 2/13 больных были стероидрезистентными; в группах буллёзного пемфигоида и синдрома Стивенса–Джонсона / токсического эпидермального некролиза стероидная резистентность отмечалась у 3/29 и 1/14 больных соответственно (рис. 5).

 

Рис. 5. Распространённость стероидной резистентности у пациентов в зависимости от установленного диагноза. ССД/ТЭН ― синдром Стивенса–Джонсона / токсический эпидермальный некролиз; БП ― буллёзный пемфигоид; ВегП ― вегетирующая пузырчатка; ПНП ― паранеопластическая пузырчатка; ЛП ― листовидная пузырчатка; ВП ― вульгарная пузырчатка.

Fig. 5. Prevalence of steroid resistance in patients depending on the established diagnosis. ССД/ТЭН, Stevens-Johnson syndrome / toxic epidermal necrolysis; БП, bullous pemphigoid; ВегП, vegetative pemphigus; ПНП, paraneoplastic pemphigus; ЛП, leaf-shaped pemphigus; ВП, vulgar pemphigus.

 

Математические основы применяемых в исследовании методов машинного обучения

Основные концепции машинного обучения

Модель ― это математическая функция fθ, которая отображает входные данные X в предсказания Ŷ:

fθ: X  Y^.

Компоненты модели включают:

XRp ― признаковое пространство (например, медицинские показатели);

Ŷ ― пространство ответов (для бинарной классификации Y={0,1});

θRd ― вектор параметров модели.

Пример линейной модели:

fθx= θ0+j=1pθjxj.

Обучение моделей представляет собой поиск параметров θ*, минимизирующих функцию потерь L(θ;D):

θ*=argminθLθ;D.

Функция потерь ― функция L(θ;D), оценивающая ошибку предсказания:

Lθ;D= 1ni=1nlfθxi,yi+ λRθ,

где l ― функция потерь для единичного примера;

R(θ) ― регуляризатор (например: ||θ22||);

λ ― коэффициент регуляризации.

Обучающая выборка:

D=xi,yii=1n,

где xiRp ― вектор признаков i-го пациента;

yiY ― целевая переменная.

Используемые алгоритмы для машинного обучения

Логистическая регрессия

Логистическая регрессия представляет собой статистический метод классификации, используемый для предсказания вероятности принадлежности объекта к определённому классу. Несмотря на название «регрессия», данный метод относится к бинарной или многоклассовой классификации. Кроме того, он моделирует вероятность P(y=1|x) с помощью логистической (сигмоидной) функции:

PY=1|x=σz=11+ez,

где z=ω0+ω1x1+ω2x2+...+ωnxn ― линейная комбинация признаков;

ω ― вектор параметров (веса) модели;

σ(z) ― сигмоидная функция, преобразующая z в диапазон [0, 1].

Для отнесения объекта (пациента) к соответствующему классу на основе полученной оценки вероятности применяют решающее правило:

  • если P(Y=1|x) ≥0,5, объект относится к классу 1;
  • если P(Y=1|x) <0,5, объект относится к классу 0.

Для обучения модели используется логистическая функция потерь (кросс-энтропия):

Lw= 1Ni=1nyilogPyi=1|xi+1yilog1Pyi=1|xi .

Во время обучения обновление веса ω для минимизации функции потерь происходит за счёт градиентного спуска:

ωj := ωj α Lωj.

Полученные коэффициенты логистической регрессии интерпретируются через отношение шансов (odds ratio, OR). Отношение шансов показывает, во сколько раз изменяются шансы наступления события (y=1) при изменении признака xj на 1 единицу.

Шансы (Odds) для логистической регрессии:

Odds = P(y=1|x)1 P(y=1|x)= eω0+ ω1x1 ++ωnxn .

Отношение шансов (OR) для коэффициента ωj:

ORj= eωj.

Интерпретация:

  • ORj=1: признак xj не влияет на вероятность;
  • ORj >1: увеличение xj повышает шансы y=1;
  • ORj <1: увеличение xj снижает шансы y=1.

Значимость коэффициентов логистической регрессии проверяется с помощью расчёта p-value:

pj=21Φzj,

где Φ ― функция распределения стандартного нормального закона.

z-статистика:

zj= ωjSEωj,

где SE(ωj) ― стандартная ошибка коэффициента ωj.

Доверительный интервал (confidence interval, CI) для OR строится на основе нормального распределения оценок коэффициентов:

CIOyj=eωjzα/2SEωj,eωj+zα/2SEωj ,

где zα/2 ― квантиль стандартного нормального распределения.

Метод опорных векторов

Метод опорных векторов (Support Vector Machine, SVM) ― алгоритм машинного обучения для классификации и регрессии, основанный на построении оптимальной разделяющей гиперплоскости в пространстве признаков. SVM ищет гиперплоскость, которая:

  • максимально разделяет классы (для классификации);
  • минимизирует ошибку (для регрессии).

Для нелинейно разделимых данных SVM использует ядерные функции для преобразования в пространство более высокой размерности.

Задача оптимизации для классификации:

minω, b12ω2+Ci=1nξi

при условии: yi(ωTxi+b) ≥1–ξi, ξi >0,

где:

  • ω ― вектор весов;
  • b ― смещение;
  • ξi ― переменные «мягкого» запаса (для неидеальной разделимости);
  • C ― параметр регуляризации (баланс между точностью и запасом).

Опорные векторы ― это точки данных, лежащие на границах разделяющего промежутка:

yiωTxi+b=1.

Если данные нелинейно разделимы, SVM применяет ядерные функции К(xi, xj), которые преобразуют данные в пространство более высокой размерности, где они становятся линейно разделимыми.

Наиболее популярные ядра:

  1.  линейное: К(xi,xj)=xiTxj;
  2.  полиномиальное: К(xi,xj)=(xiTxj+с)d;
  3.  RBF (Гауссово): К(xi,xj)=exp(–γ||xixj||2).
Решающее дерево

Решающее дерево (Decision Tree) является алгоритмом машинного обучения, используемым для решения задач классификации и регрессии. Он представляет собой древовидную структуру, где каждый внутренний узел соответствует признаку (пол, возраст, резистентность и т.д.), каждая ветвь приравнивается к правилу принятия решения, а каждый лист ― к результату (классу или численному значению).

В процессе обучения решающее дерево рекурсивно разделяет данные, точно выбирая на каждом шаге признак и порог, которые минимизируют индекс Джини (или максимизируют информационный прирост, IG), увеличивая однородность дочерних узлов. В идеальном случае (при отсутствии шума и перекрытия классов) в листьях оставались бы только объекты одного класса, но на практике из-за шумов и нелинейных зависимостей это недостижимо. Алгоритм стремится максимально уменьшить неопределённость (снизить энтропию или индекс Джини). Чем выше неопределённость в листе, тем меньше уверенность модели в прогнозе, однако чрезмерное углубление дерева (например, до полного разделения обучающих данных) ведёт к переобучению и снижению обобщающей способности.

Индекс Джини:

GS=1 i=1cpi2,

где pi ― доля объектов класса i в S.

Для каждого признака A и каждого возможного порога t разделяем данные на две группы:

Sleft ={x S| xA t}

Sright ={x S| xA >t}.

Уменьшение индекса Джини при разделении в узле вычисляем по формуле:

ΔG=GS jSjSGSj.

Для борьбы с переобучением используется алгоритм Cost-Complexity Pruning:

1)  сначала строится дерево максимальной глубины, которое идеально (и часто переобученно) описывает обучающие данные;

2)  для каждого поддерева T вычисляется функция стоимости:

СαT=ErrT+αT,

где Err(T) ― ошибка классификации/регрессии на данных (например, доля неправильных предсказаний или MSE);

|T| ― количество листьев в поддереве T;

α (параметр сложности) ― регулирует компромисс между точностью и размером дерева (чем больше α, тем сильнее обрезается дерево, т.е. упрощается модель; при α+0 дерево остаётся максимальным, т.е. переобученным).

Последовательное обрезание:

  • начиная с максимального дерева, алгоритм рекурсивно удаляет узлы, дающие наименьший вклад в уменьшение Сα(T);
  • после каждого удаления получается новое поддерево;
  • процесс продолжается, пока не останется только корневой узел.

Из полученной последовательности поддеревьев выбирается то, которое:

  • даёт минимальную ошибку на валидационной выборке;
  • или оптимизирует кросс-валидацию.
Случайный лес

Случайный лес (Random Forest) ― алгоритм машинного обучения, который относится к ансамблевым методам (ensemble learning) и используется для задач классификации и регрессии. Он строится на основе множества решающих деревьев (Decision Trees), причём каждое дерево обучается на разных подмножествах данных и разных подмножествах признаков. Итоговый прогноз формируется путём усреднения (регрессия) или голосования (классификация) всех деревьев.

Принципы работы алгоритма «случайный лес»:

  1.  бутстрэп-агрегирование (Bagging): из обучающей выборки D размера N генерируется B бутстрэп-выборок D1,D2,…,DB (выбор с повторением). Каждое дерево Tb обучается на своей выборке D;
  2.  случайный выбор признаков (Feature Randomness): при каждом разделении узла рассматриваются не все признаки, а случайное подмножество m, что уменьшает корреляцию между деревьями и улучшает обобщение;
  3.  прогноз случайного леса (классификация): каждое дерево Tb «голосует» за класс k. Итоговый прогноз ― мода (наиболее частый класс):
    y^=modeT1x,T2x,,TBx

Важность признаков (feature importance):

Importancej=1Bb=1BtTb𝕀j использован в t×ΔCriteriont.

Градиентный бустинг

Градиентный бустинг (Gradient Boosting) ― ансамблевый метод, который строит последовательность слабых моделей (обычно деревьев решений), минимизируя функцию потерь через градиентный спуск.

Основные формулы и алгоритм:

1. Инициализация.

Начальное предсказание ― логарифм отношения правдоподобия (логит):

F0x=argminγi=1nLyi,σγ,

где

  • σ(z)=1/(1+ez) ― сигмоидная функция;
  • L(y,p)=–y∙log(p)–(1–y)∙log(1–p) ― логистическая функция потерь (LogLoss).

Оптимальное начальное значение:

F0x=logi=1nyii=1nyi1yi.

2. Последовательное обучение деревьев.

На каждой итерации m=1,…, M:

2.1. Вычисление псевдоостатков (антиградиент):

rim=Lyi,Fm1xiFm1xi=yiσFm1xi.

2.2. Обучение дерева hm(x) на остатках. Дерево строится так, чтобы приближать rim:

hmx=argminhi=1nrimhxi2.

2.3. Оптимизация шага обучения γm (линейный поиск):

γm=argminγi=1nLyi,σFm1xi+γhmxi.

2.4. Обновление модели:

Fmx=Fm1xi+ϑγmhmx,

где ϑ ― темп обучения.

3. Финальное предсказание.

После M итераций:

Fx= Fox+ϑm=1Mγmhmx.

Вероятность класса 1:

p^x=σFx.

CatBoost ― улучшенная версия градиентного бустинга:

  • с автоматической обработкой категориальных признаков;
  • упорядоченным бустингом для борьбы со смещением;
  • регуляризацией для уменьшения переобучения.

Особенности CatBoost в бинарной классификации:

1) Ordered Target Encoding для категориальных признаков: категории кодируются усреднением таргета на «предыдущих» объектах (в случайной перестановке):

encodedi=j=1i1xj=xiyj+aPj=1i1xj=xiyj+a,

где a ― параметр сглаживания; P ― априорное среднее (например, общая доля класса 1).

2) Ordered Boosting (уменьшение смещения): каждое дерево обучается на новой перестановке данных; это помогает избежать переобучения на шумных объектах.

3) Регуляризация: L2-регуляризация в листьях:

Gain= iLeafrim2iLeafrimpi1pi+λ.

4) Симметричные деревья (Oblivious Trees): все ветки дерева имеют одинаковую глубину ⇒ быстрее предсказание.

Метрики оценки качества используемых алгоритмов. Матрица ошибок (confusion matrix)

В основе оценки качества работы алгоритмов машинного обучения для задачи классификации лежит понятие матрицы ошибок (confusion matrix).

Матрица ошибок (confusion matrix) ― таблица, которая показывает соответствие между реальными и предсказанными диагнозами. Для бинарной классификации (например, «здоров/болен») она имеет вид:

1) TP (True Positive ― истинно положительные ответы) ― все случаи верной классификации моделью класса 1;

2) TN (True Negative ― истинно отрицательные ответы) ― все случаи верной классификации моделью класса 0;

3) FP (False Positive ― ложноположительные ответы) ― все случаи ошибочной классификации моделью класса 1;

4) FN (False Negative ― ложноотрицательные ответы) ― все случаи ошибочной классификации моделью класса 0 (рис. 6).

 

Рис. 6. Матрица ошибок.

Fig. 6. Error matrix.

 

Recall

Recall= TPTP+FN

характеризует долю установленных моделью объектов целевого класса 1. Значения данной метрики находятся в диапазоне от 0 до 1: чем ближе показатель к 1, тем бóльшую долю объектов класса 1 алгоритм корректно идентифицирует из всех объектов класса 1, находящихся в исследуемой выборке.

Recallweighted= i=1CniNTPiTPi+FNi

характеризует долю установленных моделью объектов целевого класса 1 с учётом веса каждого класса. Используется для оценки работы модели в случае наличия дисбаланса классов. Значения данной метрики находятся в диапазоне от 0 до 1: чем ближе показатель к 1, тем большую долю объектов класса 1 алгоритм корректно идентифицирует из всех объектов класса 1, находящихся в исследуемой выборке.

Precision

Precision= TPTP+FP

характеризует корректность прогнозов целевого класса 1. Значения данной метрики находятся в диапазоне от 0 до 1: чем ближе показатель к 1, тем точнее прогноз модели, т.е. больше доля объектов, для которых прогноз алгоритмом принадлежности к классу 1 является корректным.

Precisionweighted= i=1CniNTPiTPi+FPi

характеризует корректность прогнозов целевого класса 1 с учётом веса каждого класса. Используется для оценки работы модели в случае наличия дисбаланса классов. Значения данной метрики находятся в диапазоне от 0 до 1, т.е. больше доля объектов, для которых прогноз алгоритмом принадлежности к классу 1 является корректным.

ROC-AUC

Операционный анализ ― площадь под кривой, или ROC-AUC (Receiver Operating Characteristic―Area Under the Curve) ― важный инструмент для оценки качества бинарных классификаторов.

Метрика отражает площадь под ROC-кривой, осями для которой являются значения TPR и FPR:

TPR= TPTP+FN.

TPR (True Positive Rate) ― отношение корректно классифицированных моделью объектов классa 1 ко всем объектам класса 1, содержащимся в данных.

FPR= FPFP+TN.

FPR (False Positive Rate) ― отношение ошибочно классифицированных объектов классa 1 ко всем объектам класса 0, содержащимся в данных.

Сам график строится для множества классификаторов с различными пороговыми значениями, в зависимости от уровня которых алгоритм относит объект либо к классу 1, либо к классу 0.

Метрика ROC-AUC является мерой качества модели бинарной классификации. Значение данной метрики лежит в диапазоне от 0 до 1: чем выше значение ROC-AUC, тем лучше модель классифицирует объекты.

Результаты

Создание прогностической модели с помощью методов машинного обучения по геномным механизмам для осуществления прогноза на наличие буллёзного дерматоза

Для создания классификатора, позволяющего различать больных буллёзными дерматозами и здоровых, были использованы следующие алгоритмы машинного обучения: решающее дерево (Decision Tree Classifier); случайный лес (Random Forest Classifier); логистическая регрессия (Logistic Regression); метод опорных векторов (SVC); алгоритм градиентного бустинга (CatBoost).

Изначально для создания модели использовались следующие признаки: частота встречаемости DRB1 и DQB1 HLA аллелей II класса, полиморфизм гена NR3C1 (A3669G) β-изоформы ГР, экспрессия α- и β-изоформ ГР на лимфоцитах, пол, возраст. В процессе разработки модели было установлено, что качество прогноза не снижается при сокращении признакового пространства до двух переменных ― экспрессии α- и β-изоформ ГР. В случае логистической регрессии оказалось достаточно одного признака ― экспрессии α-изоформы ГР.

Для подбора наилучшей комбинации гиперпараметров классификаторов применялся алгоритм решётчатого поиска GridSearchCV, а также метод кросс-валидации, позволяющий получить более точную метрическую оценку работы модели.

Для оценки качества работы классификаторов применялись метрики Precision, Recall и ROC-AUC.

По результатам построения прогностической модели классификации были получены результаты для каждого из алгоритмов (табл. 1).

 

Таблица 1. Значения метрик для классификаторов

Table 1. Metric values for classifiers

Алгоритм

Используемые признаки

Recall

Precision

ROC-AUC

Logistic Regression

Alfa

1,000

0,938

0,992

SVC

Alfa + Beta

0,933

0,933

0,991

CatBoost

0,933

0,933

0,988

Random Forest Classifier

0,933

0,933

0,988

Decision Tree Classifier

0,933

0,933

0,949

 

Наилучшие значения метрик показал алгоритм машинного обучения «логистическая регрессия», используя при этом всего один признак для прогноза ― экспрессию α-изоформы ГР (Alfa).

Значения метрик Recall (1,000) и Precision (0,938) говорят о том, что построенная модель не только почти не ошибается при непосредственном прогнозе того, что у больного наблюдается буллёзный дерматоз, но и корректно определяет всех пациентов в заданной группе.

Высокий показатель метрики ROC-AUC (0,992) говорит об отличной способности классификатора различать классы и очень высокой вероятности корректного определения алгоритмом, болен человек буллёзным дерматозом или здоров.

Высокая экспрессия α-изоформы ГР ассоциирована с повышенной вероятностью развития буллёзного дерматоза, что подтверждено моделью логистической регрессии:

P(Y=1)=1/(1+e^(-(-4,0479+0,1102∙Alfa))),

где P(Y=1) ― вероятность наличия буллёзного дерматоза, а Alfa ― уровень экспрессии α-изоформы ГР. Данная модель демонстрирует, что увеличение экспрессии α-изоформы ГР существенно повышает риск развития заболевания, предоставляя ценный прогностический инструмент для клинической практики (рис. 7).

 

Рис. 7. Влияние уровня экспрессии α-изоформы ГР на вероятность развития буллёзного дерматоза. БД ― буллёзный дерматоз.

Fig. 7. The effect of the expression level of the α-isoform of GH on the likelihood of developing bullous dermatosis. БД, bullous dermatosis.

 

Отношение шансов (OR) показывает, что рост на 1 единицу экспрессии α-изоформ ГР повышает в 1,116 раза вероятность развития буллёзного дерматоза (табл. 2). Исходя из полученных результатов, установлено критическое значение экспрессии α-изоформ ГР равное 36,7 единицам, при превышении которого вероятность развития буллёзного дерматоза будет более 50% (табл. 3, рис. 8).

 

Таблица 2. Отношение шансов для экспрессии α-изоформ ГР

Table 2. Odds ratio for expression of α-isoforms of GR

Параметр

Значение

p-value

95% ДИ

OR (на 1 ед.)

1,116

<0,001

1,084–1,150

 

Таблица 3. Категории риска в зависимости от уровня экспрессии α-изоформ ГР

Table 3. Risk categories depending on the expression level of α-isoforms of GR

Уровень экспрессии α-изоформы ГР, ед.

Вероятность заболеваемости буллёзным дерматозом, %

Категория риска

<30

14–32

Низкий

30–36,7

32–50

Умеренный

36,7–40

50–59

Высокий

>40

59–81

Очень высокий

 

Рис. 8. График зависимости вероятности развития буллёзного дерматоза от экспрессии α-изоформы ГР. БД ― буллёзный дерматоз.

Fig. 8. Graph of the dependence of the probability of developing bullous dermatosis on the expression of the α-isoform of GR. БД, bullous dermatosis.

 

Таким образом, для осуществления прогноза принадлежности человека к контрольной группе или группе пациентов с буллёзными дерматозами с помощью методов машинного обучения и анализа признакового пространства было получено формульное выражение установленной зависимости между уровнем экспрессии α-изоформ ГР и вероятностью развития буллёзного дерматоза. Полученная формула позволяет не только установить направленность влияния признака на вероятность возникновения буллёзного дерматоза с помощью отношения шансов, но и с очень высокой степенью точности стратифицировать пациентов по группам риска развития заболеваний.

Создание прогностической модели с помощью методов машинного обучения по геномным и негеномным механизмам для осуществления прогноза на наличие стероидной резистентности у больных тяжёлыми буллёзными дерматозами

Для создания классификатора, позволяющего определять наличие или отсутствие стероидной резистентности у больных буллёзными дерматозами, были использованы следующие алгоритмы машинного обучения:

  • решающее дерево (Decision Tree Classifier);
  • случайный лес (Random Forest Classifier);
  • логистическая регрессия (Logistic Regression);
  • метод опорных векторов (SVC);
  • алгоритм градиентного бустинга (CatBoost).

Для подбора наилучшей комбинации гиперпараметров классификатора применялся алгоритм решётчатого поиска GridSearchCV, а также метод кросс-валидации, позволяющий получить более точную метрическую оценку работы модели. Для оценки качества работы классификатора использовались метрики Precision, Recall и ROC-AUC (площадь под кривой ошибок). По результатам построения прогностической модели классификации получены следующие значения метрик (табл. 4).

 

Таблица 4. Значения метрик для классификаторов

Table 4. Metric values for classifiers

Алгоритм

Recall

Precision

ROC-AUC

SVC

0,793

0,655

0,894

Logistic Regression

0,763

0,564

0,817

CatBoost

0,598

0,552

0,747

Decision Tree Classifier

0,474

0,667

0,723

Random Forest Classifier

0,314

0,702

0,741

 

Наиболее чувствительным оказался метод опорных векторов (Support Vector Machines Classifier), который выбрал наиболее значимые признаки, прогнозирующие стероидную резистентность, а именно: DRB1 аллели в высоком разрешении, такие как DRB1*13:02, DQB1*05:02, DQB1*02:01, DQB1*05:01 и DQB1*03:01; также к значимым признакам относились тяжесть акантолитической пузырчатки и буллёзного пемфигоида, наличие аллелей DRB1*04:04, DRB1*16:02, наличие полиморфизма A3669G β-изоформы ГР. Кроме того, данный метод установил также аллели, которые повышали вероятность отсутствия стероидной резистентности у больных буллёзными дерматозами. К ним относились DQB1 HLA аллели II класса гистосовместимости в низком разрешении, а также DQB1*06:02, DQB1*01:01, DQB*04:03 и DQB1*06:03 аллели (рис. 9).

 

Рис. 9. График важности признаков для алгоритма метода опорных векторов в случае прогнозирования у пациентов стероидной резистентности со стороны геномных механизмов.

Fig. 9. Graph of the importance of features for the algorithm of the support vector method in the case of prediction of steroid resistance in patients by genomic mechanisms.

 

Таким образом, алгоритм случайного леса и метод опорных векторов позволили классифицировать больных буллёзными дерматозами на стероидрезистентных и стероидчувствительных на уровне HLA аллелей II класса, а также по наличию полиморфизма A3669G β-изоформы ГР.

Создание прогностической модели с помощью методов машинного обучения по негеномным механизмам для осуществления прогноза на наличие буллёзного дерматоза

Методом машинного обучения при анализе цитокинового и хемокинового профиля (негеномные механизмы) у стероидрезистентных и стероидчувствительных больных в сыворотке и пузырной жидкости были отобраны две лучшие модели ― CatBoost (метод машинного обучения, основанный на градиентном бустинге) и случайный лес (Forest/Random Forest), которые наиболее точно предсказывали вероятность развития стероидной резистентности у больных буллёзными дерматозами при наличии шести следующих наиболее значимых признаков: высокая концентрация IL-15, IL-4 и CXCL8 в пузырной жидкости; высокая концентрация гранулизина в сыворотке; диагноз и тяжесть акантолитической пузырчатки; приём азатиоприна (F1-метрика: 0,538721; ROC AUC: 0,879167; Recall: 0,541667; Precision: 0,857143). Следует отметить, что из значимых сопутствующих заболеваний модели выделили сахарный диабет 2-го типа (табл. 5, рис. 10).

 

Таблица 5. Характеристика метрик методов машинного обучения

Table 5. Characteristics of metrics of machine learning methods

Алгоритм

f1

ROC_AUC

Recall

Precision

LogReg

0,488038

0,750000

0,625000

0,402597

SVC

0,467836

0,749802

0,625000

0,378788

CatBoost

0,538721

0,879167

0,541667

0,857143

Forest

0,552707

0,797123

0,500000

0,866667

Tree

0,425926

0,578373

0,458333

0,416667

 

Рис. 10. График важности признаков для алгоритма метода опорных векторов в случае прогнозирования у пациентов стероидной резистентности на внегеномном уровне (CatBoostClassifier; RandoomForestClassifier; LogisticRegression).

Fig. 10. Graph of the importance of features for the algorithm of the support vector method in the case of forecasting steroid resistance in patients at the extragenomic level (CatBoostClassifier; RandoomForestClassifier; LogisticRegression).

 

Таким образом, пузырная жидкость может быть использована для диагностики, дифференциальной диагностики, прогноза тяжести течения буллёзного дерматоза, а также оценки ответа на терапию системными глюкокортикоидами. Кроме того, анализ блистерной жидкости сможет на ранних этапах заболевания спрогнозировать ответ пациентов на терапию системными глюкокортикоидами, позволяя своевременно скорректировать лечение, уменьшив тем самым риск развития потенциальных осложнений и прогрессирование буллёзного дерматоза.

Обсуждение

Машинное обучение представляет собой раздел искусственного интеллекта, основанный на идее того, что системы могут извлекать закономерности из данных и принимать решения с минимальным человеческим вмешательством. Этот подход включает широкий спектр статистических методов, таких как глубокое обучение, метод опорных векторов, случайный лес, решающее дерево, логистическая регрессия и др. [1].

В дерматовенерологии применение машинного обучения активно развивается, охватывая такие области, как классификация заболеваний на основе клинических и дерматопатологических изображений, мониторинг состояния кожи с использованием мобильных приложений, проведение крупномасштабных эпидемиологических исследований и развитие персонализированной медицины [1].

В рамках настоящего исследования при анализе различных статистических методов наибольший потенциал продемонстрировали случайный лес, метод опорных векторов и алгоритм градиентного бустинга (CatBoost), показав высокую эффективность в решении ключевых задач, в частности классификации больных в зависимости от адекватного или плохого ответа на терапию системными глюкокортикоидами, а также их стратификации в зависимости от отсутствия или наличия диагноза буллёзного дерматоза.

Стратификация пациентов по наличию диагноза буллёзного дерматоза

Алгоритм случайный лес продемонстрировал хороший результат относительно дифференциации больных буллёзными дерматозами от здоровых добровольцев, достигнув метрики ROC-AUC 0,992. Данный показатель свидетельствует об идеальной способности модели различать больных и здоровых, что делает её перспективным инструментом для более точной диагностики данных заболеваний на ранней стадии. Кроме того, была получена формула с помощью логистической регрессии, которая показала, что увеличение экспрессии α-изоформы ГР до определённых значений (36,7–40 ед.) повышает вероятность развития буллёзного дерматоза.

Классификация больных буллёзными дерматозами на стероидрезистентных и стероидчувствительных

Для стратификации больных буллёзными дерматозами на стероидрезистентных и стероидчувствительных наиболее эффективным оказался метод опорных векторов, который выбрал наиболее значимые аллели, прогнозирующие стероидную резистентность. К таким аллелям относились DRB1*13:02, DQB1*05:02, DQB1*02:01, DQB1*05:01 и DQB1*03:01. Кроме того, были идентифицированы аллели, снижающие вероятность её развития, однако значение ROC-AUC 0,894 указывало на высокую, но не абсолютную чувствительность модели, что требует её дальнейшей оптимизации на более крупных выборках.

На негеномном уровне методы CatBoost и случайный лес также продемонстрировали значительный потенциал для прогноза вероятности развития стероидной резистентности у больных буллёзными дерматозами на основе следующих признаков: высокая концентрация IL-15, IL-4 и CXCL8 в пузырной жидкости, а также гарнулизина в сыворотке; диагноз и тяжёлое течение акантолитической пузырчатки. Полученные результаты подчёркивают роль иммунных факторов в развитии неадекватного ответа на терапию системными глюкокортикоидами и открывают новые возможности для персонализированного подхода к терапии, в том числе содействуют совершенствованию диагностики данных жизнеугрожающих заболеваний.

Сравнение с существующими исследованиями

Применение машинного обучения в дерматологии активно развивается, особенно в области классификации кожных заболеваний на основе изображений. В частности, в данной области нашло своё применение глубокое обучение, основанное на искусственных нейронных сетях, которые самообучаются на большом наборе данных [19]. Так, например, в 2017 году исследователи на основе свёрточной нейронной сети Google Inception V3, предварительно обученной на 1,28 миллиона изображений, продемонстрировали точность данного алгоритма, сопоставимую с таковой у врачей-дерматологов [20]. Кроме того, были созданы общедоступные архивы с изображениями злокачественных новообразований кожи для разработки новых алгоритмов, позволяющих идентифицировать дермоскопические признаки, а также классифицировать злокачественные новообразования [4]. Интеграция макроскопических снимков, демографических данных (возраст, пол), а также макроскопических показателей позволила повысить точность диагностики [21].

В контексте псориаза машинное обучение использовалось для прогнозирования долгосрочного ответа на терапию на основании биохимических маркеров и данных биопсии [1, 22, 23]. Для количественной оценки риска развития псориатического артрита среди больных псориазом была предложена модель машинного обучения, основанная на данных более 7000 пациентов с псориатическим артритом и псориазом. Так, M.T. Patrick и соавт. [24] использовали методы машинного обучения для дифференциальной диагностики псориатического артрита и псориаза на основе 200 генетических маркеров, достигнув показателя ROC-AUC 0,82. C. Shi и соавт. [25] в исследовании 2019 года представили автоматическую систему, которая с высокой точностью распознавала снимки реакции прямой иммунофлюоресценции. Оценка проводилась на новом наборе данных, состоящем из 180 изображений. Достигнутая степень распознавания составила 82,2%, что превысило результаты экспертов. Данная система показала достаточную эффективность в диагностике буллёзного дерматоза. Однако в другом исследовании, в котором применялись методы машинного обучения для анализа изображений непрямой реакции иммунофлюоресценции пищевода обезьяны, предсказательная способность модели на 95% была сопоставима с полученными лабораторными результатами, тем не менее в работе также отмечалась и отрицательная предсказательная способность машины, что, безусловно, требует проверки полученных данных человеком [26].

Потенциал и ограничения методов машинного обучения

Полученные результаты подтверждают высокий потенциал методов машинного обучения для классификации больных буллёзными дерматозами, прогноза развития стероидной резистентности и оценки тяжести течения заболевания. Интеграция алгоритмов машинного обучения с традиционными диагностическими подходами может ускорить постановку диагноза, а также оптимизировать выбор терапии для стероидрезистентных больных (например, своевременное назначение азатиоприна и других иммуносупрессантов или цитостатиков). Однако существуют и определённые ограничения машинного обучения. Так, для создания высокопроизводительных моделей глубокого обучения требуется значительный объём данных, что делает сбор релевантных и масштабных баз данных одной из ключевых задач, особенно для редких заболеваний, таких как буллёзный дерматоз. Другой проблемой является феномен «чёрного ящика», при котором сложность интерпретации процессов принятия решений моделями, такими как глубокие нейронные сети, снижает уровень доверия к полученным результатам [4]. Кроме того, наличие артефактов (пузырьки воздуха, волосы и т.д.) на изображениях может привести к ошибкам в диагностике, снижая точность алгоритмов [1]. Для решения этих задач необходимо разработать стандартизированные протоколы сбора данных, методы, которые смогли бы улучшить интерпретируемость моделей (например, применение SHAP-анализа), а также оптимизировать подходы к предобработке данных, что позволит эффективно применять методы машинного обучения в дерматологии, обеспечивая более точную диагностику и дифференциальную диагностику у больных различными иммунозависимыми и аутоиммунными дерматозами. Кроме того, интеграция машинного обучения в лабораторные процессы в будущем позволит повысить точность и скорость диагностики, а также сократить затраты на проведение реакций прямой и непрямой иммунофлюоресценции.

Заключение

Наше исследование демонстрирует, что методы случайных лесов, опорных векторов и CatBoost могут стать основой для разработки диагностических и прогностических инструментов в дерматологии, в частности для больных буллёзными дерматозами. Возможно, в будущем потребуются расширение выборки, валидация моделей на независимых когортах и интеграция мультимодальных данных (изображения, генетика, иммунология) с целью повышения точности и обобщающей способности моделей. Эти шаги позволят плавно перенести машинное обучение из исследовательской стадии в клиническую практику, улучшив течение и увеличив период ремиссии пузырных дерматозов.

Дополнительная информация

Вклад авторов. О.Ю. Олисова ― концепция и дизайн исследования; интерпретация клинических и генетических данных; написание черновика статьи; утверждение финальной версии; А.А. Лепехова ― сбор клинических данных у пациентов с буллёзными дерматозами; анализ показателей иммунологических маркеров (цитокины, хемокины, гранулизин, HLA, α- и β-ГР, полиморфизм A3669G β-ГР); критическая ревизия статьи; утверждение финальной версии статьи; А.С. Духанин ― проведение лабораторной части работы (оценка уровня цитокинов, хемокинов и гранулизина в сыворотке и пузырной жидкости методом ИФА; оценка частоты встречаемости HLA-DRB1 и HLA-DQB1 аллелей; α- и β-ГР, полиморфизма A3669G β-ГР методом ПЦР в реальном времени), интерпретация результатов; утверждение финальной версии статьи; Н.П. Теплюк ― сбор клинических данных у пациентов с буллёзными дерматозами; постановка диагноза; вклад в дизайн протокола исследования; утверждение финальной версии статьи; Н.Л. Шимановский ― проведение лабораторной части работы (оценка уровня цитокинов, хемокинов и гранулизина в сыворотке и пузырной жидкости методом ИФА; критическая ревизия статьи; утверждение финальной версии работы; А.В. Сидорцов ― применение модели машинного обучения (логистическая регрессия, SVM, случайный лес, градиентный бустинг, CatBoost) для прогнозирования ответа на терапию при буллёзных дерматозах; статистическая обработка данных (HLA-аллели, полиморфизм A3669G, экспрессия изоформ ГР, цитокины, хемокины, гранулизин), валидация алгоритмов (ROC-AUC до 0,992) и разработка метрик (Recall, Precision) для стратификации стероидной резистентности; вклад в интерпретацию результатов, включая формулу риска буллёзных дерматозов по экспрессии α-изоформы ГР, и утверждение финальной версии статьи; А.А. Марданова ― участие в стратификации пациентов с буллёзными дерматозами; сбор данных по анализу пузырной жидкости. Все авторы одобрили рукопись (версию для публикации), а также согласились нести ответственность за все аспекты работы, гарантируя надлежащее рассмотрение и решение вопросов, связанных с точностью и добросовестностью любой её части.

Этическая экспертиза. Исследование одобрено локальным этическим комитетом Сеченовского Университета (протокол № 03-22 от 03.02.2022). Все участники исследования подписали форму информированного добровольного согласия до включения в исследование.

Источники финансирования. Отсутствуют.

Раскрытие интересов. Авторы заявляют об отсутствии отношений, деятельности и интересов за последние три года, связанных с третьими лицами (коммерческими и некоммерческими), интересы которых могут быть затронуты содержанием статьи.

Оригинальность. При проведении исследования и создании настоящей работы авторы не использовали ранее опубликованные сведения (текст, иллюстрации, данные).

Доступ к данным. Доступ к данным возможен в рамках редакционной политики по запросу заинтересованных лиц.

Генеративный искусственный интеллект. При создании настоящей статьи технологии генеративного искусственного интеллекта не использовали.

Рассмотрение и рецензирование. Настоящая работа подана в журнал в инициативном порядке и рассмотрена по обычной процедуре. В рецензировании участвовали два внешних рецензента и научный редактор издания.

Additional information

Author contributions: O.Yu. Olisova: conceptualization, methodology, formal analysis, writing—original draft, writing—review & editing; A.A. Lepekhova: investigation, formal analysis, writing—review & editing; A.S. Dukhanin: investigation, formal analysis, writing—review & editing; N.P. Teplyuk: methodology, investigation, writing—review & editing; N.L. Shimanovsky: investigation, writing—review & editing; A.V. Sidortsov: investigation, formal analysis, writing—review & editing; A.A. Mardanova: investigation, formal analysis. All the authors approved the version of the manuscript to be published and agreed to be accountable for all aspects of the work, ensuring that questions related to the accuracy or integrity of any part of the work are appropriately investigated and resolved.

Ethics approval: The study was approved by the local Ethics Committee of Sechenov University (Minutes No. 03-22 of February 3, 2022). All participants provided written informed consent prior to inclusion in the study.

Funding sources: No funding.

Disclosure of interests: The authors have no relationships, activities, or interests for the last three years related to for-profit or not-for-profit third parties whose interests may be affected by the content of the article.

Statement of originality: No previously obtained or published material (text, images, or data) was used in this work.

Data availability statement: Access to the data is available upon reasonable request in accordance with the editorial policy.

Generative AI: No generative artificial intelligence technologies were used to prepare this article.

Provenance and peer-review: This paper was submitted unsolicited and reviewed following the standard procedure. The peer review process involved two external reviewers and the in-house science editor.

×

About the authors

Olga Y. Olisova

The First Sechenov Moscow State Medical University

Email: olisovaolga@mail.ru
ORCID iD: 0000-0003-2482-1754
SPIN-code: 2500-7989

MD, Dr. Sci. (Medicine), Professor

Russian Federation, Moscow

Anfisa A. Lepekhova

The First Sechenov Moscow State Medical University

Author for correspondence.
Email: anfisa.lepehova@yandex.ru
ORCID iD: 0000-0002-4365-3090
SPIN-code: 3261-3520

MD, Cand. Sci. (Medicine), Assistant Professor

Russian Federation, Moscow

Alexander S. Dukhanin

The Russian National Research Medical University named after N.I. Pirogov

Email: das03@rambler.ru
ORCID iD: 0000-0003-2433-7727
SPIN-code: 5028-6000

MD, Dr. Sci. (Medicine), Professor

Russian Federation, Moscow

Natalia P. Teplyuk

The First Sechenov Moscow State Medical University

Email: teplyukn@gmail.com
ORCID iD: 0000-0002-5800-4800
SPIN-code: 8013-3256

MD, Dr. Sci. (Medicine), Professor

Russian Federation, Moscow

Nikolay L. Shimanovsky

The Russian National Research Medical University named after N.I. Pirogov

Email: shiman@rsmu.ru
ORCID iD: 0000-0001-8887-4420
SPIN-code: 5232-8230

MD, Dr. Sci. (Medicine), Professor, Corresponding Member of the Russian Academy of Sciences

Russian Federation, Moscow

Andrey V. Sidortsov

Public JSC Sberbank

Email: sidortsov247@gmail.com
ORCID iD: 0009-0004-1100-7862

Data Scientist

Russian Federation, Moscow

Alina A. Mardanova

The First Sechenov Moscow State Medical University

Email: alinamardanova5@gmail.com
ORCID iD: 0009-0000-8883-6694
Russian Federation, Moscow

References

  1. Chan S, Reddy V, Myers B, et al. Machine learning in dermatology: current applications, opportunities, and limitations. Dermatol Ther (Heidelb). 2020;10(3):365–386. doi: 10.1007/s13555-020-00372-0
  2. Murphy KP. Machine learning: a probabilistic perspective. Cambridge: MIT Press; 2012. 1071 p. (Adaptive computation and machine learning). ISBN 9780262018029
  3. Silver D, Huang A, Maddison CJ, et al. Mastering the game of Go with deep neural networks and tree search. Nature. 2016;529(7587):484–489. doi: 10.1038/nature16961
  4. Jeong HK, Park C, Henao R, Kheterpal M. Deep learning in dermatology: a systematic review of current approaches, outcomes, and limitations. JID Innov. 2022;3(1):100150. doi: 10.1016/j.xjidi.2022.100150
  5. Coomans D, Massart DL. Alternative k-nearest neighbour rules in supervised pattern recognition: part 1 k-Nearest neighbour classification by using alternative voting rules. Anal Chim Acta. 1982;136:15–27. doi: 10.1016/S0003-2670(01)95359-0
  6. Hearst MA, Dumais ST, Osuna E, et al. Support vector machines. IEEE Intell Syst Appl. 1998;13(4):18–28. doi: 10.1109/5254.708428
  7. Breiman L. Random forests. Mach Learn. 2001;45(1):5–32. doi: 10.1023/A:1010933404324
  8. Manning CD, Schütze H. Foundations of statistical natural language processing. Cambridge: MIT Press; 1999. 680 p. ISBN 0-262-13360-1
  9. Schmidt E, Kasperkiewicz M, Joly P. Pemphigus. Lancet. 2019;394(10201):882–894. doi: 10.1016/S0140-6736(19)31778-7
  10. Schmidt E, Zillikens D. Pemphigoid diseases. Lancet. 2013;381(9863):320–332. doi: 10.1016/S0140-6736(12)61140-4
  11. Shah H, Parisi R, Mukherjee E, et al. Update on Stevens-Johnson syndrome and toxic epidermal necrolysis: diagnosis and management. Am J Clin Dermatol. 2024;25(6):891–908. doi: 10.1007/s40257-024-00889-6 EDN: WYXLLY
  12. Joly P, Horvath B, Patsatsi Α, et al. Updated S2K guidelines on the management of pemphigus vulgaris and foliaceus initiated by the European Academy of Dermatology and Venereology (EADV). J Eur Acad Dermatol Venereol. 2020;34(9):1900–1913. doi: 10.1111/jdv.16752 EDN: HHTDRU
  13. Lepekhova A, Olisova O, Shimanovsky N, et al. A3669G polymorphism of glucocorticoid receptor is more present in patients with pemphigus vulgaris than in healthy controls and contributes to steroid-resistance. Dermatol Ther. 2024;2024(1):10.1155/2024/5573157. doi: 10.1155/2024/5573157 EDN: BUOOMK
  14. Chriguer RS, Roselino AM, de Castro M. Glucocorticoid sensitivity and proinflammatory cytokines pattern in pemphigus. J Clin Immunol. 2012;32(4):786–793. doi: 10.1007/s10875-012-9679-y EDN: BYTDVZ
  15. Clinical recommendations. Bubble wrap. Russian Society of Dermatovenerologists and Cosmetologists; 2020. (In Russ.) Available from: https://cnikvi.ru/klinicheskie-rekomendacii-rossijskogo-obshchestva/klinicheskie-rekomendacii/#klinicheskie-rekomendacii-minzdrava-RF/dermatologiya Accessed: 15.08.2025. (In Russ.)
  16. Clinical recommendations. Bullous pemphigoid. Russian Society of Dermatovenerologists and Cosmetologists; 2020. (In Russ.) Available from: https://cnikvi.ru/klinicheskie-rekomendacii-rossijskogo-obshchestva/klinicheskie-rekomendacii/#klinicheskie-rekomendacii-minzdrava-RF/dermatologiya Accessed: 15.08.2025.
  17. Clinical recommendations. Stevens-Johnson syndrome. Russian Society of Dermatovenerologists and Cosmetologists; 2020. (In Russ.) Available from: https://cnikvi.ru/klinicheskie-rekomendacii-rossijskogo-obshchestva/klinicheskie-rekomendacii/#klinicheskie-rekomendacii-minzdrava-RF/dermatologiya Accessed: 15.08.2025.
  18. Murrell DF, Dick S, Ahmed AR, et al. Consensus statement on definitions of disease, end points, and therapeutic response for pemphigus. J Am Acad Dermatol. 2008;58(6):1043–1046. doi: 10.1016/j.jaad.2008.01.012
  19. Puri P, Comfere N, Drage LA, et al. Deep learning for dermatologists: part II. Current applications. J Am Acad Dermatol. 2022;87(6):1352–1360. doi: 10.1016/j.jaad.2020.05.053 EDN: ILKKYW
  20. Esteva A, Kuprel B, Novoa RA, et al. Dermatologist-level classification of skin cancer with deep neural networks. Nature. 2017;542(7639):115–118. doi: 10.1038/nature21056
  21. Tschandl P, Rosendahl C, Kittler H. The HAM10000 dataset, a large collection of multi-source dermatoscopic images of common pigmented skin lesions. Sci Data. 2018;5(1):180161. doi: 10.1038/sdata.2018.161
  22. Bagel J, Wang Y, Montgomery P. A Machine Learning-Based Test for Predicting Response to Psoriasis Biologics. J of Skin. 2021;5(6):621-638. doi: 10.25251/skin.5.6.5.
  23. Omiye JA, Gui H, Daneshjou R, et al. Principles, applications, and future of artificial intelligence in dermatology. Front Med (Lausanne). 2023;10:1278232. doi: 10.3389/fmed.2023.1278232 EDN: METAYN
  24. Patrick MT, Stuart PE, Raja K, et al. Genetic signature to provide robust risk assessment of psoriatic arthritis development in psoriasis patients. Nat Commun. 2018;9(1):4178. doi: 10.1038/s41467-018-06672-6
  25. Shi C, Azzopardi G, Petkov N, et al. Detection of u-serrated patterns in direct immunofluorescence images of autoimmune bullous diseases by inhibition-augmented COSFIRE filters. Int J Med Inform. 2019;122:27–36. doi: 10.1016/j.ijmedinf.2018.11.007 EDN: WNUEPX
  26. Van Beek N, Dähnrich C, Johannsen N, et al. Prospective studies on the routine use of a novel multivariant enzyme-linked immunosorbent assay for the diagnosis of autoimmune bullous diseases. J Am Acad Dermatol. 2017;76(5):889–894e5. doi: 10.1016/j.jaad.2016.11.002

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Fig. 1. Study design. АП, acantholytic pemphigus; БП, bullous pemphigoid; ССД/ТЭН, Stevens-Johnson syndrome / toxic epidermal necrolysis; ПЦР, polymerase chain reaction; ELISA, enzyme immunoassay; CP(+)/CP(-), the presence/absence of steroid resistance.

Download (1MB)
3. Fig. 2. Distribution of patients with bullous dermatoses by diagnosis. ВП, vulgar pemphigus; ВегП, vegetative pemphigus; ЛП, leaf-shaped pemphigus; ПНП, paraneoplastic pemphigus; БП, bullous pemphigoid; ССД/ТЭН, Stevens-Johnson syndrome / toxic epidermal necrolysis.

Download (224KB)
4. Fig. 3. Distribution of patients with bullous dermatoses and groups of healthy volunteers by gender (bar chart). ВП, vulgar pemphigus; ЛП, leaf-shaped pemphigus; ПНП, paraneoplastic pemphigus; ВегП, vegetative pemphigus; БП, bullous pemphigoid; ССД/ТЭН, Stevens-Johnson syndrome / toxic epidermal necrolysis.

Download (162KB)
5. Fig. 4. Distribution of patients with bullous dermatoses and groups of healthy volunteers by age (violin diagram). ССД/ТЭН, Stevens-Johnson syndrome / toxic epidermal necrolysis.

Download (524KB)
6. Fig. 5. Prevalence of steroid resistance in patients depending on the established diagnosis. ССД/ТЭН, Stevens-Johnson syndrome / toxic epidermal necrolysis; БП, bullous pemphigoid; ВегП, vegetative pemphigus; ПНП, paraneoplastic pemphigus; ЛП, leaf-shaped pemphigus; ВП, vulgar pemphigus.

Download (164KB)
7. Fig. 6. Error matrix.

Download (218KB)
8. Fig. 7. The effect of the expression level of the α-isoform of GH on the likelihood of developing bullous dermatosis. БД, bullous dermatosis.

Download (319KB)
9. Fig. 8. Graph of the dependence of the probability of developing bullous dermatosis on the expression of the α-isoform of GR. БД, bullous dermatosis.

Download (440KB)
10. Fig. 9. Graph of the importance of features for the algorithm of the support vector method in the case of prediction of steroid resistance in patients by genomic mechanisms.

Download (809KB)
11. Fig. 10. Graph of the importance of features for the algorithm of the support vector method in the case of forecasting steroid resistance in patients at the extragenomic level (CatBoostClassifier; RandoomForestClassifier; LogisticRegression).

Download (726KB)

Copyright (c) 2025 Eco-Vector

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ПИ № ФС 77 - 86501 от 11.12.2023 г
СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ЭЛ № ФС 77 - 80653 от 15.03.2021 г
.