Технологии
AI и онкология: как программисты разработали систему, которая распознает рак

И помогает врачам в постановке диагноза


1 октября 2019



ИИ-решение Celsus, которое распознает рак молочной железы по рентгеновским снимкам, помогает врачам в постановке диагноза. Сервис был запущен Никитой Николаевым и Евгением Никитиным, основателями проекта кредитного скоринга FscoreLab. В команду также входят Артем Капнинский и Станислав Чернин. Пилот проекта уже внедрен в Калуге, на очереди — еще пять регионов.

Сейчас Celsus способен определять показатель «рак — не рак» с точностью 90%. Rusbase рассказывает о том, как технологии могут помочь выявить рак, когда подобные решения будут массово внедрены для пациентов и можно ли на них заработать.
Команда Celsus
Никита Николаев
Директор по маркетингу и PR, соучредитель, математик-экономист СПбГЭУ
Евгений Никитин
Технический директор, соучредитель, Ph.D. Candidate (New York University)
Артем Капнинский
Исполнительный директор, управление предприятием
Станислав Чернин
Директор по инвестициям, управление предприятием
«Нам стало интересно создать систему скрининга в России»
– Как вам пришла идея научить нейронные сети распознавать онкологию на снимках?

Артем:
Проектом Celsus мы стали заниматься три года назад. Все началось со знакомства с Никитой и Евгением, которые в то время делали решения для кредитного скоринга с применением ИИ — то есть работали с технологиями анализа данных для банков. У меня давно была мысль поработать с ИИ. Я спросил Никиту, как ИИ можно применить в медицине, так как до этого мы выполняли ряд программных решений для медсотрудников Калужской области.

Станислав: В 2016 с Запада пошел тренд на развитие скрининга с применением нейросетей: нам стало интересно создать что-то подобное в России. Онкологию выбрали, потому что по ней были большие объемы данных, с которыми можно было работать.

Никита: Мы с самого начала работали с врачами. Благодаря этому мы получали данные, которых нет у других компаний. Объясню: есть публичные датасеты, по которым обычно обучают нейронные сети. Но эти данные достаточно однобокие и их немного.

Артем: В диагностике онкологии очень часто применяют рентгеновские исследования легких и молочной железы. Отдельно стоит флюорография, но обнаружение онкологии в легких на ранних стадиях при этом виде исследований практически невозможно.

По данным Минздрава, при раннем обнаружении рака легких в 60% случаев можно добиться долгосрочной ремиссии. Если обнаружить рак молочной железы на ранней стадии, то в 95% можно добиться полной или долгосрочной ремиссии без удаления молочной железы.

  • За 2017 год в России выявлено 617 177 новых случаев злокачественных новообразований;
  • 21,1% (130 224) из них — рак молочной железы;
  • Среди онкологических заболеваний у женщин РМЖ занимает первое место по частоте постановки диагноза;
  • За последние пару лет число пациенток, у которых РМЖ диагностирован в I-II стадиях, достигло 70%. 10 лет назад показатель составлял 60%.

    * Статистика по России. Предоставлена Высшей школой онкологии
Фото: фотобанк «Фотодженика»
Сейчас РМЖ лечится успешнее, чем 10 лет назад. В 2017 году от него в России умерло 22098 женщин — это порядка 17% от числа диагностированных в 2017 году случаев. Важно понимать, что большая часть умерших — это пациентки, у которых диагноз был установлен 1-5 лет назад, а то и больше. То есть этот показатель скорее характеризует состояние медицины несколько лет назад. У пациенток, которым диагностировали РМЖ в 2018/19 годах, показатели смертности будут ниже.

Полина Шило
Химиотерапевт, выпускница Высшей школы онкологии, студентка Harvard Medical School

»
Артем: Если начинать отсчет старта проекта c даты нашего знакомства с ребятами, то на прототип ушло больше года. Это не было связано непосредственно с разработкой: около года длился подготовительный этап. Параллельно Никита и Евгений занимались своим проектом FscoreLab. Я работал в одной из IT-компаний Калужской области, параллельно искал единомышленника среди потенциальных инвесторов — и нашел. Это был Станислав. Он — учредитель и идеолог нескольких компаний в области разработки и интеграции IT-решений.

Станислав услышал меня и решил поддержать проект. Я познакомил его с парнями. После этого мы перешли в активную фазу. Сперва мы работали над Celsus в свободное время, в основном ночью. Вкладывали свои личные ресурсы.

Евгений и Никита начали работу над первой версией ядра, мы со Станиславом включились в организацию процесса сбора данных и подготовки их для обучения. И в 2018 году, через два года после идеи, был готов первый прототип.
MVP обучался на общедоступных данных из зарубежных баз. Задачей прототипа была не максимальная точность выявления патологии, а разработка структуры самого аналитического ядра, алгоритма анализа и т.д. Параллельно работе над прототипом готовили объемный датасет на реальных снимках, размечали все необходимые объекты, нужные для более точного чтения снимков в дальнейшем.

Прототип разрабатывали без привлечения сторонних разработчиков до первых положительных подтвержденных результатов.

Для тестирования ядра мы привлекли сторонних тестировщиков, которые согласились сотрудничать бесплатно. Именно тогда, на отдельной выборке пациентов, была продемонстрирована точность выявления патологии 93% процента. Кроме того, из здоровых были выделены два пациента, у которых система выявила наличие патологии. Эксперты подтвердили этот результат.
После этого Станислав решил серьезно вложиться в проект. Общая сумма инвестиций — более 20 млн рублей личных средств. Основные инвестиции направляются в создание инфраструктуры разработки, профессиональной команды, на профильных специалистов-консультантов.
Еще мы зарегистрировали товарные знаки на продукт — «Цельс» и Celsus, получили патент на нашу систему анализа рентгенографических снимков, что подтверждает уникальность продукта, и подали заявку на международный патент.
Фото: Sharon McCutcheon/Unsplash
– При разработке прототипа вы ориентировались на зарубежный рынок или создавали все с нуля?
Артем: На старте мы изучали рынки. Я — российский, Евгений и Никита — зарубежный. Тогда в России не было информации о проектах в этой нише. Единственное, что было на слуху, это работа в направлении AI одного из подразделений IBM Watson. Сейчас многие западные производители рентгеновского оборудования заявляют, что в их программах есть ИИ-решения, но они работают только в своей экосистеме. И пока громко о себе не говорят.

Другие российские компании в нашем направлении стали активно работать после майских указов президента, когда он обозначил AI как одно из самых перспективных направлений.


– Сложно ли было договориться с врачами о предоставлении данных и внедрении пилота?
Артем:
На момент первого диалога с Калужским онкологическим диспансером у нас уже был готовый прототип. У решения были достаточно высокие показатели — 91% точности по показателю «есть патология/нет патологии». В данном случае уже анализировались снимки пациентов с поставленным диагнозом, эти пациенты не участвовали в обучении прототипа.

Понимая перспективы использования ИИ в медицине, проблемы и сложности при скрининге онкологических заболеваний, нас поддержали врачи онкоцентра, губернатор и Минздрав Калужской области. Помогло наличие портфеля серьезных реализованных проектов. Я и Станислав давно работаем в области IT. У нас в портфолио есть разработка как банальных сайтов, так и собственной информационной системы и ее внедрение в НМТК Микрохирургии глаза им.Федорова в Калуге, организация доработки и внедрения медицинской информационной системы РМИС в медицинские организации Калужской области на региональном уровне, опыт работы с крупными банками. Все это позволило заработать серьезную репутацию. Нам поверили и дали карт-бланш.
Как все работает
Celsus может применяться по различным сценариям: начиная с использования на рабочем места врача при приеме пациента заканчивая автоматической потоковой обработкой поступающих данных.

Сейчас один из важных сценариев применения — массовый скрининг, который проводится в регионах, например, на передвижных маммографах или при проведении диспансеризации.

Анализируя изображения, Celsus находит и классифицирует патологические объекты (новообразования), кальцинаты, плотность ткани и иные параметры. А дальше присваивает класс по шкале Bi-RADS (европейский стандарт чтения и интерпретации снимков молочной железы. — Прим.), ранжирует итоговый список пациентов от наибольшего к меньшему по риску наличия патологии. Врач получает информацию о том, снимки какого пациента необходимо исследовать в первую очередь или отправить в онкоцентр в приоритетном порядке.

По словам создателей, Celsus готов к промышленной эксплуатации. Вышел первый релиз блока по выявлению патологий при проведении флюорографии. Сейчас команда работает над релизом по выявлению рака легких при рентгенографических исследованиях. В планах — анализировать данные компьютерной томографии (современный метод рентгеновского послойного исследования, более точный, чем рентгенография. — Прим.) и морфологии (исследования тканей организма, полученных путем пункции, биопсии или хирургически, на предмет наличия раковых клеток; самый точный метод подтверждения диагноза. — Прим.).
Как сегодня выявляют РМЖ. Комментирует Полина Шило (разверните, чтобы прочитать)
Опухоли молочной железы обычно выявляются либо при проведении скрининга (маммографии) либо при самостоятельном прощупывании (и тогда женщина идет к врачу). Маммография или УЗИ позволяют понять, насколько образование в молочной железе «подозрительно» — для этого есть шкала Bi-RADS. Если присваивается категория 4-5, то нужно выполнить биопсию, чтобы понять, рак это или не рак.

Диагностика может занимать неделю и больше: это зависит от конкретного учреждения. Процесс упирается в выполнение биопсии и гистологического исследования — без морфологической верификации диагноза начать лечение невозможно. Остро стоит проблема ложноположительных результатов, ненужных биопсий.
Celsus «всевидящий»
Никита: В нашей системе есть визуальный интерфейс, который контактирует с врачом. Врач должен уметь подгрузить туда снимки в виде DICOM-файлов (медицинский отраслевой стандарт для работы с изображениями, а также документами пациентов. — Прим.) на диагностику. Врач коммуницирует с системой через веб-интерфейс. Как только подгружаются снимки, к нейронной сети отправляется запрос и она выдает результат детекции.

Сперва программа показывала только результат в разрезе «рак — не рак». Сейчас она еще и отмечает объекты, на которые стоит обратить внимание врачу.

Celsus видит не только онкологические, но и другие изменения — в плотности ткани, а также наличие доброкачественных или злокачественных кальцинатов, фиброзно-кистозную мастопатию и другие новообразования, которые могут присутствовать на снимке. Для каждого вида объекта или показателя определяется вероятность того, что объект является этим объектом. Исходя из идентифицированных объектов, модель выдает заключение по классификации Bi-RADS.
Читайте по теме: AI в искусстве
Артем: Это шкала, которая применяется рентгенологами. Кроме того, Celsus классифицирует и относит пациентов к тому или иному уровню Bi-RADS от 0 до 6. Например, система говорит: «Эти снимки — Bi-RADS 4: пациенту необходимо дополнительное обследование». И после обследования доктор уже ставит конечный диагноз.

Никита: Celsus не сжимает файлы и не конвертирует их в другие форматы, а работает с исходным изображением. Помимо этого, система удаляет посторонние артефакты, засветы, которые могут присутствовать в файлах.

Станислав: По сути, нам удалось создать полноценный просмотрщик DICOM-файлов непосредственно в системе, и он может стать отдельным продуктом и использоваться рентгенологами.

Никита: Одно из отличий идентификации объектов в медицине от других отраслей — тяжеловесные данные, используются файлы в высоком разрешении. Один DICOM-файл весит несколько десятков мегабайтов. Их разрешение нельзя уменьшать — это сильно портит качество прогноза. У нас обработка четырех снимков (левая грудь, правая и две проекции. — Прим.) длится немногим менее минуты вместе с загрузкой.

Артем: Окончательный диагноз ставит врач-онколог только после лабораторного подтверждения или опровержения подозрения рентгенолога.
Celsus ни в коем случае не замена врачу. Это помощник, который позволит компенсировать отсутствие компетенций специалистов первичного звена, отсутствие кадров как таковых, минимизировать человеческий фактор, ускорить постановку диагноза, снизить риск пропуска незаметного человеческому глазу изменения. С развитием ИИ и постоянным дообучением системы можно достичь очень высоких результатов.
Буквально на днях мы выпустили первый релиз по анализу флюорографических снимков. Показатели высокие для прототипа (какие именно — Артем не раскрывает. — Прим.). В небольшом регионе в год делается порядка 1,5 млн исследований, которые должны просматривать два врача, но остается большая вероятность ошибки. По статистике, при проведении скрининга флюорографии с патологией вероятность ошибки составляет порядка 5% от общего числа пациентов, то есть из 1,5 млн это 75 тысяч человек с неверным заключением. Применение Celsus в флюорографии в сотни раз снизит нагрузку на врача и вероятность пропустить патологию.
Фото: фотобанк «Фотодженика»
Точность Celsus
– Насколько точна программа?
Евгений:
Существуют разные параметры точности. Представьте ситуацию, когда большинство обследуемых — пусть будет более 90% — здоровые. Это значит, что случайная модель, диагностирующая всех пациентов как здоровых, будет иметь точность более 90%, но практическая ценность такой системы нулевая. Поэтому стоит аккуратно подходить к цифрам. Мы используем целый набор метрик для оценки качества модели.

Никита: Если говорить о показателе «рак — не рак», то на данный момент метрика точности AUC на на публичном датасете InBreast (маммографическая база данных от Центра молочной железы в Порту. — Прим.) составляет 90% — то есть наше решение распознает онкологию с точностью 90%

Но определять математическую точность — не совсем правильный подход. В работе участвуют разные модели и разные архитектуры нейронных сетей, которые решают задачу по чтению и интерпретации снимков. И именно совокупность полученных данных является результатом работы системы.

Стоит корректнее ставить вопрос о приоритетах. Что для врача важнее? Не пропускать патологию или меньше отправлять на дополнительные обследования пациентов? Исходя из так называемого «порога» формируются итоговые результаты модели и пропорции между разными видами верных предсказаний и ошибок.

По последним тестам (на региональных данных по пациентам, которым поставлен диагноз. — Прим.) в работе Celsus были зафиксированы такие показатели: обнаруженных истинно положительных (с патологией) пациентов 99%. При этом ложно положительных результатов (обнаружение патологии при ее отсутствии — в таком случае пациент направляется на дополнительное обследование. — Прим.) составило 30%.
Почему на разных базах данных разная точность?
Артем: Точность системы всегда будет зависеть от популяции — баланса больных/не больных и выбранных целей. К примеру, на текущий момент наша модель корректно классифицирует 99% больных пациентов, потому что намного важнее не пропустить больного пациента, чем верно определить здорового. Если бы мы хотели пропускать не 1% больных, а, например, 3% — показатель «ложно больных», которых система отправляет на допобследование, был бы меньше.

К тому же точность системы варьируется от качества данных: наша система намного лучше работает на высококачественных цифровых снимках.
Почему пока такие решения не внедряются массово
– Вы говорили, что внедрение такой системы невозможно без помощи государства…
Станислав:
Во-первых, системы вроде нашей должны быть зарегистрированы в Росздравнадзоре, пройти клинические испытания. Регистрация проводится по регламентирующим документам и стандартам, которых для решений ИИ в настоящее время нет. Эти стандарты должно утвердить государство.

Во-вторых, датасеты и большие данные находятся в государственном контуре, так как это персональные данные специальной категории. Согласно плану цифрового развития в медицине, в каждом регионе будет или уже есть цифровой контур, который объединяет все медучреждения и данные пациентов от них. Данные оттуда поступают уже в федеральный центр. То есть в идеале это будет экосреда медицинских данных.

– Пилот уже внедрен в Калуге. Расскажите об итогах?
Артем:
В Калуге наша система используется врачами-рентгенологами как второе чтение. К сожалению, оборудование не позволяет врачам использовать его массово из-за отсутствия во всех медицинских организациях цифровых маммографов или цифровых рентгеновских аппаратов. В подавляющем большинстве имеется только аналоговое оборудование, которое не подходит для нашего решения. Дело в том, что на нем используется рентгеновская пленка. И качество изображений, которое получается на таком оборудовании, значительно ниже, чем на цифровом. Снимки с аналогового менее информативные для врачей и их нельзя использовать для качественной диагностики с использованием ИИ.

В Брянской, Тамбовской, Курской, Липецкой, Тверской и других областях сейчас запускаются пилоты. Там Celsus будут использовать на рабочем месте индивидуально и при массовом скрининге на передвижных маммографов. Конкретных отзывов врачей пока нет — для этого нужно примерно 1,5 года.

Станислав: Мы стартовали только в марте 2019 года. У медицинских пилотов более долгий срок цикла оценки, чем в других сферах.

Пока что ошибки мы не можем исправить сразу: если врач не согласен с системой и говорит нам «Тут неверно», нам нужно еще время, чтобы отследить пациента и убедиться точно, не ошибся ли сам врач. Плюс, всегда будут конфликтные случаи, поэтому мы собираемся выйти на московский уровень экспертизы, чтобы разбирать вместе со специалистами спорные моменты.

Артем: В регионах нет понимания, как такие решения можно запускать, чтобы использовать их как второе мнение. Пока стандартов нет: мы подстраиваемся под каждый регион и его правила, на это уходит время. Вторая проблема: оборудование на местах настроено по-разному, хотя есть международные стандарты и требования к снимкам. Это тоже тормозит работу.
«Вложили более 20 млн рублей»
— Как планируете окупать затраты?
Станислав:
Вариантов монетизации несколько, все они завязаны на цифровой контур медицины — единую базу данных на регион, в любое время доступную врачу. Наша система может сразу вставлять при диагностике информацию в документы в общую базу. Или это может работать как отдельные АРМы (автоматизированные рабочие места рентгенологов. — Прим.) в кабинетах. Тогда это будет реализовано через контрактные продажи по закупкам. Это b2g-модель. Плюс, частный сектор. Третий путь — партнерство с производителями маммографов, рентген-аппаратов и другого оборудования, чтобы система вшивалась как допуслуга к аппарату. Для монетизации мы должны получить итоги от пилотов в регионах.

Мы изучали рынок — конкуренции в направлении выявления рака молочной железы именно в маммографии пока не обнаружили. Это достаточно сложное направление, которое мы выбрали осознанно.

Возможно, есть еще кто-то, кто, как и мы, тихо работает над продуктом. Но я общался с ребятами с хакатонов и из разных российских акселераторов. Их проекты стоят на месте — либо потому что они не работают с врачами на реальных дата-сетах, либо потому что у них нет финансирования, чтобы выйти на уровень выше.

»
Галина Корженкова
Профессор кафедры рентгенологии и радиологии РМАПО*;
старший сотрудник НМИЦ онкологии им. Н.Н. Блохина
Технологии, которые сегодня умеют распознавать онкологию — не новость. Я встречаю такие проекты из США, Европы и Азии в течение нескольких лет на международных выставках и конференциях. Могу сказать, что знаю где-то пять компаний, которые этим занимаются.

Компьютерная обработка изображений в медицине уже есть, у искусственного интеллекта другая задача — от него просят конкретные решения, а не просто указать опухоль на маммограмме.

Я разговаривала с программистами и онкологами, которые представляли решения ИИ. Во всех странах, где это есть, решения находятся в стадии разработки и апробации. Чтобы внедрить технологию массово, нужно, чтобы ИИ показывал более точные решения, чем врач-эксперт.

Стадия апробации технологии на специалистах обязательно должна быть. Если ИИ будет справляться не хуже специалиста, то можно одного из докторов заменить машиной. На конференциях показывали данные сравнения ИИ и эксперта: пока что ИИ проигрывает. Уровень точности зависит от того, на каких базах обучается ИИ и насколько они подтверждены гистологией. Иногда врачу нужно установить опухоль в несколько миллиметров или микрон. Сможет ли это сделать машина?

Я слежу за проектами в Калужской и Кемеровской областях по цифровому скринингу в маммографии. Это стандартная скрининговая технология, при которой снимки просматривают два независимых врача на удаленном доступе. Эти врачи прошли курс, сдали экзамен и имеют соответствующую квалификацию. Если их мнения не совпадают, то снимки смотрит третий эксперт. Это стандартная скрининговая процедура во всем мире. Только мы это делаем с цифровой обработкой данных. Это решение работает два года, у нас есть готовая технология, и на этом этапе можно подключить Celsus и посмотреть, будут ли совпадать мнения машины и врачей. Мне самой как специалисту это было бы очень интересно. Но пока никто из российских разработчиков к нам не обращался. Если проектам интересно сотрудничать — можно написать мне напрямую (координаты есть в редакции Rusbase. — Прим.) или в НМИЦ.

Чтобы выходить на законодательный уровень для внедрения технологии, нужно, опять же, чтобы она показала результаты.

Я вижу применение технологии, подобной Celsus, в обучающих программах. У нас много опытных специалистов, которым нужно получать практику и смотреть изображения. И благодаря искусственному интеллекту они могут этому научиться.

* РМАПО — российская медицинская академия непрерывного профессионального образования
Полина Шило
Химиотерапевт, выпускница Высшей школы онкологии, студентка Harvard Medical School
В подобных проектах я вижу огромный потенциал и, в то же время, большое количество этических и юридических проблем.

Вот есть, к примеру, беспилотные Tesla. Если такая машина без водителя попадает в аварию — кто виноват? На кого подавать в суд за ошибку? В использовании нейросетей для диагностики заболеваний кроются те же проблемы: кто ответственен за результат диагностики? Компания? Врач? Пока нет четких способов урегулировать эти моменты на законодательном уровне, ответственность за интерпретацию снимков по-прежнему будет нести врач, даже если нейросеть что-то ему подскажет.

Мне кажется, что чем меньше будет места субъективности в диагностической и клинической тактике, тем лучше. Такие проекты — это как раз отличный способ борьбы с субъективностью. В то же время я понимаю, что обучить нейросеть так, чтобы она превосходила человека, — это очень трудоемкий и сложный процесс. И доверие к проекту может возникнуть только после публикации крупных валидационных исследований (которые подтверждают, что разработка приносит конкретную измеримую пользу пациентам — например, приводит к увеличению выживаемости, позволяет избежать лишних биопсий при РМЖ и т.д. — Прим.). Очень важно опробовать разработку на больших выборках, чтобы посмотреть, как она применима в реальной жизни. И сравнить эффективность этой методики с ранее существующим подходом

«
© Rusbase, 2019
Автор: Екатерина Гаранина
Обложка: фотобанк «Фотодженика», Komsan Loonprom / Shutterstock.



Екатерина Гаранина