Личные истории в науке о данных

Использование многозадачного и ансамблевого обучения для прогнозирования когнитивных функций при болезни Альцгеймера

Осознание влияния, которое я могу оказать на машинное обучение благодаря когнитивной науке и публикации моей первой научной статьи.

В одной из своих предыдущих статей я подробно описал свой опыт перехода от когнитивной науки к машинному обучению и синдром самозванца, который насмехался надо мной. В той статье я упомянул:

«Идея начала медленно распутываться — возможно, мой опыт [в когнитивной науке] обеспечил гораздо более прочную основу, чем я изначально ожидал».

В этой статье я поделюсь конкретным примером того, как мой опыт работы с когнитивными науками позволил мне 1) разработать инновационные подходы к моделированию расстройства, которое имеет личное значение для меня в области нейробиологии, и 2) установить уникальные связи, которые часто упускают из виду. в обычных дискуссиях.

Благодаря этому опыту мне стало очевидно, что область глубокого обучения со всем ее потенциалом все еще находится в стадии становления, служа напоминанием об инклюзивных возможностях, которые она предлагает людям как из традиционных, так и из нетрадиционных слоев общества.

Лаборатория мозговых сетей

Оставшееся чувство, преследовавшее меня после получения степени бакалавра, заключалось в том, что у меня есть приличная теоретическая база, но не хватает практического понимания для эффективного применения этих инструментов. Я представил идеальный сценарий, в котором я мог бы применить эти инструменты в области неврологии или психического здоровья.

Следовательно, я был в восторге, когда появилась возможность подать заявку на участие в Инициативе Уиклоу по исследованиям искусственного интеллекта в медицине, что означало, что я обязуюсь работать над научно-ориентированным практикумом в моей программе для выпускников, посвященной использованию моделей искусственного интеллекта. продвигать […] медицинские исследования в различных областях, включая онкологию, кардиологию и неврологию».

Во время программы меня приняли 🎉 и в итоге я стал работать в Лаборатории мозговых сетей в UCSF. Лаборатория сосредоточена на:

«Понимание механизмов здорового и больного мозга путем применения вычислительных инструментов к данным нейровизуализации».

Я с нетерпением ждал дальнейших подробностей о моей практике; Во мне кипело волнение, чтобы начать преодолевать этот разрыв между теорией и практикой. Наконец, настал долгожданный момент, когда я получил свое задание.

Предсказать когнитивный балл для пациентов с болезнью Альцгеймера

Задача:предсказать когнитивный показатель для пациентов с болезнью Альцгеймера
Проблема:у меня не было абсолютно никакого опыта с компьютерным зрением.

Мое первое впечатление было: «Как я могу способствовать этому?». Естественно, голоса страха и синдрома самозванца хотели заявить о себе. известен. Кроме того, мой опыт глубокого обучения был ограниченным — более или менее незначительным — и вдобавок ко всему, эта должность была под угрозой увольнения из-за сложности задачи.

Однако то, что у меня действительно было, было топливом для целостного понимания болезни Альцгеймера, искреннего сочувствия к тем, кто пострадал, и стремления внести свой вклад, используя вычислительные инструменты, которые у нас есть. Кроме того, разрыв между теорией и практикой подпитывал мою решимость вносить свой вклад и расти.

Образ жизни коррелирует с болезнью Альцгеймера

Мое второе впечатление заключалось в том, что полагаться только на данные МРТ для прогнозирования когнитивной оценки казалось странным, учитывая известные демографические, генетические и образ жизни корреляции с болезнью Альцгеймера.

В исследовании Связь между кишечным микробиомом, старением, современным образом жизни и болезнью Альцгеймера авторы подчеркивают, что значительные [...] изменения кишечного микробиома были зарегистрированы у пациентов с болезнью Альцгеймера […] кишечный микробиом очень чувствителен к негативным внешним аспектам образа жизни, таким как диета, недосыпание, нарушение циркадного ритма, хронический шум и малоподвижный образ жизни, которые также считаются важными факторами риска для развитие спорадической болезни Альцгеймера.

Однако я знал, что мне нужно сосредоточиться на своем задании; тем не менее, любопытство поглотило меня и побудило меня узнать о возможности получения доступа к демографическим и клиническим данным на всякий случай… *потирает руки*

Мы вернемся к этому позже.

Измерение когнитивного функционирования

Оценка ADAS Cog-11

В то же время я продолжал мозговой штурм подходов к моделированию, используя только данные МРТ. Однако вам может быть интересно, как мы определяем «когнитивное функционирование»? Другими словами, что мы стремимся предсказать? Какова наша целевая метка?

Мы измеряем когнитивную функцию с помощью ADAS-Cog-11 — показателя, используемого для оценки ухудшения памяти, речи и навыков у людей, страдающих болезнью Альцгеймера. Согласно Википедии, это одна из наиболее широко используемых когнитивных шкал […] и считается «золотым стандартом для оценки лечения деменции».

Оценка ADAS-Cog-11 выводится из следующих одиннадцати когнитивных задач:

С подробным описанием заданий вы можете ознакомиться здесь.

Простая сверточная нейронная сеть

Чтобы начать эксперименты, мы обучили базовую модель сверточной нейронной сети (CNN) на данных МРТ для прогнозирования когнитивной оценки.

Эта простая CNN состояла из следующих слоев: первый сверточный слой, объединяющий слой, второй сверточный слой, объединяющий слой, двухслойная полносвязная нейронная сеть и слой регрессии.

Результаты были ничем не примечательны: перекрестная проверка R2 находилась в диапазоне от 0,33 до 0,52, а тестовая R2 составляла 0,47. Тем не менее, учитывая скромные ожидания от этой простой модели, мы удовлетворились установлением исходного уровня, над улучшением которого мы можем работать.

Многозадачное обучение и захват структурного контекста мозга

Следующим шагом было исследование структурных предикторов деменции. Это привело к появлению ряда публикаций, в которых подчеркивается независимая связь между объемами серого и белого вещества и тяжестью деменции.

По данным Стаут и др.,

«Количественные магнитно-резонансные методы предоставили убедительные доказательства того, что объем коркового серого вещества, который может отражать атрофию, и аномальный объем белого вещества независимо связаны с тяжестью деменции при вероятной болезни Альцгеймера: более низкий объем серого вещества и более высокие аномальные объемы белого вещества связаны с более тяжелой деменцией. ».

Отсюда возникла теория: если модель сможет собирать информацию об объемах серого и белого вещества, она должна повысить прогностическую способность.

Но как мы можем это сделать?

Краткий ответ: ✨ многозадачное обучение ✨

«Многозадачное обучение — это область машинного обучения, в которой одновременно решаются несколько учебных задач, при этом используются сходства и различия между задачами […] с использованием информации о предметной области, содержащейся в обучающих сигналах связанные задачи […] то, что изучается для каждой задачи, может помочь лучше изучить другие задачи»

— Многозадачное обучение, 2021, 6 июля. В Википедии

Интуиция: если наша модель предсказывает когнитивный показатель и одновременно учится сегментировать входное МРТ-сканирование на белое, серое вещество и спинномозговую жидкость, эти взаимосвязанные задачи будут извлекать выгоду из информации об общей области и повышать производительность для каждой отдельной задачи.

Архитектура U-Net

Для этой модели мы использовали архитектуру U-Net:

«Архитектура, [которая] основана на активном использовании увеличения данных, […] состоит из сокращающегося пути для захвата контекста и симметричного расширяющегося пути, который обеспечивает точную локализацию […] такая сеть может быть обучена от начала до конца от очень мало изображений и превосходит предыдущий лучший метод ( сверточная сеть со скользящим окном ) »- Ronneberger et al., 2015

Это была привлекательная архитектура для экспериментов, поскольку мы можем использовать очень мало изображений для достижения лучшей производительности, чем предыдущие методы, если мы применяем методы увеличения данных.

Что такое методы увеличения данных для медицинской визуализации?

Увеличение данных — это процесс применения рандомизированных изменений (например, перемещения, поворота, отражения, растяжения, обрезки и т. д.) к входным изображениям с целью увеличения вариативности. Этот процесс позволяет нашей модели лучше обобщать, внося незначительные сдвиги во входные данные, пока измененные изображения остаются в пределах области возможных входов.

Эти методы также служат ценным решением проблемы нехватки медицинской визуализации. Получение достаточно больших наборов данных медицинских изображений является серьезной проблемой по двум основным причинам: 1) ручная аннотация медицинских сканов требует исключительно много времени и 2) обмен клиническими данными обременен все более строгими законами о конфиденциальности пациентов.

Эффективность различных органов и модальностей

Обычной практикой является экспериментирование с различными методами увеличения данных, чтобы увидеть, какие из них лучше всего подходят для вашей конкретной задачи. Тем не менее, способ управлять процессом исследования, особенно в медицинской визуализации, состоит в том, чтобы понять подходящие и наиболее эффективные методы аугментации для различных комбинаций органов/структур, модальностей и задач. Здесь «подходящий» относится к обеспечению того, чтобы дополненные данные содержали действительные примеры во входном пространстве.

Например, упругие деформации обычно подходят для органов, обладающих присущей им эластичностью или деформируемостью. Мозговая ткань является отличным примером этого из-за замечательной способности мозга претерпевать структурные и функциональные изменения в ответ на опыт, обучение и изменения окружающей среды, также известной как нейропластичность.

Сантьяго Рамон-и-Кахаль, уважаемая фигура, известная как отец современной неврологии, однажды провозгласил:

«Любой человек мог бы, если бы захотел, стать скульптором своего собственного мозга».

— Сантьяго Рамон-и-Кахаль

Однако кости обладают ограниченной деформируемостью, а кровеносные сосуды являются жесткими структурами, поэтому применение упругих деформаций может неточно отражать реалистичные вариации или сохранять анатомическую целостность.

Кроме того, масштабирование (масштабирование изображения для выделения определенной области) часто хорошо подходит для рентгеновских изображений, поскольку они обычно охватывают более широкое поле зрения. Однако для МРТ, которые уже имеют более узкое поле зрения и концентрируются на определенных областях интереса, масштабирование может непреднамеренно исключить важную контекстную информацию, что сделает его менее подходящим в качестве метода дополнения для МРТ.

Существует невероятно полный обзор литературы по методам увеличения данных для медицинской визуализации здесь. Авторы подчеркивают этот момент:

«В зависимости от характера ввода и визуальной задачи разные стратегии увеличения данных, вероятно, будут работать по-разному. По этой причине можно предположить, что медицинская визуализация требует определенных стратегий увеличения, которые генерируют правдоподобные выборки данных и обеспечивают эффективную регуляризацию глубоких нейронных сетей».

Визуализация архитектуры многозадачного обучения

Ниже я представил визуальное представление многозадачной модели. В самой нижней части архитектуры U-Net мы включили блок регрессии. В этом блоке все пиксели выравниваются, а затем проходят через линейный слой, в результате чего результат представляет собой когнитивную оценку.

U-Net и многозадачность обучения

Напомним, что первоначально мы использовали простую базовую линию CNN, что дало значения R2 перекрестной проверки в диапазоне от 0,33 до 0,52, с R2 тестирования 0,47.

Однако с внедрением многозадачной модели мы стали свидетелями заметных улучшений:

  • Перекрестная проверка R2: расширен до диапазона от 0,41 до 0,69.
  • Тестирование R2: улучшено до 0,57

Также стоит отметить, что мы разработали базовую модель для задачи сегментации с использованием архитектуры U-Net, которая продемонстрировала точность 93,7%.

Примечательно, что задача сегментации также получила прирост производительности, повысив ее точность с 93,7% до 97,27% 🎉

Многозадачная модель, по-видимому, превзошла современное состояние сегментации мозга в то время, как показано ниже:

А как насчет демографических и генетических особенностей?

Но как насчет демографических и генетических особенностей, к которым я обещал вернуться?

Итак, мы получили доступ к данным! *аплодисменты*

Первым шагом было обучение другой базовой модели только на табличных функциях. В конечном итоге мы остановились на регрессоре повышения градиента на основе гистограммы (регрессор HGB) с функцией потерь Пуассона, который дал удивительно приличные результаты.

  • Перекрестная проверка R2: в диапазоне от 0,56 до 0,63.
  • Тестирование R2: 0,51

Интеграция табличных данных в многозадачную модель ансамбля

В последнем эксперименте мы провели мозговой штурм, чтобы эффективно интегрировать эти функции в нашу модель.

Интеграция табличных данных и данных изображения была сложной задачей из-за существенной разницы в количестве входных данных между данными изображения (где каждый воксель считается входом) и набором табличных данных (где каждый признак представлен как одно значение). Равноценное рассмотрение всех признаков приводило к уменьшению значимости демографических и генетических факторов риска в общей модели.

Чтобы решить эту проблему, мы разработали отдельную модель для табличных данных с использованием регрессора HGB. Затем мы применили метод ансамбля средневзвешенных значений, чтобы объединить прогнозы регрессора HGB и многозадачной модели. Веса, присвоенные каждой модели, основаны на их производительности и надежности, присваивая более высокие веса более точной или надежной модели. Этот метод ансамбля эффективно оптимизировал вклад каждой модели, назначая соответствующие веса.

Ниже вы можете увидеть визуализацию этого ансамблевого подхода.

Окончательная производительность модели

Так как же этот комплексный многозадачный подход сравнивается с предыдущими экспериментами?

*барабанная дробь*

Производительность задачи регрессии:

  • Перекрестная проверка R2: 0,73–0,78
  • Тестирование R2: 0,67

Выполнение задачи сегментации:

  • Точность: 98,12%

Подобно заметному улучшению производительности, наблюдаемому при многозадачном обучении, включение демографических характеристик и генетических факторов риска с помощью ансамблевого метода не только существенно повысило производительность задачи регрессии, но и еще больше повысило производительность задачи сегментации. Это наглядно продемонстрировало возможности использования нескольких источников данных и использования их синергетического потенциала.

Заключительные замечания

Возможность углубиться в изучение неврологии и машинного обучения, особенно в связи с болезнью Альцгеймера, и осознание того, что мой опыт позволил мне связать концепции между различными областями, изменила меня. С тех пор, как я испытал на себе существенные улучшения, достигнутые в результате согласования текущих исследований в области нейробиологии с концепциями машинного обучения, я стал больше ценить возможности интеграции различных источников данных и применения архитектур моделей на основе предметной области.

Я надеюсь, что это исследование послужило источником вдохновения для людей, которые:

  • Перешли от когнитивной науки к машинному обучению
  • Подпитываются приобретением и применением методов лечения неврологических расстройств.
  • Интересуетесь компьютерным зрением в медицинской сфере.

Пожалуйста, не стесняйтесь обращаться с любыми вопросами, и я надеюсь, что это было так же волнующе для вас, как и для меня!

Статьи, использованные для рисунка II:

  1. Сочетание элементов здорового образа жизни может существенно уменьшить болезнь Альцгеймера
  2. Связь между микробиомом кишечника, старением, современным образом жизни и болезнью Альцгеймера
  3. Когнитивный резерв и образ жизни: на пути к доклинической болезни Альцгеймера