Вдохновленный общедоступными предпечатными исследованиями COVID-19, я хотел применить некоторые навыки анализа данных и посмотреть, появляются ли какие-либо тенденции. Было несколько сюрпризов.

Какой бы ужасной ни была эпидемия коронавируса, разворачивающаяся в настоящее время, интересно наблюдать, как быстро академические и исследовательские сообщества по всему миру начали понимать этот вирус и его потенциальные последствия.

Из-за этого быстро выходит множество интересных предпечатных научных работ. Я бы посоветовал вам с осторожностью читать препринты, так как сделанные утверждения не подтверждены, но я хотел увидеть, есть ли какие-либо заметные закономерности в темах и выводах этих документов. обсуждаем.

Итак, я вручную соскребал разделы с результатами и инсайтами этих предпечатных документов на основе списка из Информационного центра о коронавирусе нового романа Elsevier и, используя популярную библиотеку Gensim, провел некоторое тематическое моделирование с использованием скрытого распределения Дирихле (LDA). Я обязательно добавлю ссылку GitHub link внизу этого сообщения, если вы хотите попробовать это сами.

После обучения нескольких моделей LDA на выборке из 75 препринтов 32 темы оказались оптимальными (может быть, 20 подойдут) со значением когерентности 0,54. Затем я выбрал наиболее известные и интересные тематические кластеры ключевых слов, сделал вывод о центральном выводе и нашел наиболее репрезентативную статью для каждой из них.

Этот пост ни в коем случае не является научным обзором, а скорее небольшим экспериментом, которым я хотел бы поделиться. Возможно, мы сможем использовать подобные инструменты, чтобы быстрее определять закономерности из нескольких источников и способствовать сотрудничеству.

9 выдающихся тем о коронавирусе и их наиболее характерные статьи

1. КТ кажется многообещающей для скрининга COVID-19

Ключевые слова: пневмония, подтверждение, доказательства, летальность, Пекин, фокус, крупный, прогноз, усилия, распространение

Хотя вирус продемонстрировал, что он очень заразен и вызывает спонтанную инфекцию в обоих легких, клинические данные показывают, что вирусная пневмония Ухань имеет низкий уровень смертности. КТ играет ключевую роль в скрининге, диагностике, плане изоляции, лечении, ведении или прогнозировании пациентов с уханьской вирусной пневмонией.

Наиболее представительный документ: Клинические и визуальные доказательства вирусной пневмонии в Ухане: крупномасштабное проспективное когортное исследование

Процент документов с темой: 8%

2. Использование искусственного интеллекта для скрининга пациентов с COVID-19

Ключевые слова: клинический, диагноз, значимый, высоко, характеристика, симптом, цель, индекс, эозинофил, поступление

Используя технологию искусственного интеллекта для проверки пациентов на такие атрибуты, как лейкоциты, количество эозинофилов, уровень эозинофилов, РНК нового коронавируса 2019 года (2019n-CoV) и амилоид-A, эта команда разработала более быстрый метод диагностики COVID-19 с улучшенной частотой подтвержденных диагнозов для клинических случаев. использовать.

Наиболее представительный доклад: Применение искусственного интеллекта в диагностике и прогнозировании COVID-19

Процент документов с темой: 7%

3. Страны не готовы к 2019-нКоВ.

Ключевые слова: предотвращение, здоровье, потенциал, эффективно, чрезвычайная ситуация, управление, укрепление, поддержка, готовность, существует

Страны сильно различаются по своей способности предотвращать, обнаруживать и контролировать вспышки, что подтверждается глобальными различиями в способности систем здравоохранения управлять чрезвычайными ситуациями в области здравоохранения. Нам необходимо усилить глобальную готовность к сдерживанию существующих вспышек, включая продолжающееся международное распространение 2019-нКоВ.

Наиболее представительный документ: Обзор возможностей обеспечения безопасности в области здравоохранения в свете вспышки 2019-нКоВ - возможности для усиления выполнения ММСП (2005 г.)

Процент документов с темой: 7%

4. Бессонница медицинского персонала, психологические проблемы и COVID-19

Ключевые слова: психологический, фактор, находка, болезнь, социальная, изоляция, персонал, идентификация, депрессия, пребывание.

Исследование показало, что более трети медицинского персонала страдали от симптомов бессонницы во время вспышки COVID-19. К связанным факторам относятся уровень образования, изоляция, социально-психологические опасения по поводу вспышки COVID-19 и профессия врача. Вмешательство медперсонала при бессоннице потребовалось с учетом различных социально-психологических факторов.

Наиболее представительный документ: Исследование бессонницы и связанных с ней социально-психологических факторов среди медицинского персонала, причастного к вспышке нового коронавирусного заболевания в 2019 году

Процент документов с темой: 7%

5. Следует ли нам использовать сильные профилактические меры для борьбы с эпидемией?

Ключевые слова: мера, профилактика, город, сильный, строгий, индивидуальный, ожидать, поддерживать, разоблачать, остановить

Поощряются решительные меры профилактики до тех пор, пока эпидемия коронавируса не закончится. Подтвержденные инфицированные люди в других странах и за рубежом должны последовать примеру Китая и немедленно принять решительные меры. Ранее принятые решительные меры профилактики могли бы эффективно остановить независимые, самоподдерживающиеся вспышки в других городах по всему миру.

Наиболее представительный доклад: Моделирование инфицированного населения и тенденции распространения вируса 2019-nCov в соответствии с другой политикой с помощью модели EIR

Процент документов с темой: 7%

6. Новый экспресс-генетический диагностический тест на COVID-19

Ключевые слова: тест, pcr, образец, rt, лампа, диагностика, обратный, нуклеиновый, мазок, экран.

Количественная ПЦР с обратной транскрипцией (qRT-PCR) в настоящее время является стандартом для обнаружения COVID-19; тем не менее, изотермическая амплификация, опосредованная обратной транскрипцией (RT-LAMP), может обеспечить более быстрое и дешевое полевое тестирование в точках риска. Целью этого исследования было разработать быстрый скрининговый диагностический тест, который можно было бы выполнить менее чем за 30 минут.

Наиболее представительный доклад: Быстрое обнаружение нового коронавируса (COVID19) с помощью изотермической амплификации, опосредованной обратной транскрипцией

Процент документов с темой: 5%

7. Быстрое различение COVID-19 и других инфекций.

Ключевые слова: низкий, пациент, кислота, лихорадка, легкое, помутнение, земля, процесс, особенность, изображение.

Мало что известно о различиях между пациентами с COVID-19 и отрицательными нуклеиновыми кислотами в клиниках по лечению лихорадки. Самый высокий уровень обнаружения нуклеиновых кислот для инфекции 2019-nCoV наблюдался у пациентов с мышечной болью с последующей одышкой. Сочетание лихорадки, низкого уровня эозинофилов и визуализации матового стекла в двусторонних легких может быть ценным индикатором инфекции 2019-nCoV.

Наиболее представительный доклад: Анализ инфекции 2019-nCoV и клинических проявлений у амбулаторных пациентов: эпидемиологическое исследование, проведенное в лихорадочной клинике в Ухане, Китай

Процент документов с темой: 5%

8. Кто наиболее подвержен риску тяжелого заражения COVID-19?

Ключевые слова: пациент, симптом, система, правительство, люди, возраст, человек, значительно, улучшение, почечный

Исследования подтвердили, что не существует значительных возрастных ограничений для инфицирования населения, но пожилые люди по-прежнему остаются уязвимыми группами. Пациенты с диабетом с большей вероятностью разовьются в тяжелых пациентов, и вероятность госпитализации в ОИТ была значительно увеличена.

Наиболее представительный документ: Эпидемиологические и клинические характеристики 197 пациентов, инфицированных новым коронавирусом 2019 г., в Чунцине, Китай: описательное исследование в едином центре

Процент документов с темой: 4%

9. Лечение тяжелой формы COVID-19

Ключевые слова: тяжелый, респираторный, лечение, острый, метод, синдром, аналогичный, уровень, происхождение, возникают

Инфекция COVID-19 вызывает тяжелое респираторное заболевание, подобное коронавирусу тяжелого острого респираторного синдрома, и связана с поступлением в ОИТ и высокой смертностью. Мы изучили происхождение, эпидемиологию, методы лечения и другие аспекты, согласно плану лечения, разработанному Уханьской больницей Union, сертифицированной Министерством здравоохранения Китая, мы надеемся разработать эффективный метод лечения для снижения смертности от заболевания.

Наиболее представительный доклад: Клинические характеристики и лечение пациентов, инфицированных COVID-19, в Шишоу, Китай

Процент документов с темой: 4%

Заключение

Мне понравился этот проект выходного дня - это была моя первая попытка применить некоторые навыки НЛП для решения проблемы. Я знаю людей, которые увидят проблемы с моим подходом (пожалуйста, свяжитесь со мной), но эта идея интригует. Думаю, это похоже на еще одну форму обобщения, и чем больше я играю с ней, тем больше я думаю о возможностях медицинских и академических исследований.

Возможно, какой-то винный социальный, где мы приглашаем академических авторов на основе ключевых слов, сгруппированных по темам, и подбираем людей на основе% пересечения тем. Я лучше остановлюсь на этом, прежде чем я раздам ​​еще какие-нибудь фантастические идеи бесплатно. Обратная связь приветствуется!

Полный отказ от ответственности: я работаю менеджером по продукту в Elsevier. Это сообщение и анализ в блоге созданы нами и никоим образом не отражают мысли и мнения Elsevier.

Репозиторий GitHub

GitHub Repo с входными и выходными данными скриптов Python: https://github.com/Raudaschl/coronvavirus_preprint_research_nlp

Хочу больше?

Обновленная версия указанной статьи за май



Если вам понравилась статья, обязательно ознакомьтесь с моим комиксом о Коронавирусе в начале февраля 2020 года.



Библиография