Во время своего исследовательского путешествия я узнал много нового и столкнулся с множеством проблем. Я считаю, что структурированная ориентация для начинающих исследователей будет полезной и определенно помогла бы мне в молодости.

По мере того, как я разговаривал со все большим количеством аспирантов, я начал понимать, что их опыт довольно разнороден и значительно отличается друг от друга.

Эврика! Руководство по самопомощи, в котором собраны советы прошлых исследователей и профессоров.

Я считаю, что знания, содержащиеся в этой серии блогов, помогут сделать исследовательский опыт более справедливым и приятным.



Это часть инициативы «Исследования для всех», направленной на повышение осведомленности об исследованиях и повышение доступности исследований в области машинного обучения.

Во-первых, чтобы представиться, я доктор философии 3-го года. студент IIT Kharagpur, Индия, и был частью исследовательского сообщества в течение почти 5 лет - стажер, затем студент магистратуры, а теперь преследует докторскую степень.

Чему вы научитесь к концу этой серии блогов?

Здесь я попытаюсь представить свой жизненный цикл исследовательского проекта, основанный на личном практическом опыте, а также список исследовательских практик, которые я наблюдал и изучил в процессе. Я имел честь работать с талантливой командой исследователей и пожилых людей, а также с двумя исследовательскими лабораториями с совершенно уникальной собственной культурой работы.

Во-вторых, я попытался ассимилировать исследовательские статьи выдающихся исследователей и предоставить их в виде списка для чтения, связанного с каждой подтемой.

Я полагаю, что это обеспечит сбалансированную точку зрения, основанную на моем личном личном опыте и более опытных рекомендациях выдающихся исследователей по той же теме.

Ваши отзывы имеют решающее значение для дальнейшего улучшения этой статьи, поэтому не сдерживайтесь и дайте мне знать о своем мнении в комментариях или просто напишите мне.

В частности, вы узнаете о…

Часть 1. Мотивация, исследование с точки зрения самосовершенствования, жизненный цикл исследовательского проекта, формулирование проблемы, список для чтения (текущая статья)

Часть 2: Проверка проблемы, базовая настройка, новинка (скоро выйдет!)

Часть 3. Социальные навыки, включая проведение технических презентаций, совместную работу и продуктивность работы (еще одна статья в блоге, так что обязательно прочитайте ее. 8 минут чтения)



Сопутствующие работы

Интересно и совершенно противоположно моей исходной гипотезе то, что я наткнулся на кладезь учебных ресурсов, учебных пособий или инструкций от выдающихся профессоров и исследователей, которые помогут нам на каждом этапе пути.

В том же духе, чтобы сделать исследовательский опыт студентов более справедливым в разных учреждениях для студентов, получающих докторскую степень в области обработки естественного языка — — Zhijing Jin (аспирант НЛП в Институте Макса Планка, соорганизатор Круглогодичная программа наставничества ACL) стала доступной в виде репозитория Github с открытым исходным кодом, содержащего материалы для чтения по исследовательским подтемам, например:

На что похожа еженедельная встреча с консультантами?

Придумывать хорошие исследовательские идеи

Как читать статьи.

Я определенно рекомендую вам внимательно прочитать его, поскольку он предоставляет глубокий и всесторонний обзор уже доступных ресурсов и определенно поможет исследователям начать с правильной ноги.

Чем отличается эта серия блогов?

Если вы просмотрите список для чтения, приведенный в конце, вы вряд ли обнаружите, что какой-либо материал написан в контексте индийского академического сообщества, а также с точки зрения учащегося.

Я попытался собрать воедино то, что узнал из своего личного опыта, и то, что сработало для меня.

Таким образом, вы можете ожидать, что эта статья будет очень самоуверенной, сосредоточенной на том, «что сработало», а не на том, «как это должно было работать в идеале».

Итак, пол готов, так что давайте начнем!

Жизненный цикл исследовательского проекта

Предпосылки

  • Выбор широкого домена — Текст, Видение, Графики, Речь
  • Основы машинного обучения и глубокого обучения
  • Питон, Питорч
  • Необязательно: R, другие фреймворки DL
  • Git-команды

Предлагаемый рабочий процесс

Давайте поговорим о первом и, возможно, самом сложном шаге — формировании идеи.

Глубокое погружение в идею проблемы

Мы постараемся разобрать и представить мой взгляд на решение каждого шага.

Выбор лучших конференций

  • Некоторые известные конференции CS
  • Общее — WebConf, CIKM, AAAI, KDD, ICDM
  • Здоровье — BioKDD, CHIL, Семинар ACL BioNLP, ACM Transactions of Computing in Healthcare
  • Обработка естественного языка — ACL, EMNLP
  • Компьютерное зрение — CVPR, ECCV, MICCAI
  • Поиск информации — SIGIR, ECIR, WSDM
  • Рекомендательные системы — RecSys
  • Социальные сети — ICWSM, JCDL
  • NeurIPS, ICLR, AISTATS, KDD — супер топ
  • Сроки проведения конференции (https://twitter.com/_ConferenceList)

Доступ к исследовательским работам

  • Конференции из Антологии ACL, такие как ACL, EMNLP и NAACL, публикуются публично.
  • Некоммерческий сервер препринтов — Arxiv, bioRxiv
  • Rxivist объединяет препринты по биологии из bioRxiv и medRxiv с данными из Twitter, чтобы помочь вам найти статьи, обсуждаемые в вашей области.
  • Unpaywall
  • Найдите статью в Google Scholar, выберите статью, нажмите Все [число] версий и проверьте, доступна ли какая-либо из них в формате PDF.
  • Проверьте, есть ли у первого или последнего автора личная домашняя страница, тогда копия автора обычно находится на их веб-странице.

Некоторые эвристики для фильтрации статей по машинному обучению

  • ML — очень быстрорастущая область. Опубликовано за последние 3 года.
  • Разумный подсчет цитирований
  • Авторы из известного учреждения (первый или основной автор)

Поиск тем-кандидатов — доклады/учебники/другие

Чтение статей — фаза исследования

Это, пожалуй, самая трудоемкая часть, но для меня это была захватывающая часть процесса. Во-первых, начните с чтения аннотации и вводной части статьи. Затем создайте резюме статьи, в котором вы суммируете следующие аспекты:

Постановка проблемы, основные выводы и ограничения или область применения.

Прочитайте рисунки и таблицы вместе с подписями к ним.

Идеальный результат этапа формирования идеи проблемы

  • Начните с некоторых ключевых слов (НЛП, медицина, обобщение)
  • Определите 10–15 статей — создайте резюме статей
  • Проведите мозговой штурм с соавторами или коллегами или с самим собой
  • Постановка задачи кластера
  • Перечислите проблемы исследования
  • Требуемые ресурсы
  • знание предметной области, доступность помеченных данных, набор навыков авторов, необходимое время, требования к серверу для экспериментов по глубокому обучению

Решающий ресурс, который помог мне на всех этапах исследовательского процесса

Твиттер.

Да, для некоторых я могу показаться новичком, но поверьте, как только вы начнете использовать Твиттер в качестве учебного ресурса, это станет золотой жилой.

Это был мой выбор, и он по-прежнему остается одной из лучших платформ, чтобы быть в курсе исследований в моей области.

Я стал следить за некоторыми известными исследователями и исследовательскими лабораториями, и это дало мне доступ к:

  1. Подробности об их недавно опубликованной исследовательской работе
  2. Их комментарии и мнения о высокоэффективных исследовательских статьях. Если вы будете следить за веткой обсуждения, вы узнаете много нового!
  3. Уведомления о вакансиях — стажировка, постдок и кандидат наук. должности
  4. Проблемы производительности труда и психического здоровья и решения

Я начал следить за известными дескрипторами или хэштегами Twitter, такими как #AcademicTwitter, @PhDVoice и @jenheemstra (теперь их намного больше), где обсуждаются такие проблемы, с которыми сталкивается студент, или время от времени представляются полезные советы или точки зрения.

Если вы не нашли точное соответствие тому, что ищете, пожалуйста, не стесняйтесь опубликовать свой вопрос, кто-нибудь обязательно свяжется с вами.

Детали, поступающие в рамках инициативы «Исследования для всех»

Часть 2, содержащая подробную информацию о базовой настройке и новинках, будет выпущена в ближайшее время.

Часть 3 содержит руководство по улучшению межличностных навыков и повседневных навыков исследователя (отдельная статья уже опубликована, время чтения 8 мин).



Список для чтения

Я очень рад сообщить, что многие ресурсы и советы выдающихся исследователей и организаций находятся в свободном доступе. Как сторонник позитивного реализма скажу, что нужно просто читать, читать и продолжать читать…

  1. Пропущенный семестр вашего обучения CS https://missing.csail.mit.edu/
  2. Как стать успешным кандидатом наук. студент: Этот документ также имеет свой собственный список для чтения в конце
  3. Стэнфорд CS Ph.D. Ориентация 2021
  4. Stanford CS Red Book: пожалуйста, прочтите раздел 1.4 Консультанты: выбор консультантов, общение с консультантами и раздел 1.7 Как проводить исследования.
  5. Уроки моей докторской диссертации - Остин З. Хенли
  6. Информационные бюллетени, WordPress и Quora: DoctoralWriting SIG, Скрытые правила академии, Бьянка Перейра (Medium) и докторская степень (Quora)
  7. Совет самому себе, готовящемуся к докторской диссертации https://twitter.com/FromPhDtoLife/status/1514338255822639115
  8. ACL — это ведущая конференция по обработке естественного языка, и они организовали сеансы наставничества, связанные с исследованиями, такими как выбор проекта НЛП, налаживание сотрудничества и многое другое. Пожалуйста, просмотрите записанные видео, доступные на их канале Youtube.
  9. Выбор между кандидатом наук. и промышленность для новых выпускников компьютерных наук Шрея Шанкар (Блог)
  10. Баланс между обучением и исследованиями Эмили М. Бендер (Слайды)
  11. Вакансии: твиты на @jobRxiv
  12. PostGradual: доктор философии. Блог о карьере
  13. The Ultimate UG Research Manual от Scholar’s ​​Avenue, IIT Kharagpur, Индия
  14. Основные моменты менторских сессий EMNLP 2020 (Блог)

Заключение

Я надеюсь, что эта статья поможет распространить информацию о бесплатных ресурсах с открытым исходным кодом, доступных для исследователей, и привнесет перспективу самосовершенствования в отношении исследований в академических кругах.

Желаю вам уникальной, захватывающей, но информированной докторской степени. путешествие!

Отказ от ответственности

Статья основана исключительно на моем мнении и опыте и не отражает точку зрения каких-либо исследователей, с которыми я встречался или с которыми сотрудничал. Я доктор философии. студент, пытающийся ориентироваться в длинном докторе философии. путешествие и я никоим образом не эксперт. Цель этой статьи — представить то, что работало у меня до сих пор (в конкретных областях машинного обучения и обработки естественного языка), и собрать воедино общедоступные мнения и опыт более опытных и выдающихся исследователей по той же теме.

💚30+ бесплатных статей уже доступны на datanalytics101.com

💚 Ваши отзывы очень важны для улучшения контента, поэтому, пожалуйста, поделитесь своим мнением по этой теме.

💚Подпишитесь на меня в Твиттере @roysoumya1, чтобы получать новости о теме «ИИ в здравоохранении».

💚Планирую писать один пост в месяц на Medium. Чтобы получать обновления прямо на свою электронную почту, подпишитесь на https://medium.com/subscribe/@soumyadeeproy