Учебники, примеры кода, видеокурсы, конспекты курсов и статьи
Эта статья содержит коллекцию высококачественных ресурсов для изучения Обработки естественного языка (НЛП). Предназначен для тех, кто хочет приблизиться к миру НЛП уже с некоторыми основами машинного обучения, или для тех, кто уже немного знаком с НЛП, но хочет углубить свои знания.
Статьи
- Современные методы глубокого обучения, применяемые к обработке естественного языка: это обзор тенденций в области обработки естественного языка на основе глубокого обучения, последний раз обновленный в 2019 году. Он охватывает теоретические описания и детали реализации, лежащие в основе моделей глубокого обучения, таких как рекуррентные нейронные сети. , сверточные нейронные сети и обучение с подкреплением, используемые для решения различных задач и приложений НЛП.
- Визуальные руководства по концепциям НЛП: блог от Амит Чаудхари о науке о данных с упором на НЛП. Есть 19 постов о НЛП, которые подробны и очень хорошо объяснены.
- Блог Джея Аламмара: блог Джея богат высококачественными постами НЛП, такими как The Illustrated BERT, ELMo и др. (Как NLP взломал трансферное обучение), Иллюстрированный трансформер и Как работает GPT3 — визуализация и анимация.
- Как решить 90% проблем НЛП: пошаговое руководство: в этом сообщении в блоге объясняется, как создавать решения машинного обучения для решения проблем НЛП, исходя из опыта многих практиков в этой области. Он начинается с самого простого метода, который может работать, а затем переходит к более тонким решениям, таким как разработка признаков, векторы слов и глубокое обучение.
Учебники
- Глубокое обучение НЛП с PyTorch: в этом руководстве вы познакомитесь с ключевыми идеями программирования глубокого обучения с использованием Pytorch. Он специально ориентирован на НЛП для людей, которые никогда не писали код в какой-либо среде глубокого обучения, но предполагает практические знания основных задач НЛП.
Примеры кода
- Краткая книга по НЛП: она предназначена для практиков, чтобы они могли быстро прочитать, просмотреть, выбрать то, что полезно, а затем продолжить. Есть несколько блокнотов, разделенных на логические темы: обработка текста, классификация текста, очистка текста, исправление орфографии, лингвистика, представление текста, глубокое обучение для НЛП и чат-боты.
- The Super Duper NLP Repo: коллекция блокнотов Colab, охватывающих широкий спектр реализаций задач NLP. Он содержит более 300 тетрадей.
Видеокурсы
- Введение в обработку естественного языка с помощью кода (fast.ai): этот курс охватывает сочетание традиционных тем НЛП и новейших подходов нейронных сетей. Он также занимается неотложными этическими проблемами, такими как предвзятость и дезинформация.
- Ускоренная обработка естественного языка (Университет машинного обучения): лекции проходят от введения в НЛП и обработки текста до рекуррентных нейронных сетей и трансформеров.
- Специализация Coursera по обработке естественного языка (DeepLearning.ai): по сути, это НЛП от А до Я в четырехмесячном онлайн-курсе. Последние затронутые темы: кодировщик-декодер, внимание к расширенному машинному переводу, суммирование текста, ответы на вопросы, чат-боты, T5, BERT, преобразователи, реформатор и модели Hugging Face.
Примечания к курсу
- Лекции по глубокой обработке естественного языка (Оксфорд): цикл лекций из Оксфорда. Это прикладной курс, посвященный последним достижениям в области анализа и генерации речи и текста с использованием рекуррентных нейронных сетей.
- Заметки по НЛП доктора Джейкоба Эйзенштейна (Технология Джорджии): этот курс дает обзор современных методов обработки естественного языка, основанных на данных. Курс переходит от поверхностных моделей набора слов к более богатым структурным представлениям о том, как слова взаимодействуют для создания значения.
- От языков к информации (Стэнфорд): этот курс охватывает основы обработки текста, анализа настроений, поиска информации, чат-ботов и многого другого. Этот курс рекомендуется для людей, плохо знакомых с программированием или тех, кто только начинает работать с НЛП.
- Обработка естественного языка с помощью глубокого обучения (Стэнфорд): этот курс представляет собой введение в передовые исследования в области глубокого обучения для НЛП. Он охватывает встраивание слов, нейронные сети с PyTorch, преобразователи, ответы на вопросы, генерацию текста и так далее.
- Прикладная обработка естественного языка (Беркли): этот курс рассматривает использование обработки естественного языка как набора методов для исследования и рассуждений о тексте как данных, уделяя особое внимание прикладной стороне НЛП: использованию существующих методов НЛП и библиотек в Python. новыми и творческими способами.
- Обработка естественного языка (CMU): этот курс посвящен различным способам представления человеческих языков и тому, как использовать эти представления для построения моделей для выполнения перевода, суммирования, извлечения информации, ответов на вопросы, естественно-языковых интерфейсов к базам данных, разговорных агенты и так далее.
Репозитории с большим количеством контента
- Прогресс NLP: репозиторий, который отслеживает прогресс в обработке естественного языка, включая наборы данных и текущее состояние дел для наиболее распространенных задач NLP.
- Удивительный репозиторий НЛП: репозиторий GitHub, содержащий тщательно подобранный список ресурсов, посвященных обработке естественного языка.
Спасибо за чтение! Если вы хотите узнать больше о НЛП, не забудьте подписаться на NLPlanet в Medium, LinkedIn и Twitter!
Сообщения, связанные с NLPlanet