Публикации по теме 'kaggle'


Jigsaw Рейтинг серьезности токсичных комментариев
Мой подход, получивший высший балл на Kaggle Введение в конкурс Интернет был создан с целью обмена знаниями и превращения в место для обмена идеями. Тем не менее, притеснения, с которыми сталкиваются люди в Интернете, делают их менее вероятными для участия в онлайн-дискуссиях. Задача Jigsaw Rating Severity of Toxic Comments на Kaggle направлена ​​на определение и оценку уровней токсичности комментариев в Интернете. Итак, какие комментарии можно считать токсичными? Любой..

Применение первой глубокой нейронной сети Эндрю Нг к набору данных Titanic Survival
Вы были потрясены первым курсом Coursera по глубокому обучению Эндрю Нг, возможно, даже проглотили его за неделю . Мы все были! Но удерживайте свои нетерпеливые пальцы от перехода на второй курс, прежде чем применять полученные знания к новому набору данных. В этом посте рассматривается применение нейронной сети к набору данных Titanic Survival от kaggle. Это помогает читателю углубить понимание нейронных сетей вместо того, чтобы просто выполнять тщательно подобранный код Эндрю Нг...

Повышение качества обзоров Amazon Fine Food с обработкой естественного языка
Сначала мы хотим узнать, что такое Amazon Fine Food Review Analysis? Этот набор данных состоит из обзоров изысканной еды от Amazon. Данные охватывают период более 10 лет, включая все ~ 500 000 отзывов до октября 2012 года. Обзоры включают информацию о продуктах и ​​пользователях, рейтинги и обзор в виде открытого текста. У нас также есть отзывы из всех других категорий Amazon. Обзоры Amazon часто являются наиболее общедоступными отзывами о потребительских товарах. Как частый..

Чтение файлов TFRecord в Python
Введение Работая над конкурсом Petals to the Metal — Flower Classification on TPU для начинающих на Kaggle [ 16 ], первая проблема, с которой я столкнулся, — это формат доступных данных. Описание файлов следующее: «Данный конкурс предоставляет свои файлы в формате TFRecord. Формат TFRecord — это контейнерный формат, часто используемый в TensorFlow для группировки и разделения файлов данных для оптимальной эффективности обучения». Итак, этот формат файлов оптимизирован для..

Деревья решений
Применяется к Kaggle Titanic Challenge с R Что такое дерево решений? Деревья решений (DT) — это непараметрический контролируемый метод обучения, используемый для классификации и регрессии . Цель состоит в том, чтобы создать модель, которая предсказывает значение целевой переменной, изучая простые правила принятия решений, выведенные из характеристик данных. В машинном обучении мы называем модель контролируемой, когда у вас есть целевая переменная. Более того, дерево решений можно..

Пример землетрясения LANL
В этом блоге мы проведем тематическое исследование о землетрясении LANL, которое представляет собой конкурс, проводимый на Kaggle.com . В этом примере мы предскажем время следующего землетрясения. Набор данных: Набор данных был создан в лаборатории, где с помощью экспериментов они создали землетрясение и записали его. Вот — видео эксперимента. Набор данных можно найти здесь . Этот набор данных содержит 8,9 ГБ обучающего CSV-файла и тестовую папку с 2624 файлами, каждый из..

Как я набрал высший балл в табличном соревновании Kaggle за сентябрь 2022 г.
Я с нетерпением жду начала каждого месяца, потому что у Kaggle есть новый вопрос о конкурсе в их ежемесячном табличном конкурсе. Конкурсный вопрос на сентябрь 2022 года касается продажи книг, и постановка задачи приведена ниже: Я вступил в этот конкурс, не рассчитывая на победу, поэтому решил, что проанализирую…