Публикации по теме 'big-data'


7 способов справиться с дисбалансом классов в машинном обучении
На дворе 21 век, и мы стали больше, чем когда-либо, полагаться на машинное обучение для получения точных результатов. ‍ Но что, если машинное обучение нуждается в небольшой доработке? ‍ Да, вы правильно догадались, мы говорим о дисбалансе классов в машинном обучении. ‍ Если вы часто ищете решения и методы для устранения дисбаланса классов в машинном обучении, позвольте сообщить вам, что ваши поиски завершены, потому что мы собираемся обсудить семь надежных методов для..

Ожидается, что технические менеджеры YouTube разработают, внедрят и запустят заметные и…
Ожидается, что технические менеджеры YouTube разработают, внедрят и запустят заметные и удобные для пользователей функции. Также ожидается, что они будут проектировать и разрабатывать крупномасштабные веб-приложения (и, учитывая, что это YouTube, я считаю, что крупномасштабность подразумевает, что эти веб-приложения должны быть сопоставимы с такими вещами, как Facebook или Snapchat). Также ожидается, что они разработают основные программные компоненты и системы (например, текст,..

Брифинг по науке о данных № 208
Брифинг по науке о данных № 208 Еженедельный информационный бюллетень с последними разработками в области науки о данных, машинного обучения и искусственного интеллекта.​​​​​​​​​​​​​​​​​​ 05 июля 2023 г. ​ ​ Дорогие друзья, Добро пожаловать в 208-й выпуск Брифинга по науке о данных! На этой неделе мы с гордостью объявляем последний пост в серии Viz4Sci : Эффекты вакцинации , в котором мы воспроизводим одну из самых известных визуализаций WSJ. Вы также можете ознакомиться с..

Выборка больших графов в PyTorch Geometric
Графические методы глубокого обучения на больших графах Иногда мы сталкиваемся с большими графиками, которые вынуждают нас выходить за пределы доступной памяти нашего графического процессора или процессора. В этих случаях мы можем использовать методы выборки графов. PyTorch Geometric - это библиотека для глубокого обучения графов, которая позволяет нам легко реализовать многие архитектуры графических нейронных сетей. Библиотека содержит множество стандартных наборов данных для..

Как машинное обучение раскрывает лучшие идеи клиентов
Данные — это новая нефть. Понимание, полученное из огромных объемов информации, может выйти за рамки планирования, составления бюджета и прогнозирования, оно может определить конкурентное преимущество бренда. Большие данные, обработанные с помощью машинного обучения, могут выявлять новые возможности, моделировать события и помогать руководителям принимать более обоснованные бизнес-решения. Стратегии, основанные на данных На самом деле стратегическая важность перехода к принятию..

Черная магия в поиске объектов в Javascript.
Итак, мы наткнулись на 18 миллионов элементов данных, и система рухнула. Потребовалось немного времени, чтобы сузить круг, но это была оскорбительная авария… const lilLookup = { lanc: 'lancaster', berks: 'berkshire' } if (lilLookup[stringToCheck] !== undefined) { return lilLookup[stringToCheck] } return stringToCheck Хм. Логика выглядит нормально. Мы добавили логирование и выяснили, что такое stringToCheck, когда он ломается. stringToCheck === 'constructor' Оооо..

Как серверы Zookeeper остаются синхронизированными?
Apache Zookeeper , наверное, один из самых забавных и сложных распределенных фреймворков. Обычно он используется в качестве посредника для синхронизации распределенных серверов. Самостоятельная реализация синхронизации может привести к нескольким состояниям гонки. Итак, разработчики используют Zookeeper в различных системах, даже не задумываясь о какой-либо альтернативе. Широкое распространение свидетельствует о его надежности и производительности. Затем возникает вопрос: как..