Публикации по теме 'statistics'


Анализ настроений и классификация тем для обнаружения дрейфа и галлюцинаций в языковых моделях
Введение Быстрое развитие больших языковых моделей открыло новую эру обработки естественного языка, позволяя машинам генерировать текст, похожий на человеческий, отвечать на запросы и даже заниматься творческим письмом. Однако по мере того, как эти модели становятся более сложными и настраиваются под конкретные задачи, растет обеспокоенность по поводу их этичного и безопасного применения. Одним из важнейших аспектов является дрейф модели, когда поведение языковой модели со временем..

Развертывание линейной регрессии (Часть II)
С возвращением, читатели! Как я и обещал в части I серии статей о линейной регрессии, я напишу следующий пост в блоге, в котором меня в основном будет интересовать пошаговое руководство по коду и вывод модели регрессии. Если вы пропустили, нажмите здесь, чтобы перейти к части 1: → https://link.medium.com/dT5sMWr975 Тематическое исследование По разным причинам, например, чтобы не усложнять понимание проблемы, из-за размера данных и новичков, которые читают этот пост, я решил пойти с..

A/B-тестирование: от нуля до героя
Наука о данных A/B-тестирование: от нуля до героя Коллекция лучших ресурсов для онлайн-экспериментов. Недавно я изучал A/B-тестирование для своего последнего раунда собеседования с командой Glassdoor Decision Science. У меня было очень мало знаний об A/B-тестировании заранее, и я посвятил целую неделю жадному чтению статей, видео и интервью…

Новые разработки в области статистики часть 1
Быстрая эмуляция двухточечной угловой статистики для фотометрических обзоров галактик (arXiv) Автор: Марко Боничи , Лука Биджо , Кармелита Карбоне , Луиджи Гуццо Аннотация: мы разрабатываем набор космологических эмуляторов на основе машинного обучения для получения быстрых прогнозов модели для угловых коэффициентов спектра мощности C(ℓ), характеризующих томографические наблюдения кластеризации галактик и слабого гравитационного линзирования из многодиапазонных..

Как классифицировать различные диалекты английского языка
Автор : Юваль Коэн Область обработки естественного языка (NLP) по-прежнему остается горячей темой для исследователей. Много времени и усилий было потрачено на продвижение машинного обучения (ML) в обнаружении языка, и у нас действительно есть арсенал отличных доступных инструментов с открытым исходным кодом (см. здесь ). Здесь, в Blue dot, нам нужно выйти за рамки базового определения языка. Поскольку наши необработанные данные взяты из финансовых документов, нам необходимо..

Могу ли я использовать PCA для выбора функций?
Устранение распространенных заблуждений Введение Анализ главных компонентов (PCA) - это метод уменьшения количества функций, часто используемый в задачах кластеризации. Возникает вопрос: можем ли мы использовать PCA в задачах классификации? Является ли PCA лекарством от проклятия размерности? PCA для классификации Это ловушка: мы не должны использовать PCA в задачах классификации. PCA найдет наиболее точное представление данных в пространстве меньшей размерности. Однако..

Калькулятор с использованием концепции ООП в Python
Из концепции ООП в языке программирования Python. Мы можем сделать наш код очень простым для чтения и понимания, а также для написания кода. Я решил сделать калькулятор, используя концепцию ООП в Python. Итак, давайте посмотрим, как сделать калькулятор на Python. Здесь я создаю имя родительского класса как калькулятор. Я написал два метода. Во-первых, метод __init__ — это конструктор, а второй — для отображения введенных чисел. Затем я написал дочерний класс, в котором..