Публикации по теме 'statistics'
Анализ настроений и классификация тем для обнаружения дрейфа и галлюцинаций в языковых моделях
Введение
Быстрое развитие больших языковых моделей открыло новую эру обработки естественного языка, позволяя машинам генерировать текст, похожий на человеческий, отвечать на запросы и даже заниматься творческим письмом. Однако по мере того, как эти модели становятся более сложными и настраиваются под конкретные задачи, растет обеспокоенность по поводу их этичного и безопасного применения. Одним из важнейших аспектов является дрейф модели, когда поведение языковой модели со временем..
Развертывание линейной регрессии (Часть II)
С возвращением, читатели!
Как я и обещал в части I серии статей о линейной регрессии, я напишу следующий пост в блоге, в котором меня в основном будет интересовать пошаговое руководство по коду и вывод модели регрессии.
Если вы пропустили, нажмите здесь, чтобы перейти к части 1: → https://link.medium.com/dT5sMWr975
Тематическое исследование
По разным причинам, например, чтобы не усложнять понимание проблемы, из-за размера данных и новичков, которые читают этот пост, я решил пойти с..
A/B-тестирование: от нуля до героя
Наука о данных
A/B-тестирование: от нуля до героя
Коллекция лучших ресурсов для онлайн-экспериментов.
Недавно я изучал A/B-тестирование для своего последнего раунда собеседования с командой Glassdoor Decision Science.
У меня было очень мало знаний об A/B-тестировании заранее, и я посвятил целую неделю жадному чтению статей, видео и интервью…
Новые разработки в области статистики часть 1
Быстрая эмуляция двухточечной угловой статистики для фотометрических обзоров галактик (arXiv)
Автор: Марко Боничи , Лука Биджо , Кармелита Карбоне , Луиджи Гуццо
Аннотация: мы разрабатываем набор космологических эмуляторов на основе машинного обучения для получения быстрых прогнозов модели для угловых коэффициентов спектра мощности C(ℓ), характеризующих томографические наблюдения кластеризации галактик и слабого гравитационного линзирования из многодиапазонных..
Как классифицировать различные диалекты английского языка
Автор : Юваль Коэн
Область обработки естественного языка (NLP) по-прежнему остается горячей темой для исследователей. Много времени и усилий было потрачено на продвижение машинного обучения (ML) в обнаружении языка, и у нас действительно есть арсенал отличных доступных инструментов с открытым исходным кодом (см. здесь ).
Здесь, в Blue dot, нам нужно выйти за рамки базового определения языка. Поскольку наши необработанные данные взяты из финансовых документов, нам необходимо..
Могу ли я использовать PCA для выбора функций?
Устранение распространенных заблуждений
Введение
Анализ главных компонентов (PCA) - это метод уменьшения количества функций, часто используемый в задачах кластеризации. Возникает вопрос: можем ли мы использовать PCA в задачах классификации? Является ли PCA лекарством от проклятия размерности?
PCA для классификации
Это ловушка: мы не должны использовать PCA в задачах классификации.
PCA найдет наиболее точное представление данных в пространстве меньшей размерности. Однако..
Калькулятор с использованием концепции ООП в Python
Из концепции ООП в языке программирования Python. Мы можем сделать наш код очень простым для чтения и понимания, а также для написания кода.
Я решил сделать калькулятор, используя концепцию ООП в Python. Итак, давайте посмотрим, как сделать калькулятор на Python.
Здесь я создаю имя родительского класса как калькулятор. Я написал два метода. Во-первых, метод __init__ — это конструктор, а второй — для отображения введенных чисел.
Затем я написал дочерний класс, в котором..