С структурирован
Вопрос
Язык

Звучит некрасиво, но обещаю, это твой друг.

Что такое SQL?

  • SQL - это язык программирования для конкретной базы данных, который используется для создания, чтения, обновления и удаления (CRUD) данных в базе данных. Это стандартный язык для систем управления реляционными базами данных.
  • Реляционная база данных - это набор наборов данных (схема), организованный в таблицы (известные как отношения). В каждом отношении есть строки (известные как записи или записи) и столбцы (известные как атрибуты), содержащие данные. Каждая строка данных может быть привязана к уникальному ключу (известному как первичный ключ).
  • Вы можете думать о базе данных как о файле Excel. Таблицы в базе данных похожи на разные листы в файле Excel. Вы также заметите параллели между командами SQL, которые мы рассмотрим, и уравнениями и сводными таблицами, с которыми вы, возможно, знакомы в Excel.
  • В вашей организации может уже быть какая-то панель отчетности, настраиваемая (и настраиваемая) с соответствующими показателями для вашего продукта. SQL, вероятно, задействует хотя бы часть того, что отображает эта панель. Если у вашей компании еще нет надежной инфраструктуры данных, это отличное место для начала! Создание инфраструктуры данных и создание основных информационных панелей данных - важнейший фундаментальный шаг на пути к созданию высокоэффективного продукта.

Зачем изучать SQL в качестве PM?

  • Следите за своими ключевыми показателями эффективности. Данные - ваш друг - держите их под рукой. Изучение SQL значительно упростит вам мониторинг ключевых показателей эффективности, при необходимости скорректируйте то, что вы измеряете, изучите возможности новых продуктов и информируйте заинтересованные стороны.
  • Будьте самодостаточными. Нет необходимости отнимать время ваших аналитиков или инженеров для выполнения SQL-запросов. Изучая его самостоятельно, вы избавляетесь от головной боли, связанной с отложением вашего запроса, что означает более быстрое принятие лучших решений и снижает нагрузку на вашу команду.
  • Получите более глубокое представление о своем продукте. Вы действительно знаете свой продукт от и до? Мы все хотим сказать «да», но правда в том, что всегда есть что улучшить. Понимание того, где живут ваши данные, может помочь вам глубже понять свой продукт, заранее обеспечить надежное отслеживание и узнать, какие показатели успеха следует измерять, когда вы.

Настройка

  • Организации используют различные инструменты с графическим интерфейсом для подключения к своим базам данных, такие как SQLyog, Workbench или Sequel Pro. Начните с краткого руководства YouTube по инструменту вашей организации.
  • Затем найдите администратора своей базы данных (инженер, специалист по данным и т. Д.) И купите им кофе. Им нужно будет предоставить вам права на доступ к данным вашей организации и помочь с настройками. Для целей анализа вам не нужно изменять какие-либо данные в базе данных, поэтому права только для чтения в порядке.
  • Наконец, найдите время, чтобы ознакомиться со своей схемой (набором таблиц данных). Лучше, чтобы администратор базы данных или другой разбирающийся в данных коллега провел вас пошагово. Спросите их, есть ли у вас актуальная схематическая диаграмма, на которую вы могли бы сослаться. Вы захотите примерно ознакомиться с тем, где хранится информация, изучив столбцы в каждой таблице.

Что такое запрос?

SQL-запрос - это запрос к базе данных для извлечения данных. Думайте об этом как о том, что ваш код «обращается» к базе данных для запроса информации. В ответ база данных отправляет результат в виде таблицы запрошенных данных. Ваш запрос должен начинаться с бизнес-вопроса, на который вы хотите получить ответ, например "Какой процент пользователей превращается в платящих клиентов в течение 2 недель после регистрации?" или "Каков средний доход на одного покупателя за все время?"

Основные типы данных

Данные, с которыми вы будете работать как PM, в основном делятся на три категории типов данных:

Базовый синтаксис

Синтаксис SQL - это то, что вы вводите в командной строке для запроса базы данных. Наиболее распространенные команды и некоторые примеры использования описаны ниже:

Выбор правильных столбцов

Используйте оператор SELECT, чтобы указать таблицу и столбцы, из которых вы хотите вернуть данные. (Совет: если вы не знаете, какие столбцы существуют, выберите SELECT * FROM [table] LIMIT 1, чтобы проверить одну строку в таблице.) например. Я хочу узнать, сколько каждый клиент заплатил транзакциями.

Переименование ваших данных

После того, как вы определили нужные столбцы, вы можете переименовать их, используя псевдоним, который будет легче распознать. например. Переименуйте столбец cust_sell в «продавец».

Фильтрация результатов с помощью условий

например Какие клиенты платят транзакциями более 200 долларов в месяц?

например Я хочу видеть всех наших клиентов, которые живут в Нью-Йорке.

Заказ ваших данных

например Кто из наших клиентов в Нью-Йорке ежемесячно платит больше всего за транзакции?

Объединение данных вместе

Чаще всего на самые интересные бизнес-вопросы можно ответить, только объединив данные, хранящиеся в нескольких таблицах. В этих случаях вам необходимо объединить данные в единую таблицу, из которой вы можете запросить желаемый результат. Две наиболее часто используемые команды «соединения» - это INNER JOIN и LEFT JOIN.

например, внутреннее присоединение: допустим, вы хотите просмотреть список всех электронных писем пользователей, которые когда-либо подписывались, и их статус подписки, чтобы вы могли отправлять подписчикам различные почтовые кампании, чтобы сохранить или повторно активировать их. Но данные для пользователей и данные для подписок расположены в двух разных таблицах: первая таблица (пользователи) содержит три столбца (идентификатор, адрес электронной почты, имя), а вторая таблица (подписки) содержит четыре столбца (id, status, user_id, ежемесячно_цена).

например Левое присоединение. Допустим, вы снова хотите просмотреть список адресов электронной почты пользователей, их имена и статус подписки независимо от того, подписывались ли они когда-либо, чтобы вы могли отправлять пользователям рассылки для их преобразования, сохранения или повторной активации.

Обратите внимание, что запрос LEFT JOIN возвращает все результаты из первой («левой») таблицы, независимо от того, находит ли он совпадение в объединенной («правой») таблице.

Использование ваших данных

Конечно, данные не собираются превращаться в продукты и функции с добавленной стоимостью. Вам решать, как использовать свои данные для принятия решений, влияния на заинтересованные стороны и действий на основании полученных сведений. Готовый…. установленный…. идти!

Ищете больше?

Я настоятельно рекомендую бесплатный онлайн-курс Udacity: Введение в реляционные базы данных. Он больше ориентирован на программистов и немного углубляется в Python, но вы можете выбрать, какие уроки наиболее актуальны для вас, и попробовать свои силы в манипулировании реальными наборами данных.