5 основных команд, которые вам нужно знать, если вы хотите хорошо разбираться в SQL

SQL — это мощный язык, который можно использовать для всех видов задач анализа данных.

Он также идеально подходит для людей, которые хотят заняться программированием, потому что он очень похож на многие другие языки программирования.

В этой статье мы разберем 5 команд SQL, которые вам нужно знать, чтобы начать работу, а также примеры, чтобы к концу вы узнали о SQL достаточно, чтобы начать использовать его в своих собственных проектах!

1. ВЫБЕРИТЕ

Первая команда, которую вам нужно знать, если вы начинаете работать с SQL, это SELECT. Это самая основная команда SQL, которая используется для получения данных из таблицы.

Некоторые варианты использования SELECT включают:

  • Выбор всех данных из таблицы
  • Выбор определенных столбцов из таблицы
  • Выбор данных на основе определенных критериев (используя WHERE)

Примеры:

SELECT * FROM имя_таблицы

Это даст вам все данные из таблицы tablename. Вы также можете выбрать определенные столбцы, указав их имя после SELECT:

ВЫБЕРИТЕ идентификатор, имя ИЗ имени таблицы

Это даст вам столбцы id и name из таблицы tablename.

ВЫБЕРИТЕ ОТЛИЧНЫЙ

Если вы хотите выбрать только уникальные значения, вы можете использовать SELECT DISTINCT. Эта команда удаляет повторяющиеся значения из результатов:

ВЫБЕРИТЕ ОТЛИЧНЫЙ идентификатор ИЗ имя_таблицы

Это даст вам список всех уникальных идентификаторов из таблицы имен таблиц.

ВЫБЕРИТЕ КОЛИЧЕСТВО

Команда SELECT COUNT возвращает количество строк в таблице:

SELECT COUNT(*) FROM имя_таблицы

Это вернет общее количество строк в таблице tablename. Вы также можете подсчитать определенные столбцы

2. ГДЕ

WHERE — еще одна очень распространенная команда в SQL. Он используется для фильтрации данных, которые появляются в операторе SELECT:

Некоторые варианты использования WHERE включают:

  • Фильтрация данных по определенному столбцу
  • Фильтрация данных по определенному значению
  • Фильтрация данных по диапазону дат

Примеры:

ВЫБЕРИТЕ * ОТ имени таблицы, ГДЕ id = 100

Это вернет только строки из таблицы tablename, где id равен 100. Можно указать несколько условий с помощью AND или OR:

SELECT * FROM tablename WHERE (id = 100) OR (name = ‘John’)

Это вернет все строки из таблицы имен таблиц, где либо id = 100, либо имя = «Джон».

SELECT * FROM tablename WHERE id МЕЖДУ 100 И 200

Это вернет все строки из таблицы имен таблиц, где идентификатор находится в диапазоне от 100 до 200.

SELECT * FROM tablename WHERE id NOT IN (100 200)

Это вернет все строки из таблицы tablename, где id не равен 100 или 200.

3. ЗАКАЗАТЬ

ORDERBY также часто используется в SQL. Он используется для сортировки результатов оператора SELECT. Эти результаты могут быть отсортированы по убыванию или по возрастанию.

Некоторые варианты использования ORDERBY включают:

  • Отсортировать результаты по возрастанию: SELECT * FROM tablename ORDERBY id
  • Отсортировать результаты по убыванию: SELECT * FROM tablename ORDERBY id DESC
  • Сортировать результаты в алфавитном порядке: SELECT * FROM tablename ORDERBY name
  • Сортировать результаты по дате: SELECT * FROM tablename ORDERBY created_at

Примеры:

SELECT * FROM имя_таблицы ORDER BY имя

Это вернет все строки из таблицы tablenname и отсортирует их по именам. Если вы хотите использовать несколько столбцов для сортировки, укажите их в списке через запятую:

SELECT * FROM tablename WHERE id › 100 ORDER BY age DESC, name ASC

Это даст нам все строки, где ID больше 100, и упорядочит эти значения сначала по убыванию возраста, а затем по возрастанию имени.

4. ГРУППОВОЙ

GROUPBY — это оператор SQL, используемый для группировки данных в операторе SELECT по определенному столбцу.

Некоторые варианты использования GROUPBY включают:

  • Обобщение данных
  • Поиск максимального или минимального значения для столбца
  • Получение среднего значения, медианы или стандартного отклонения для столбца

Примеры:

ВЫБЕРИТЕ идентификатор, имя, СУММА (возраст) КАК «Возраст» ОТ имени таблицы СГРУППИРОВАТЬ ПО идентификатору

Это вернет таблицу с тремя столбцами: идентификатор, имя и возраст. Столбец Age будет содержать сумму всех значений возраста в таблице tablename, сгруппированных по идентификатору.

ВЫБЕРИТЕ максимальный (возраст) как «Самый старый человек» из имени таблицы GROUP BY id

Это вернет таблицу с одним столбцом: Oldest Person. Столбец Oldest Person будет иметь значение максимального возраста из таблицы имен таблиц, сгруппированных по идентификатору.

SELECT avg(age) как «Средний возраст» из имени таблицы GROUP BY id

Это вернет таблицу с одним столбцом: Средний возраст. В столбце «Средний возраст» будет указано среднее значение возраста для всех строк в таблице имен таблиц, сгруппированных по идентификатору.

5. НРАВИТСЯ

Оператор LIKE используется для сопоставления шаблона в строке символов. Знак процента (%) используется в качестве подстановочного знака, что означает, что он может представлять любое количество символов.

Некоторые варианты использования LIKE включают:

  • Сопоставление шаблона в столбце
  • Поиск определенных значений в столбце

Примеры:

ВЫБЕРИТЕ идентификатор, имя ОТ имени таблицы, ГДЕ имя КАК ‘A%’

Это вернет все строки, в которых первый столбец (имя) содержит букву A хотя бы один раз.

ВЫБЕРИТЕ идентификатор, имя ИЗ имя_таблицы, ГДЕ имя КАК ‘%end’

Это вернет все строки, в которых есть столбцы с именем «конец».

SELECT * FROM tablename WHERE name LIKE ‘John%’

Это вернет все строки из таблицы имен таблиц, где столбец имени содержит строку John, за которой следует любое количество символов (%). % можно использовать в начале, в конце или в любом месте строки.

Начать осваивать SQL

Команды SQL, которые мы обсуждали в этом сообщении блога, — это мощные инструменты, которые могут помочь вам получить максимальную отдачу от ваших данных.

Используйте эти команды, чтобы помочь вам анализировать и оптимизировать ваши данные, и вы будете на пути к освоению SQL.

Подпишитесь на мою рассылку с более чем 2 000 человек, чтобы бесплатно получить «Полный буклет Python для науки о данных»