Установка

Я работаю в респектабельной компании из Силиконовой долины и могу позволить себе роскошь иметь приличный план медицинского обслуживания. Но со всеми хорошими вещами приходят некоторые неожиданные проблемы.

Как и многие из вас, в ноябре прошлого года я выбрал план медицинского страхования, а затем забыл о нем. К сожалению, у жизни были на меня другие планы.

Недавно я навредил себе и захотел обратиться к врачу (спортивному/общему, откровенно говоря, к любому), а потом понял, что даже не выполнил первый (и несколько важный) шаг выбора плана медицинского обслуживания: выбор врача первичной помощи!

Так что мне нужен PCP, действительно, насколько это может быть сложно? Очевидно, очень сложно. Здесь начинается моя история

Добрые люди из Connected Care California (мой план медицинского обслуживания) действительно пытались мне помочь. Всех врачей в сети нашла простым поиском. Пример: https://www.connectedcarehealth-ipf.com/ca/

Трагедия

Настоящая проблема возникла сразу после этого: поиск в радиусе 10 миль дал «всего» 143 результата!

В мире, где мы привыкли к рейтингам и отзывам практически обо всем, я столкнулся со 143 вариантами выбора!

Яркий пример перегруженности обзорами, взятый со страниц Amazon.

Добрые люди из Connected Care California экспортировали pdf-файл с 8 страницами имен врачей (это тоже шрифтом 9!!). Я мог бы взять дротик и выбрать его наугад, или я мог бы что-то с этим сделать.

Битва

Я рассказываю вам историю, так что (вы правильно догадались) я кое-что сделал по этому поводу.

Мои проблемы были следующие:

  1. Как эти врачи? Что их пациенты думают об этих Доках?
  2. Как отсортировать их по специальностям?
  3. Где они расположены? Сан-Хосе — большой город, могу я отфильтровать и нанести на карту этих врачей?

Оружие: Github/Python/Vim/

На первые два вопроса на помощь пришел Yelp.

Я заметил, что на Yelp уже есть отзывы о большинстве этих документов. Все, что мне нужно было, это каким-то образом передать Yelp.com все эти названия и места, а затем получить звездный рейтинг и количество оценок для каждого из них. (Как и вы, я предпочитаю 4-звездочный документ с 50+ отзывами, а не 5-звездочный документ с 5 отзывами)

Я начал со скрипта из scrapehero/yelp_search.py на Github.

И внес в него некоторые коррективы. Вы можете увидеть мою версию здесь.

Некоторая предварительная обработка текстового файла была необходима перед тем, как отправить его на Python, что я сделал с помощью своего удобного текстового процессора Vim: удаление дополнительных данных (например, точный адрес, телефон, пол, сеть, язык и т. д.), создание каждой записи как одного строка, сортировка данных по алфавиту, замена пробела на «+», запятая на «2%» и т. д.

Вот как выглядел вход в скрипт Python

Yelp великолепен, потому что запросы очень легко передать

В течение минуты у меня было имя/адрес/звездный рейтинг/количество рейтингов/категория/и URL-адрес для Yelp для каждого из врачей.

Бинго, я в деле!! И последнее, нанесение всех этих данных на график.

Свет в конце туннеля

Лаборатория Google создала замечательный инструмент Fusion Table, который почему-то так и не вышел из бета-версии. Но, к счастью, он все еще доступен для использования.

Его прелесть в том, что я мог отмечать адреса и фильтровать результаты.

Я отфильтровал список по врачам с рейтингом +3,5 звезды и количеством отзывов больше «4». Сводная таблица также позволяет фильтровать по специализации. Более того, я раскрасил точки по рейтингу отзыва.

Опять же, это отличный способ визуально определить, как далеко находится Доктор и каковы его рейтинги (красная точка ‹ 4* и синяя точка › 4*).

½ дня потрачено, и я, наконец, смог сделать осознанный выбор!!

TLDR; нашел независимые отзывы о моих врачах в сети с помощью скрипта в таблицах Yelp и Google Fusion.