Эксперты по данным давно назвали маргинализацию и ограниченное решение проблем одними из самых серьезных проблем, с которыми сталкивается наука о данных. Когда крупные технологические предприятия ищут решения только тех проблем, с которыми они сталкиваются в своей компании и в своих сообществах, это усугубляет неравенство.

Но компании, некоммерческие организации и частные лица по всему миру уделяют приоритетное внимание решению таких проблем, как неравенство, бедность, здоровье и т. Д., И для этого используют науку о данных. Здесь мы исследуем три приложения использования данных для решения социальных проблем.

Раннее обнаружение аутизма с помощью машинного обучения

Раннее выявление аутизма и других поведенческих расстройств может помочь людям жить более качественной жизнью. Вот почему исследователи и разработчики создали Cognoa, компанию, занимающуюся цифровым здравоохранением, которая использует машинное обучение для выявления этих нарушений.

Приложение компании Cognoa for Child Development позволяет родителям предоставлять данные о поведении своего ребенка дома, из дома. Диагностическое приложение, одобренное Управлением по санитарному надзору за качеством пищевых продуктов и медикаментов за считанные минуты определяет и сообщает о риске задержки развития и аутизма у ребенка.

Приложение доступно бесплатно в Google Play и App Store. Однако работодатель родителя должен предложить Cognoa воспользоваться этими услугами. Согласно описанию в App Store, им пользовались 300 000 семей.

Приложение было разработано в результате пяти лет клинических исследований в медицинских школах Гарварда и Стэнфорда. Компания оптимизировала свою систему прогнозирования, объединив результаты нескольких алгоритмов машинного обучения, которые были обучены на разных носителях для выявления аутизма. В настоящее время его исследователи ищут способы одновременного выявления нескольких состояний.

Борьба с бедностью в странах Африки к югу от Сахары

Ряд групп находят способы использовать данные для борьбы с бедностью, особенно в сельских районах Африки.

DrivenData размещает в Интернете международные соревнования, чтобы побудить участников создавать статистические модели, учитывающие социальные проблемы. В одном тематическом исследовании участники продвигали использование мобильных денег в сельских районах Танзании, что обеспечивает большую стабильность доходов среди этих групп населения.

Процесс исследования и проектирования, который команды использовали во время тематического исследования DrivenData в Танзании.

Хотя большая часть населения Танзании имеет сотовые телефоны, мобильные деньги медленно приживались. Участники проекта обнаружили, что это произошло потому, что танзанийцы не доверяли цифровым валютам. Поэтому они работали с качественными и количественными данными, чтобы развивать отношения между этими пользователями и агентами цифрового финансирования.

Аналогичным образом Fenix ​​International предоставляет людям в Африке комбинированные решения для получения кредитов и доступа к солнечной энергии. Компания заявляет, что ее методы машинного обучения позволяют людям получать доступ к солнечной энергии, которая ранее была слишком дорогостоящей.

Fenix ​​предоставляет солнечные панели и батареи бедным людям в рамках планов выплат. Затем компания добывает данные с этих устройств. Он также добывает демографическую информацию, схемы погашения, погоду, климат и спутники.

Аналитики данных используют эти данные для построения моделей, прогнозирующих выплаты, и создания кредитных историй для лиц, пользующихся их услугами. Большинство из этих пользователей не имеют ранее задокументированной финансовой истории. Кредитные профили Fenix ​​могут позволить бедным семьям получить доступ к кредитам на ссуды и коммунальные услуги, что в конечном итоге улучшит качество их жизни.

Следите за собой: стремимся к этичной и беспристрастной работе с данными

Вместо того, чтобы работать над внешними проблемами, некоторые науки о данных для хороших усилий являются интроспективными. Они работают над тем, чтобы системы, зависящие от данных, не работали против общества или каких-либо конкретных групп людей.

Лаура Норен, директор по исследованиям в Obsidian Security и профессор этики науки о данных, заметила, что ученики ее классов умели находить этические пробелы в работе своих сверстников, но не попадали в цель при оценке своей собственной. Поэтому она разработала 90-минутный интерактивный семинар, чтобы помочь исследователям раскрыть свои внутренние предубеждения и научиться устранять эти предубеждения в своей работе.

Между обзором того, как этика исследований может принести пользу науке о данных и рассмотрением реальных примеров, участники семинара учатся создавать стратегии вмешательства и применять этические подходы с минимальным негативным воздействием на общество. Норен также перенесет этот семинар на ODSC West.

Другие, работающие в той же сфере, пытаются продвигать инклюзивный дизайн в работе, основанной на данных. Фрэнсис Хауген, директор по продуктам данных в службе интеллектуальной разработки Gigster, недавно подтолкнула Pinterest предоставить пользователям возможность фильтровать поисковые запросы по оттенку кожи - и это им удалось.

Она регулярно работает над созданием инструментов искусственного интеллекта, направленных на инклюзивность, и продвигает передовые методы ограничения предвзятости в машинном обучении. Если разработчики не будут помнить об инклюзии, «объективный» искусственный интеллект может в конечном итоге увековечить те же предубеждения и систематическую дискриминацию, что и люди. Те, кто вкладывает время и деньги в достижение этих целей, занимают центральное место в движении «данные во благо».

Спикеры на ODSC West 31 октября - ноябрь. 3 человека, которые будут читать лекции и проводить семинары на тему науки о данных навсегда:

  • Форд Гарберсон, старший специалист по обработке данных в Конноа, расскажет о диагностическом приложении компании.
  • Питер Булл, соучредитель DrivenData, подробно рассмотрит пример использования мобильных денег в Танзании.
  • Брианна Шайлер, директор по науке о данных в Fenix ​​International, расскажет о том, как ее компания создает кредитные рейтинги, предоставляя солнечную энергию людям в Африке.
  • Лаура Норен, директор по исследованиям в Obsidian Security, проведет семинар, чтобы выявить предвзятость ученых, занимающихся данными.
  • Фрэнсис Хауген, директор по продуктам данных в службе интеллектуальной разработки Gigster, расскажет, как проектировать с прицелом на вовлечение.
  • Дэвид Смит, защитник облачных технологий в Microsoft, проведет семинар и обсудит проекты, над которыми работает AI for Earth, используя искусственный интеллект для защиты биоразнообразия, точного земледелия и сохранения.
  • Ана Гиршик, старший научный сотрудник отдела компьютерных исследований в Ancestry DNA, прочтет лекцию о генетической сети из 10 миллионов человек, созданной Ancestry, и о том, как она использовала машинное обучение, чтобы помочь пользователям найти свои генетические сообщества. и узнайте больше об их происхождении.
  • Сидеака Уотсон, старший научный сотрудник главного управления данных AT&T, расскажет о расовой предвзятости при взаимодействии с полицией и о том, как анализ сегментации может помочь исследователям в ее изучении.

Оригинальная история здесь.

— — — — — — — — — — — — — — — — — —

Прочтите больше статей по науке о данных на OpenDataScience.com, включая учебные пособия и руководства от новичка до продвинутого уровня! Подпишитесь на нашу еженедельную рассылку здесь и получайте последние новости каждый четверг.