IMPACT энергично готовится к осенней встрече Американского геофизического союза (AGU) этого года в Чикаго. Ниже приведены тизеры личных презентаций, на посещение которых обязательно стоит выделить время в своем расписании. Вы не будете разочарованы!

Техническая архитектура и стратегии проектирования для консолидации бортовых и полевых данных НАСА в Каталоге архивных суборбитальных исследований Земли (CASEI)

Понедельник, 12 декабря 2022 г., 10:00

До недавнего времени авиационные и полевые данные и связанные с ними метаданные обычно были доступны только путем просеивания различных веб-сайтов, публикаций и разрозненных инструментов обнаружения данных. Каталог архивных суборбитальных исследований Земли (CASEI) повышает возможность поиска, доступности и возможности повторного использования данных, делая их более ДОСТУПНЫМИ. ADMG тесно сотрудничала с техническими экспертами для разработки четко определенных моделей данных для управления облачными порталами конечных пользователей для доступа к данным, передаваемым по воздуху, и одновременно предоставляя интерфейсы курирования для эффективного обслуживания запасов. В этой презентации мы рассмотрим технические стратегии, которые использовались для стандартизации содержимого бортовых и полевых метаданных в CASEI, обеспечения синхронного курирования, обеспечения эффективного управления данными и информацией, а также эффективного подключения научных пользователей к необходимым данным и информации.

Двигатель научных открытий: история успеха открытой науки

Понедельник, 12 декабря 2022 г., 17:50

НАСА стремится создать инклюзивное открытое научное сообщество в течение следующего десятилетия и поддерживает новую инициативу по науке с открытым исходным кодом (OSSI) для развития этого сообщества. Одним из компонентов киберинфраструктуры OSSI является Science Discovery Engine (SDE). Цель SDE — обеспечить обнаружение данных, программного обеспечения и документации в пяти подразделениях SMD: астрофизики, биологических и физических наук, наук о Земле, гелиофизики и планетологии. SDE расширяет доступ к богатству открытых научных данных и информации НАСА. В этой презентации мы представим нашу совместную работу по созданию SDE и наше видение расширения возможностей науки с открытым исходным кодом в будущем.

Использование крупномасштабных языковых моделей для реализации возможностей НЛП в науках о Земле

Понедельник, 12 декабря 2022 г., 17:55

Обработка естественного языка (NLP) используется для решения множества задач, включая обобщение, классификацию текста, пометку ключевыми словами и анализ настроений. Область информатики наук о Земле использует эти задачи для продвижения в этой области. Модели больших языков (LLM) содержат большое количество ассоциаций между предметно-ориентированными понятиями. Мы сотрудничали с командой IBM Watson для создания такой модели под названием «Представления двунаправленного кодировщика от преобразователей для наук о Земле» (BERT-E). В этой презентации мы демонстрируем производительность BERT-E в последующих задачах и обсуждаем его полезность для множества других проблем НЛП в науках о Земле с минимальным последующим обучением. Мы также представляем наши наборы данных NLP, которые можно использовать для проверки LLM.

Обзор Каталога архивных суборбитальных исследований Земли (CASEI) НАСА: поддержка ЧЕСТНОГО и открытого доступа к данным, полученным с борта и полевыми данными

Среда, 14 декабря 2022 г., 14:45

Каталог архивных суборбитальных исследований Земли (CASEI) представляет собой уникальный перечень данных НАСА о Земле, полученных с борта самолета и в полевых условиях (наблюдения за нашей планетой, сделанные не из космоса). НАСА возлагает ответственность за эти данные на различные архивные центры; однако просмотр, поиск и обнаружение коллекций для наблюдений, имеющих отношение к конкретному интересу, может быть обременительным процессом, особенно если пользователь еще не очень хорошо знаком с первоначальными усилиями по сбору данных. CASEI устраняет эти барьеры для доступа и способствует более интуитивно понятному, целостному обнаружению данных, поиску и доступу для бортовых и полевых наблюдений НАСА за Землей. В этой презентации будет представлен краткий обзор мотивов и развития системы CASEI. Особое внимание будет уделено тому, как CASEI способствует обнаружению и повторному использованию этих менее известных данных НАСА, поддерживая видение открытой науки и повышая отдачу от инвестиций, вложенных в сбор этих уникальных и разнообразных наблюдений.

Улучшение возможности обнаружения и доступа к коммерческим данным для программы НАСА по сбору коммерческих данных с малых спутников (CSDA)

Четверг, 15 декабря 2022 г., 11:30

Программа сбора коммерческих данных с малых спутников (CSDA) Национального управления по аэронавтике и исследованию космического пространства (НАСА) была создана для выявления, оценки и получения данных от коммерческих спутниковых компаний, которые поддерживают и дополняют миссии и исследовательские цели НАСА в области наук о Земле. CSDA разрабатывает систему данных для обеспечения масштабируемых, эффективных, непрерывных и воспроизводимых процессов управления данными для всех коммерческих данных, полученных НАСА. Это включает в себя предоставление доступа к коммерческим данным утвержденным научным исследователям через НАСА и интерфейсы поставщиков. В этой презентации будет представлена ​​обновленная информация о деятельности программы CSDA, включая доступность новых данных, разработку пользовательских интерфейсов CSDA и вспомогательных технологий, проблемы управления большими объемами разнообразных наборов данных и долгосрочную деятельность по сохранению данных для научной воспроизводимости.

Оценка затопления с помощью компьютерного зрения на снимках малого спутника

Четверг, 15 декабря 2022 г., 17:45

Быстрое и точное картирование пострадавших районов после наводнения имеет решающее значение для количественной оценки ущерба, нанесенного людям и имуществу. Картографирование наводнений на основе компьютерного зрения может дополнить традиционное дистанционное зондирование, обеспечивая более быстрый, упрощенный, но точный рабочий процесс. Появление в последние годы коммерческих малых спутников изменило наблюдение Земли, предоставив данные с высоким пространственным и временным разрешением, которые можно использовать для картирования стихийных бедствий. Цель настоящего исследования — продемонстрировать преимущества рабочего процесса, основанного на компьютерном зрении, в качестве альтернативы традиционным методам дистанционного зондирования для оценки ущерба от наводнения с использованием снимков с малых спутников высокого разрешения. В этой презентации мы продемонстрируем подход к составлению карты масштабов наводнения в Йеллоустоуне в 2022 году с учетом изображений с высоким разрешением до и после наводнения, сделанных Planet. Мы представим структуру анализа и сравним наши результаты с другими продуктами дистанционного зондирования (например, Landsat), чтобы продемонстрировать эффективность нашего подхода. Наша методология может быть расширена для обнаружения и оценки ущерба, связанного с наводнениями, в городской среде.

Использование данных о планетах в высоком разрешении для получения информации о свойствах аэрозолей во время лесных пожаров 2020 года

Четверг, 15 декабря 2022 г., 10:20

Атмосферные аэрозоли диаметром менее 2,5 мкм (PM2,5) вносят важный вклад в загрязнение воздуха в городах. В то время как антропогенные выбросы являются основным источником загрязнения PM2,5 в городских районах, эпизодическое появление дыма от лесных пожаров увеличивает загрязнение городов, вызывая превышение. В этом исследовании представлен обзор алгоритма машинного обучения для обнаружения аэрозолей в планетарных данных очень высокого разрешения с последующим извлечением свойств аэрозоля с использованием моделирования переноса излучения. Этот доклад будет посвящен рекордному сезону лесных пожаров 2020 года в Калифорнии. Чтобы идентифицировать аэрозоли в сценах PlanetScope, собранных за этот сезон, мы рассмотрели возможность использования трех классификаторов машинного обучения (ML): классификатора минимального расстояния, классификации максимального правдоподобия и классификатора случайного леса. Мы также сравнили данные Planet с продуктом MODIS Level 2 AOD и обнаружили корреляцию, среднеквадратичную ошибку, точность и погрешность 0,67, 0,75 и 0,11 соответственно.

Облачный рабочий процесс для публикации, обнаружения, обработки и визуализации геопространственных данных

Четверг, 15 декабря 2022 г., 14:55

НАСА использует готовые к анализу данные, оптимизированные для облака (ARCO), для поддержки множества инициатив, включая открытую науку. Проект визуализации, исследования и анализа данных (VEDA) направлен на создание облачной системы данных, использующей ARCO. Некоторые из проблем при построении такой системы связаны со стандартизированной публикацией, обработкой и обнаружением данных ARCO. VEDA решает эти проблемы, создавая стандартный упрощенный рабочий процесс для преобразования данных ARCO, каталогизации с использованием каталогов пространственно-временных активов (STAC) и интерфейсов прикладного программирования (API) для распространения данных. VEDA также использует прошлые действия НАСА для обработки и визуализации данных. В документе обсуждаются технические детали и демонстрируются примеры использования VEDA.

Развертывание модели обучения с самоконтролем для поиска событий в пространстве и времени

Четверг, 15 декабря 2022 г., 15:45

Модель, основанная на обучении с самоконтролем (SSL), была введена в область наук о Земле как метод создания помеченных данных для обучения с учителем. SSL использовался для захвата характеристик оптических спутниковых изображений (в первую очередь спектрорадиометра визуализации среднего разрешения, MODIS, True Color). Доказательство концепции (POC) продемонстрировало, что модели, использующие изученные представления вместе с 5% доступных меток, смогли значительно превзойти обычную модель машинного обучения, обученную с нуля с 5% доступных меток. Переход от POC к операционной системе не всегда прост. Например, поиск похожих представлений изображения из более чем тысячи изображений станет непомерно дорогим, если не будет уделено должного внимания оптимизации затрат и вычислений. В этой презентации мы обсудим дизайн архитектуры, сложности и уроки, извлеченные при масштабировании и развертывании конвейера SSL с использованием индексированных спутниковых изображений за 21 год.

Оценка качества гармонизированных данных Landsat/Sentinel-2 (HLS) версии 2.0

Четверг, 15 декабря 2022 г., 10:00

Проект Harmonized Landsat/Sentinel-2 (HLS), совместный проект НАСА и Геологической службы США, в оперативном режиме производит данные об отражательной способности поверхности для всех неантарктических земель не реже одного раза в 3 дня с размером пикселя 30 м. Чтобы сделать данные сопоставимыми, как если бы они были получены с одного и того же датчика, при согласовании используется тот же код атмосферной коррекции LaSRC, разработанный Геологической службой США и GSFC/Университетом Мэриленда, тот же код маскирования облаков/теней Fmask, коррекция эффекта угла обзора с помощью BRDF. модель, тонкое согласование полос частот Sentinel-2 с полосами Landsat, а также привязку данных отражательной способности поверхности HLS и данных оценки качества к общей системе пространственной привязки. Продукты данных HLS обрабатываются из входных данных L1T или L1C с помощью облачной обработки командой NASA IMPACT и распространяются LP-DAAC. В этом документе демонстрируется влияние каждого из последовательных шагов согласования на получение коэффициента отражения поверхности как неотъемлемого свойства поверхности земли и оценивается качество коэффициента отражения поверхности на нескольких глобально распределенных испытательных площадках. Мы также обсудим предварительное исследование объединенного HLS-продукта с «лучшими пикселями», который сводит к минимуму облачный покров и обеспечивает регулярный временной пересмотр.

Должны ли мы создавать модели Фонда ИИ для наук о Земле?

Пятница, 16 декабря 2022 г., 17:55

Базовые модели — это модели ИИ, предварительно обученные на всеобъемлющем наборе данных и используемые для различных последующих задач. Модель фиксирует эмерджентное поведение в смоделированной системе на основе данных и является частью растущей тенденции в ИИ, стремящейся к гомогенизации для конкретной области. Языковые модели, такие как BERT или GPT-3, являются наиболее известными примерами этих моделей. Создание базовой модели включает в себя сбор данных, обучение и проверку. Учитывая обширный архив данных в области наук о Земле, модели фундамента обещают оказать существенное влияние и иметь широкую полезность. Например, базовая модель, основанная на ретроспективном анализе современной эпохи для исследований и приложений (MERRA), может принести пользу многим приложениям для прогнозирования атмосферы и погоды. Точно так же базовая модель, использующая данные оптического дистанционного зондирования, такие как Harmonized Landsat Sentinel (HLS), может помочь во многих приложениях землепользования/почвенного покрова. Являются ли базовые модели окончательным воплощением концепции цифрового двойника? Поскольку для создания базовых моделей требуются значительные ресурсы, как нам создать консорциумы с частным сектором, чтобы решить эту проблему? Данная презентация поставит эти вопросы для обсуждения на предлагаемом заседании.