Федеративное обучение

Будущее технологий станет пересечением различных областей. В следующем мире — и, возможно, в нынешнем мире — существует внутренняя потребность в сотрудничестве различных областей и подполей.

Такое сотрудничество иногда происходит между различными областями; например, в генетике и вычислительной биологии мы можем видеть значительное сотрудничество между «биологами», «генетиками» и «компьютерными инженерами», которое привело к выдающимся результатам в повседневной жизни человека.

Существует еще один тип сотрудничества, который происходит, когда два человека в одной области, но в разных подобластях, принимают решение работать вместе, что и является примером этой средней статьи, о которой мы собираемся поговорить.

Федеративное обучение, также называемое распределенным обучением, — это нечто новое, в каком-то смысле новое! — область, находящаяся на пересечении вопросов «Концепции обучения» и «Встроенные системы».

Определение

Когда мы хотим объединить полученную информацию из разных моделей в одну модель.

Почему?

Из-за конфиденциальности, безопасности и времени мы не можем хранить всю нашу информацию в одном месте, но у нас есть информация в распределенной среде. У нас есть несколько узлов (например, разные больницы), и мы собираемся обучать разные модели для каждого узла (больницы) на своих собственных данных.

Плюсы

Мы можем обучать модели параллельно, поэтому мы экономим время.

Конфиденциальность обеспечена, а вероятность утечки данных сведена к минимуму.

Минусы

Данные не IID, что является фундаментальной проблемой централизованного машинного обучения (обычного машинного обучения!), и у нас есть некоторые проблемы с обобщением.

Другая проблема — синхронизация параметров моделей. Больницы могут отправлять свои параметры и гиперпараметры в разное время, поэтому одновременный вывод единой модели или обратной связи требует дополнительных усилий.

Дисбаланс данных — еще одна вероятная проблема. Предположим, у нас есть 3 больницы, в которых есть данные о пациентах x, 2x и 10x соответственно. Как мы собираемся вывести одну модель из трех полученных кортежей? Это кажется каким-то сложным.

Другое дело — объяснение моделей, которое тоже связано с предыдущими причинами. Мы собираем данные из разных больниц, которые могут находиться далеко друг от друга. В каждом месте или стране могут быть свои особенности или специфические проблемы, которые никак не связаны с проблемами других мест. Эта проблема решается разными подходами. Один из них — разделение моделей на 2 части: Общая часть (одна и та же часть для всех моделей) — Специфическая часть (индивидуализированная часть каждой модели с учетом региона и других особенностей, связанных с ее местоположением и пациентами).

Будущая работа?

Всегда есть возможность поработать над дополнительными проблемами. Мы всегда можем сделать несколько шагов, чтобы повысить производительность x до производительности 1.01x, и иногда есть способ внести значительные изменения в эти поля.

Проблемы заключаются в следующем:

Время
Энергия (потребляется узлами и центральным узлом)
Объясняемость и обобщение моделей
Обработка без IID

Спасибо, что прочитали эту статью. Если у вас есть какие-либо отзывы по поводу этой статьи, не стесняйтесь обращаться ко мне по адресу [email protected].