Итоги дня 042

В день 042 мы продолжили работу с функциями видео: Optical Flow. Мы узнали, что, оценивая оптический поток между видеокадрами, мы можем измерять скорости объектов на видео. Как правило, движущиеся объекты, находящиеся ближе к камере, будут отображать более заметное движение, чем удаленные объекты, движущиеся с той же скоростью.

Сегодня мы рассмотрим, как быстро отправлять функции.

Особенности: Как быстро их отправить?

Самый простой способ использовать машинное обучение для управления системой реального времени — это использовать наши модели классификатора или регрессии для вычисления нового набора выходных значений каждый раз, когда мы получаем новый вектор входных признаков. Это означает, что чем быстрее мы отправляем функции, тем быстрее могут меняться наши выходные данные, но также тем больше вычислений нам приходится выполнять.

Итак, насколько быстро нам нужно отправлять функции, действительно зависит от того, что мы хотим контролировать. Например, если мы контролируем звук, мы можем обнаружить, что нам нужна очень высокая скорость управления, чтобы звук не звучал прерывисто. Когда мы прислушиваемся к изменениям высоты тона, наши уши и мозг, как правило, очень чувствительны. Мы хотим обновлять поле очень быстро.

Если мы обновляем высоту тона, скорость от 10 до 20 миллисекунд дает нам что-то, что мы воспринимаем как плавное. Если мы обновляем другие параметры звука, такие как громкость или пространственное распределение, мы можем обнаружить, что существует другая скорость, с которой мы начинаем воспринимать некоторую изменчивость. Точно так же, если мы управляем анимацией, в зависимости от того, что мы анимируем, меняет ли она цвет или положение и в зависимости от величины изменения, нам снова может понадобиться найти скорость, с которой нам нужно отправлять обновления, чтобы воспринимать их. вещи как плавно меняются.

Если нам действительно нужно выполнять наше машинное обучение медленнее, чем один раз, скажем, 20 миллисекунд, если мы управляем высотой тона, мы могли бы в качестве альтернативы сделать некоторое сглаживание между этими значениями с помощью нашей программы синтеза. Мы должны иметь в виду, что если мы создаем контроллер жестов, в котором мы меняем звук или изображение, когда двигаем своим телом, нас заботит не только то, как вещи звучат или выглядят. Мы заботимся о том, как это чувствуется.

Мы можем обнаружить, что если что-то требует больше времени, чем, скажем, 20 миллисекунд или около того, чтобы отреагировать на наши действия, мы почувствуем некоторую задержку. Конечно, лучший способ узнать, насколько быстро нам нужно выполнять вычисления, чтобы наша система вела себя так, как мы хотим, — это попробовать ее.

Потрясающий. Это все на день 043. Надеюсь, вы нашли это информативным. Спасибо, что нашли время в своем графике и позволили мне быть вашим проводником в этом путешествии. И до следующего раза, будь легендой.

Справочник

https://www.kadenze.com/courses/machine-learning-for-musicians-and-artists-v/sessions/sensors-and-features-generating-useful-inputs-for-machine-learning