Встраивание слов соответствует теории цвета Кандинского

Быстрый эксперимент на стыке искусства и науки

Введение

В этой статье я описываю быстрый эксперимент, целью которого является количественная оценка ассоциаций между двумя, казалось бы, ортогональными наборами — основными формами и основными цветами — с использованием представлений встраивания слов и косинусного сходства для проверки теории формы и цвета Василия Кандинского. Однако, несмотря на то, что использование косинусного сходства для измерения ассоциаций между словами широко распространено в литературе по обработке естественного языка, и хотя результаты этого эксперимента положительны (т. подтверждение теории и не руководство, освещающее передовые методы экспериментирования в науке о данных, а скорее призыв подвергнуть сомнению значение сходства косинусов в качественном контексте, как более подробно описано в разделе «Обсуждение».

Форма и цвет

Летом или около того, изучая Баухаус (я хотел попытаться мыслить формами, а не словами, для разнообразия), я наткнулся на Упражнение Кандинского по форме и цвету Исследовательского института Гетти; будучи ценителем различных упражнений, викторин, головоломок и т. д., которые можно найти в Интернете, как и я, и будучи искренне заинтригован вопросом, поставленным в частности этим упражнением (например, Какая форма является цветом?), как и я, Я решил попробовать.

В упражнении участников просто просят сопоставить один к одному {круг, треугольник, квадрат} с {красным, синим, желтым}, и, немного подумав над этой задачей, я решил, что сначала треугольники были красными (они самые заостренные, а красные). имеет свою резкость), то круги были желтыми (может быть, слишком повлияли на желтые круги детских книжных солнышек), и, наконец, что квадраты должны быть голубыми (море на горизонте, кстати); взволнованно, я перешел к следующему экрану, чтобы увидеть, был ли я прав (желая предположить, что кто-то может быть прав в отношении поставленного вопроса).

Моя модель была неправильной. Согласно теории Кандинского, треугольники — желтые (желтый — резкий цвет, за который я принял красный), круги — синие (сочетая их округлость с глубиной и спокойствием синего), а квадраты — красные («сильные» и «напористые», отражающие присущее «натяжение» прямоугольности плоскости). (Прочитав их, я полностью согласен с этими объяснениями и принимаю их как правильные — это прекрасные объяснения, — но мне нравятся мои собственные, даже если они чрезмерно расширены, основаны на вторичных представлениях и зависят от рассуждения post hoc соответственно.)

Проверка теории Кандинского

Чтобы проверить свою теорию, Кандинский представил своим ученикам опрос (аналогичный приведенному выше упражнению), попросив их сопоставить форму с цветом; Я не знаю, упустил ли он свою модель во время преподавания, но большинство ответов действительно совпадали с моделью Кандинского.

В отличие от студентов Кандинского, на которых его модель могла повлиять до завершения опроса (в конце концов, они учились у него), я не вижу реальных оснований предполагать, что сама модель повлияла на большую случайную выборку англоговорящих ( таких как тот, на тексте которого можно обучать встраивания word2vec [3]) до такой степени, что существует выравнивание этих наборов форм и цветов в самом английском языке из-за конкретной модели (т. Е. Использование слов в стандартный английский кажется независимым от модели).

Поэтому я провел эксперимент с предварительно обученными вложениями word2vec, чтобы увидеть, есть ли какая-либо закономерность, заслуживающая внимания в косинусном сходстве между парными формами и цветами, результаты которого напечатаны ниже; хорошо, они также совпадают с моделью Кандинского (!?), где «треугольник» ближе всего к «желтому», «круг» к «синему», а «квадрат» к «красному».

Обсуждение

Хотя я не стал бы обязательно называть модель Кандинского подтвержденной моим маленьким экспериментом (Что означает, что форма круга имеет «внутренний резонанс» с синим цветом? Насколько влияла работа Кандинского на ассоциации и, следовательно, наш язык?), результаты — даже если они являются всего лишь удачными корреляциями — интересно рассматривать вместе с встраиванием слов как способ количественной оценки концептуальной информации [1, 2, 4].

Рассмотрим в качестве еще одного примера, что хотя ранги для набора цветов {красный, синий, желтый} соответствуют модели Кандинского для набора форм {круг, треугольник, квадрат}, путем расширения списка цветов до {розового, малинового, красный, темно-бордовый, коричневый, розовый, лососевый, коралловый, шоколадный, оранжевый, слоновая кость, золотой, желтый, оливковый, зеленовато-желтый, салатовый, зеленый, аквамарин, бирюзовый, лазурный, цвет морской волны, голубой, бирюзовый, желтовато-коричневый, бежевый, синий, темно-синий, дым, сланец, фиолетовый, фиолетовый, слива, индиго, лаванда, пурпурный, белый, серебристый, серый, черный}, например, мы находим, что «квадрат», который имел наименьшее сходство с его верхним цветом из исходного набора, на самом деле более «малиновый» или «коралловый», чем «красный» (сходство 0,153 и 0,171 соответственно по сравнению с 0,140 у «красного»), и что он также более «зеленый» и «оранжевый» (0,171 и 0,155). (Интересно, однако, что «желтый» и «синий» по-прежнему являются основными цветами «треугольника» и «круга».)

Так что, хотя я, возможно, и получил некоторое удовольствие от этого эксперимента, и хотя я был удивлен, что результаты совпали с теорией, я бы не сказал, что подтвердил теорию, поскольку все еще есть вопросы, которые стоит задать, связанные со значением косинусного сходства. в этом контексте (например, где проходит граница между ассоциацией и неассоциацией?, достаточно ли стратегии ассоциации «победитель получает все»?) и механизм, посредством которого эти корреляции становятся присутствующими в языке (например, связь между треугольниками и желтым, чем их резкость?, Синие ли круги из-за гладкости, имитирующей спокойствие, или из-за их изгиба, подобного озеру, увиденному сверху? ?)

Заключение

Несмотря на узкие рамки моего эксперимента и (возможно, странный) вопрос, на котором он основан (т. здесь можно сказать, что это отражает удивление, которое я видел выраженным по отношению к языковым моделям, таким как ChatGPT; таким образом, в более широком смысле я считаю, что скептицизм, с которым я рассматривал результаты моего эксперимента, должен отразиться на более общем рассмотрении выходных данных языковых моделей.

Наш язык (наша система понятий) явно достаточно хорошо структурирован, чтобы модели, обученные на нем, улавливали его паттерны таким образом, который может произвести впечатление (особенно когда то, что делают модели, плохо понимают); однако, оценивая такие модели (решая, впечатлены ли мы их возможностями или доверяем ли мы их выводам), я думаю, мы можем переоценить важность нашего намерения говорить по сравнению с моделями нашей речи в нашем понимании. нас самих как говорящих существ; другими словами, в то время как люди говорят с намерением (какой-то комплекс биологии и обучения) и в соответствии с лингвистическими шаблонами, модели генерируют текст только в соответствии с лингвистическими шаблонами (я не вижу причин предполагать намерение); этой возможности, по-видимому, достаточно для создания связных текстов (по крайней мере, для коротких текстов), но также возникают вопросы о том, почему один текст был сгенерирован вместо другого.

Возвращаясь к эксперименту, представленному в этой статье, можно сказать, что, возможно, теория Кандинского верна в том смысле, что она улавливает что-то о формах и цветах, что действительно существует, и, возможно, то, что действительно существует, затем улавливается в нашем языке (возможно, благодаря самой формулировке теории). ), но без знания механизма (без прочесывания данных или анализа вложений, чтобы проследить причину, по которой результаты совпадают с теорией), что у нас есть, кроме того, что у нас уже было, украшенное некоторыми числами?

Рекомендации

  1. Гарг, Нихил, Лонда Шибингер, Дэн Джурафски и Джеймс Зоу. 2018. Словесные вложения определяют 100 лет гендерных и этнических стереотипов. Известия Национальной академии наук 115 (16). https://doi.org/10.1073/pnas.1720347115.
  2. Козловски, Остин С., Мэтт Тэдди и Джеймс А. Эванс. 2019. Геометрия культуры: анализ значений класса с помощью встраивания слов. American Sociological Review 84 (5): 905–49. https://doi.org/10.1177/0003122419877135.
  3. Миколов, Томас, Кай Чен, Грег Коррадо и Джеффри Дин. 2013. Эффективная оценка представлений слов в векторном пространстве, январь. http://arxiv.org/abs/1301.3781.
  4. Штольц, Дастин С. и Маршалл А. Тейлор. 2021. Культурная картография с встраиванием слов. Поэтика 88 (октябрь): 101567. https://doi.org/10.1016/j.poetic.2021.101567.