Создание машин с человеческим мышлением требует отказа от статистики в пользу причинно-следственной связи.

Хотя в последние годы область ИИ переживает бум, мы все еще далеки от разработки машины, мыслящей по-человечески. Действительно, машины еще не могут адаптироваться к новым и другим условиям так же легко, как люди. Кроме того, компьютерные системы еще не обладают даром воображения, который был необходим для эволюции человечества. Эти ограничения проистекают из парадигмы обучения, принятой в настоящее время в этой области, которая основана исключительно на корреляционном обучении. В этой статье мы сначала пройдемся по истории области ИИ, посмотрев на то, как эта область развивалась на протяжении многих лет, и последовательно докажем, что революция в этой области еще раз обязательна. В частности, если мы действительно хотим построить машину на грани человеческого интеллекта, нам нужно отказаться от текущей парадигмы обучения, основанной на статистике и данных, в пользу причинно-ориентированного подхода.

В 1970-х и начале 1980-х ученые-компьютерщики считали, что манипулирования символами, априори предоставленными людьми, достаточно, чтобы компьютерные системы проявляли интеллект и могли решать, казалось бы, сложные задачи. Эта гипотеза стала известна как гипотеза правила символа.

Однако, несмотря на некоторый первоначальный обнадеживающий прогресс, такой как компьютерные шахматы и доказательство теорем, вскоре стало очевидно, что системы, основанные на правилах, не могут решить проблемы, которые кажутся людям простыми. Как сказал Ганс Моравец:

«Компьютеры сравнительно легко заставить работать на уровне взрослых […] и трудно или невозможно научить их навыкам годовалого ребенка».

Кроме того, системы, основанные на правилах, не могут хорошо работать в условиях неопределенности или противоречивых данных, которые носят повсеместный характер из-за случайных и систематических ошибок. Из-за этих ограничений и отсутствия перспектив интерес к ИИ снизился, и в этой области наступил период, известный как зима ИИ.

В конце концов, несколько лет спустя, в значительной степени независимо от области классического ИИ, начала появляться новая область, известная как Машинное обучение. Подобно ранней работе Розенблатта о персептроне, машинное обучение было построено на наблюдении, что представления и правила естественных интеллектуальных систем приобретаются из опыта посредством процессов эволюции и обучения, а не посредством гипотезы правил символов. С тех пор машинное обучение и особенно глубокое обучение, подобласть машинного обучения, основанная на искусственных нейронных сетях, добились самых замечательных успехов в области ИИ.

Однако, хотя эти грандиозные разработки застали многих ученых врасплох и заставили многих поверить в то, что появление сильного ИИ близко, мы все еще далеки от разработки машины на грани интеллекта человеческого уровня, и, возможно, мы не достигнем этого, если не произойдет существенного сдвига в исследованиях ИИ. Действительно, возможности обобщения современных современных систем ИИ по-прежнему крайне бедны, что ограничивает их применение узкими и специфическими задачами. Напротив, люди могут легко адаптироваться к новым и совершенно другим условиям.

Наиболее поразительны такие вопросы, как "Что, если я сделаю...", "Как...?", «Почему…?» и «Что, если бы я сделал…?», на которые людям относительно легко ответить. , недопустимы для компьютерных систем. В результате машины не могут рассуждать о возможных последствиях своих действий во внешней среде и выбирать среди этих преднамеренных изменений для получения желаемого результата. Кроме того, им не хватает воображения и ретроспективы, поскольку они не могут размышлять о своих прошлых действиях и представлять себе альтернативные сценарии.

Возможно, эти ограничения не вызывают удивления; в конце концов, современные системы машинного обучения работают исключительно в ассоциативном режиме, и в конечном итоге их успех сводится к четырем основным факторам: (i) предположение о независимых и одинаково распределенных случайных переменных, (ii) огромные объемы данных , (iii) модели с высокой производительностью и (iv) высокопроизводительные вычисления. Проще говоря, они пытаются подогнать функцию к необработанным данным, фиксируя статистические корреляции, а не рассуждая о сложной сети причинно-следственных связей, и они делают это, поглощая большие объемы необработанных данных и вычислительных ресурсов. Например, открытые зонты и дождливые дни — явления коррелированные, но только последнее имеет прямую причинно-следственную связь с первым. Таким образом, хотя люди с открытыми зонтами предполагают, что идет дождь, закрытые зонты не останавливают дождь. Хотя людям это может показаться тривиальным, машины пока не имеют ни малейшего представления о такого рода отношениях, и поэтому они могут предсказать, что закрытые зонты на самом деле останавливают дождь. Поэтому, подобно заключенным в «Аллегории пещеры» Платона, программы машинного обучения учатся предсказывать движение теней в пещере, но не понимают, что эти тени — всего лишь проекции трехмерных объектов.

Даже нашим предкам изначально не хватало причинных знаний, но, как утверждает Юваль Харари в своей книге Sapiens, как только люди начали понимать, что одни вещи вызывают другие и что игра с первыми может изменить последнее, мы развивались значительно более быстрыми темпами. Этот эволюционный процесс стал известен как Когнитивная революция. Все эти соображения предполагают, что мы не приблизимся к цели создания мыслящей человека машины, способной действовать в воображаемом пространстве в смысле Конрада Лоренца, если мы не встроим в нее ментальную модель, основанную на каузальном знании.

Для достижения этой цели Джуда Перл, один из наиболее выдающихся представителей новой науки под названием Причинность, предлагает внедрить «причинный вывод». движок» в будущих системах ИИ. Этот механизм причинно-следственного вывода представляет собой машину, которая получает запрос и набор данных в качестве входных данных, чтобы сгенерировать оценку и оценку ответа. Хотя оценку можно рассматривать как рецепт ответа на запрос, и она создается в соответствии с лежащей в основе причинно-следственной моделью, оценка является фактическим ответом в свете входных данных. Таким образом, в отличие от традиционного статистического подхода, роль данных сводится только к расчету оценки. Это сильно отличается от машинного обучения, которое вместо этого основано на обучении, управляемом данными.

Обоснование этого дизайна заключается в том, что необработанные данные по своей сути глупы. В самом деле, несмотря на то, что текущие тенденции в исследованиях, кажется, надеются, что подход, ориентированный на данные, приведет нас к правильному ответу всякий раз, когда возникают причинные вопросы, можно доказать, что на причинные вопросы нельзя ответить непосредственно на основе необработанных данных. Фактически причинно-следственные рассуждения требуют некоторых предположений о лежащем в основе процесса генерации данных, и область причинно-следственных связей показала, что мы можем формализовать эти предположения с помощью набора математических объектов, известных как причинные модели. .

Здесь мы должны отметить, что область Причинности традиционно предполагает, что каузальные модели априори даны людьми. Кроме того, предполагается, что причинные переменные, генерируемые лежащими в их основе причинными моделями, являются непосредственно наблюдаемыми. Однако эти предположения, как правило, нереалистичны.
Действительно, в некоторых областях наши знания находятся в таком зачаточном состоянии, что мы понятия не имеем о том, как устроен мир. Более того, наблюдения реального мира обычно не структурированы в единицы причинной переменной. Например, сначала необходимо извлечь объекты на изображениях, которые допускают причинно-следственные связи. Следовательно, поскольку машинное обучение вышло за рамки гипотезы правила символов, не требуя, чтобы символы были заданы априори, развивающаяся область причинности должна стремиться изучить причинные модели явлений реального мира и обнаружить их причинные переменные единицы из реального мира. наблюдения в автоматическом режиме. В конце концов, будущая машина с сильным ИИ, оснащенная механизмом причинного вывода, должна быть способна выдвигать гипотезы о некоторых предположениях о мире, а затем уточнять их по мере приобретения дополнительного опыта.

Эти недостатки можно устранить, воспользовавшись преимуществами машинного обучения. Действительно, обнаружение причинно-следственных переменных из неструктурированных необработанных данных и последовательное изучение лежащих в их основе причинно-следственных моделей — это операции, ориентированные на данные, и машинное обучение отлично справляется с этим. Кроме того, современные методы машинного обучения могут помочь нам преодолеть проклятие размерности на этапе статистической оценки механизма причинного вывода. Все это приводит нас к выводу, что если мы действительно хотим построить машину на грани человеческого интеллекта, то нам нужно объединить причинно-следственные связи и машинное обучение в единое поле: причинно-следственное машинное обучение.

Подводя итог, можно сказать, что нам предстоит еще долгий путь, чтобы построить машину с человеческим мышлением, и для достижения этой цели необходим сдвиг в текущих тенденциях исследований ИИ. Подобно тому, как область ИИ вышла за рамки гипотезы правил символов, приняв достижения машинного обучения, теперь необходимо отказаться от чисто статистической и управляемой данными парадигмы обучения в пользу причинно-ориентированного подхода. Тем не менее, инструменты зарождающейся области Причинности недостаточны для того, чтобы наделить машины даром причинного мышления. Вот почему, хотя эти две области возникли и развивались отдельно, причинно-следственная связь и машинное обучение должны быть объединены в новую и многообещающую область под названием причинно-следственное машинное обучение. Возможно, поскольку мы, люди, развивались значительно быстрее, когда начали задавать себе вопросы о причинно-следственных связях, и как только мы узнаем, как успешно сочетать причинно-следственную связь с машинным обучением, Сингулярность будет просто за углом.

Рекомендуемая литература:

  • Перл, Дж., и Маккензи, Д. (2019). Книга почему. Книги пингвинов.
  • Шёлькопф Б., Локателло Ф., Бауэр С., Ке Н.Р., Кальхбреннер Н., Гоял А. и Бенжио Ю. (2021). На пути к обучению каузальному представлению 2021. Препринт arXiv: 2102.11107.
  • Шёлькопф, Б., и фон Кюгельген, Дж. (2022). От статистического к причинному обучению. препринт arXiv arXiv:2204.00607.
  • Шёлькопф, Б. (2022). Причинность для машинного обучения. В Вероятностный и причинный вывод: работы Джудеи Перл (стр. 765–804).