Является ли тест Тьюринга или какой-либо из его вариантов надежным тестом искусственного интеллекта?

35

Тест Тьюринга был первым тестом искусственного интеллекта и сейчас немного устарел. Всего тест Тьюринга стремится быть более современный тест , который требует гораздо более сложную систему. Какие методы мы можем использовать для идентификации искусственного интеллекта (слабый ИИ) и искусственного общего интеллекта (сильный ИИ)?

Роб Мюррей
источник
6
Определенно требует статистического подхода с рядом участников. Я встречал людей, которые не прошли бы тест Тьюринга.
SF.
1
Это зависит от того, как вы определяете интеллект.
Баранскистад

Ответы:

16

Риторический смысл теста Тьюринга заключается в том, что он ставит «тест» на «человечность» в наблюдаемых результатах , а не во внутренних компонентах . Если бы вы взаимодействовали с ИИ так же, как и с человеком, как бы вы узнали разницу между ними?

Но это не значит, что это надежно, потому что интеллект имеет много различных компонентов и есть много видов интеллектуальных задач. Тест Тьюринга, в некоторых отношениях, касается реакции людей на поведение, которое вовсе не надежно - помните, что многие думали , что ELIZA , очень простой чат-бот, был отличным слушателем и очень быстро погрузился в глубокую эмоциональную реакцию. Это напоминает рекламу Ikea о том, чтобы выбросить лампу , где эмоциональная привязанность исходит от зрителя (и музыки), а не от лампы.

Тесты Тьюринга для конкретных видов экономической деятельности гораздо более интересны с практической точки зрения - если можно написать ИИ, который заменяет, например, драйвер Uber, то, что это будет означать, гораздо яснее, чем если бы кто-то мог создать диалогового чат-бота.

Мэтью Грейвс
источник
10

Проблема теста Тьюринга заключается в том, что он проверяет способность машин напоминать людей. Не обязательно каждая форма ИИ должна напоминать людей. Это делает тест Тьюринга менее надежным. Тем не менее, это все еще полезно, так как это фактический тест. Также следует отметить, что существует приз за прохождение или приближение ближе всего к прохождению теста Тьюринга, приз Лебнера .

Определение интеллекта интеллектуального агента гласит, что агент интеллектуален, если он действует так, чтобы максимизировать ожидаемое значение показателя производительности, основанного на прошлом опыте и знаниях. (перефразировано из Википедии ). Это определение используется чаще и не зависит от способности напоминать людей. Однако это сложнее проверить.

wythagoras
источник
7

Классический тест Тьюринга, безусловно, имеет ограничения. Поскольку я еще не упоминал об этом здесь, я предлагаю вам прочитать о «Китайской комнате» , которая является одной из наиболее часто упоминаемых причин, почему тест Тьюринга действительно не позволяет установить истинное «сознание». Однако я также хотел бы отметить, что сам Тьюринг в первоначальной статье, в которой предлагался тест Тьюринга , прямо признал себя, что этот тест не был тестом для обнаружения сознания :

Предлагаю рассмотреть вопрос: "Могут ли машины мыслить?" Это должно начинаться с определения значений терминов «машина» и «думать». Определения могут быть сформулированы таким образом, чтобы в максимально возможной степени отражать нормальное использование слов, но это отношение опасно, если смысл слов «машина» и «думать» можно найти, изучая, как они обычно используются. Трудно избежать вывода о значении и ответе на вопрос «Могут ли машины мыслить?» следует искать в статистическом обследовании, таком как опрос Гэллапа. Но это абсурд. Вместо того, чтобы пытаться дать такое определение, я заменю этот вопрос другим, который тесно связан с ним и выражен в относительно однозначных словах.

Новая форма проблемы может быть описана в терминах игры, которую мы называем «имитацией игры».

Эта имитационная игра является тестом, который мы теперь знаем сегодня (а также вдохновением для названия недавнего художественного фильма с участием Бенедикта Камбербэтча и Кира Найтли).

eric.mitchell
источник
1
Отличный ответ. Я также разделяю мнение о том, что переход от «Имитационной игры» к «Тесту Тьюринга» привел к некоторым глубоким заблуждениям относительно последствий. (Pornbots пройти тест Тьюринга все время;)
DukeZhou
5

Есть много определений искусственного интеллекта в дикой природе. Все эти определения являются частью одной (или нескольких) областей. Существует четыре основных домена, и картинка ниже проливает свет на это.

введите описание изображения здесь



Тест Тьюринга вращается вокруг левой стороны кардинальности, которая в основном связана с тем, как люди думают или действуют. Но мы знаем, что это не все. Тест Тьюринга мало что может предложить, когда речь идет о том, что ИИ в общем смысле.
Тест Тьюринга, как утверждает Википедия, был создан для тестирования машин, демонстрирующих поведение, эквивалентное или неотличимое от поведения человека. Искусственный интеллект - это гораздо больше, чем то, что люди могут делать или как они действуют. Есть много человеческих действий, которые считаются неразумными, а иногда и бесчеловечными.
Аргумент китайской комнаты фокусируется на чем-то очень важном, когда речь заходит о «Сознании против симуляции сознания»., Джон Сирл утверждал, что для машины (или человека) возможно следовать огромному количеству предопределенных правил (алгоритмов), чтобы выполнить задачу, не думая и не обладая умом. Слабые ИИ хорошо имитируют способность понимать, но на самом деле не понимают, что они делают. Они не демонстрируют «Самосознание» и не формируют представление о себе. «Я хочу, чтобы v / s, я знаю, что я хочу это» - это две разные вещи.

Как утверждает Теория Разума, хороший ИИ должен формировать не только представление о мире, над которым он работает, но и о других агентах и ​​сущностях в мире. Эти две концепции самосознания и теории разума проводят тонкую грань между слабым и сильным ИИ.

Когда дело доходит до теста Тьюринга, по многим причинам он терпит неудачу, как и тотальный тест Тьюринга, который добавляет к тесту еще один слой. Большинство исследователей считают, что тест Тьюринга - это всего лишь отвлечение от основной цели, что мешает им плодотворно работать. Подумайте об этом, предположим, вы задаете сложную арифметическую задачу, чтобы различить человека и машину. Если машина хочет притвориться, что это человек, она будет лгать. Это не то, что мы хотим. Переход к тесту Тьюринга устанавливает верхнюю границу ИИ, который можно создать. Также заставить ИИ вести себя и вести себя как люди - не очень хорошая идея. Люди не очень хорошо все время принимают правильные решения. Вот почему мы читаем о войнах в наших учебниках истории. Решения, которые мы принимаем, часто предвзяты, имеют корыстное происхождение и т. Д.

Я не думаю, что есть один тест для проверки ИИ. Это потому, что ИИ имеет много определений, много типов. Является ли ИИ слабым или сильным, можно пометить, когда он ищет ответы на такие вопросы, как «Я хочу то, что я знаю, я хочу это», «Кто я и что именно я делаю (с точки зрения машины)», плюс некоторые другие вопросы, которые я упоминал выше.

Ugnes
источник
3

Это зависит от того, как проводится тест. Например, когда люди утверждали, что машина успешно прошла тест Тьюринга несколько лет назад, критерии были довольно слабыми. Надо было одурачить 30% людей за 5 минут. Это не большая часть теста. Если рассматривать это в перспективе, вы, вероятно, не обнаружите шизофрению, аутизм, неспособность к обучению или слабоумие по этим критериям.

Несмотря на ажиотаж, текущие ИИ могут быть обнаружены 100% времени, используя довольно простые вопросы.

scientious
источник
Хорошая точка зрения. «При наличии достаточного количества вопросов ...» (Конечно, тест Войта-Кампфа кажется довольно эффективным при ограниченном количестве вопросов;)
DukeZhou
2

Является ли тест Тьюринга или какой-либо из его вариантов надежным тестом искусственного интеллекта?

близорукость

Да, если определить термин «искусственный интеллект» в терминах «Имитационной игры Алана Тьюринга» или одного из ее вариантов. Подход может быть одновременно и обоснованным, и очень ограниченным как определение интеллекта, так как люди интерпретировали слово до появления ИИ.

Проверенная разведка

Следовательно, существует большое количество альтернативных подходов к измерению интеллекта, искусственных или иных.

  • Стать шахматным гроссмейстером
  • Создание выигрышной шахматной программы
  • Получение высокой избирательной международной награды
  • Создание стратегии, которая выигрывает войну или мир
  • Преодолеть тысячи раундов ликвидации в бизнесе или политике, чтобы стать президентом
  • Создание блестящих статей, статей, сценариев, лекций, речей, книг или стихов, которые вызывают значительные сдвиги в человеческой парадигме
  • Отображение результатов уровня гения в тесте Mensa
  • Стать одним из самых богатых людей в мире

Нормальное измерение нормального интеллекта

Но это измерения исключительного интеллекта какого-то рода, главным образом потому, что лидеры в этих областях надежно применяли интеллект в нескольких областях таким образом, что привело к значительному успеху в многочисленных реальных сценариях. Надежность - это атрибут человека, обладающего интеллектом, а не проверка самого интеллекта.

Это более приземленные, но, возможно, более обоснованные и надежные меры интеллекта.

  • Воспитание здоровых и любящих детей как проверяемых путем тщательного опроса друзей и единомышленников членов семьи
  • Повторное и успешное исправление многих состояний различных типов, которые когда-то были определены как нарушенные каким-либо осязаемым и измеримым способом и признанные измеримыми исправленными в результате применения интеллектуального понимания, анализа и корректирующих действий.
  • Разговорный интеллект как измеримый через участников беседы, приписывающих их собственный успех идеям и примерам, установленным собеседником

Каковы действительно желаемые конечные цели?

Возможно, основной характеристикой теста Тьюринга является то, что он искусственный. Если искусственный интеллект - это то, что мы хотим от программного обеспечения ИИ, то это то, что мы получим. Однако, скорее всего, мы хотим чего-то значительно большего или значительно меньшего.

Мы хотим большего, потому что было бы неплохо, если бы некоторые компьютеры могли быть нашим другом, нашим наставником и неоплачиваемым сотрудником с исключительными способностями, ведущими к нашему личному успеху с точки зрения дохода, влияния, популярности или наследия.

Мы хотим меньше, потому что мы хотим, чтобы некоторые компьютеры выполняли специфичные для домена задачи и оставались полностью подчиненными инструментами, возможно, с некоторой индивидуальностью и теплотой, как корабль или другое сложное устройство, которое мы даем человеческим именам, но без непредсказуемости далеко идущих возможностей. человеческого интеллекта.

Дуглас Дасеко
источник