МЕТОДЫ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ

Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 29 апреля 2016 года; проверки требуют 42 правки.

Психологическое тестирование используется в различных сферах: профориентации, профотборе, психологическом консультировании, планировании коррекционной работы, исследовательской деятельности и т. д.

Психологический тест — стандартизированная методика, направленная на измерение индивидуальных свойств и качеств респондента (психофизиологических и личностных характеристик, способностей, знаний и навыков, состояний).

Качество теста обеспечивается многоступенчатой процедурой проверки и стандартизации его шкал.

Пример: психологические тесты

Понятие «психологическое тестирование»

С появлением первых тестов наиболее употребляемым термином, с помощью которого обозначается измерение индивидуально-психологических особенностей, стал термин «психологическое тестирование». Первоначально термин «психологическое тестирование» использовался широко, включая в себя любое измерение в психологической науке. По мере развития тестов, сфера психологического тестирования сузилась до измерения личностных и когнитивных особенностей. Термин «психодиагностика» впервые озвучил в 1921 году Г. Роршах, назвав так процесс обследования с помощью созданного им «теста чернильных пятен», названного позже тестом Роршаха. Далее термин «психодиагностика» использовался как синоним термина «психологическое тестирование», постепенно заменяя его употребление. Появление понятия «психодиагностика» связано со становлением проективного подхода, открывающего целостную картину личности, и кризисом психометрических тестов, «раскладывающих» личность испытуемого на отдельные функции. В этот период начинают использоваться достаточно обширные теории проективного подхода, разрабатываемые психоаналитическими авторами. Длительное время понятие «психодиагностика» отождествляется с проективными тестами, и используется в работах немецких и швейцарских психологов. В научной литературе США продолжает развиваться понятие «психологическое тестирование» вплоть до 1970-х годов, и обозначает все то, что связано с разработкой и применением любых психологических тестов. За этот период публикуется большое количество исследований по истории психологического тестирования, постепенно термин «психодиагностика» вытесняется из употребления.

Вышеописанные обстоятельства свидетельствуют о любопытном феномене, связанном с развитием области исследований по измерению индивидуально-психологических различий и отсутствием должного названия этой области, так как термин «психологическое тестирование» пригодный скорее для обозначения процесса применения тестов, но не области науки.

В 70-х годах 20 столетия в области индивидуальных различий на территории стран Западной Европы и США вместо термина «психологическое тестирование» все чаще применяется понятие — психологическая оценка (англ. ).

На территории России благодаря усилиям Б. Г. Ананьева, возглавляющего в 1960-х годах Ленинградскую психологическую школу, описанное направление исследований получило название «психологическая диагностика».

В первом советском учебном пособии по психодиагностике (под редакцией А. А. Бодалева и В. В. Столина в 1987 году) описанная отрасль психологических знаний — «это наука и практика постановки психологического диагноза».

Характеристики психологических тестов

Тестирование в работе с персоналом используется как один из методов отбора и развития сотрудников. Различаются две категории тестов:

Трудовой кодекс не предусматривает (но и не запрещает) проведения психологического тестирования ни при приеме на работу, ни с работниками, с которыми трудовой договор уже заключен. В работе правоохранительных органов психофизиологическое исследование является гласным оперативно-розыскным мероприятием. В начале 90-х годов тестирование применялось в отношении кандидатов на определенные посты в правительстве государства, позднее оно было отменено и в настоящее время такое тестирование не применяется. Незаконное «тестирование» может повлечь неблагоприятные последствия для предприятия и для его руководителя. С этой целью в коллективных договорах, правилах внутреннего трудового распорядка, положениях о приеме на работу и т. д. указывается на возможность прохождения работниками различного рода тестирований и исследований (как и аттестаций). При приеме на работу каждый ознакамливается с данными документами.

В частности, для приема на работу в правоохранительные органы обязательным является прохождение СМИЛ-теста (MMPI) и теста Люшера.

Тесты призваны показать узнать состояние человека путём исследования множественных факторов, влияющих на человека из окружающего мира.

Примеры психодиагностических тестов, реализуемых некоторыми современными компьютерными программами.

Тест Тью́ринга — эмпирический тест, идея которого была предложена Аланом Тьюрингом в статье «Вычислительные машины и разум», опубликованной в 1950 году в философском журнале Mind. Тьюринг задался целью определить, может ли машина мыслить.

Стандартная интерпретация теста Тьюринга

Стандартная интерпретация этого теста звучит следующим образом: «Человек взаимодействует с одним компьютером и одним человеком. На основании ответов на вопросы он должен определить, с кем он разговаривает: с человеком или компьютерной программой. Задача компьютерной программы — ввести человека в заблуждение, заставив сделать неверный выбор».

Все участники теста не видят друг друга. Если судья не может сказать определённо, кто из собеседников является человеком, то считается, что машина прошла тест. Чтобы протестировать именно интеллект машины, а не её возможность распознавать устную речь, беседа ведётся в режиме «только текст», например, с помощью клавиатуры и экрана (компьютера-посредника). Переписка должна производиться через контролируемые промежутки времени, чтобы судья не мог делать заключения, исходя из скорости ответов. Во времена Тьюринга компьютеры реагировали медленнее человека. Сейчас это правило тоже необходимо, потому что они реагируют гораздо быстрее, чем человек.

Хотя исследования в области искусственного интеллекта начались в 1956 году, их философские корни уходят глубоко в прошлое. Вопрос, сможет ли машина думать, имеет долгую историю. Он тесно связан с различиями между дуалистическим и материалистическим взглядами.
С точки зрения дуализма, мысль не является материальной (или, по крайней мере, не имеет материальных свойств), и поэтому разум нельзя объяснить только с помощью физических понятий.
С другой стороны, материализм гласит, что разум можно объяснить физически, таким образом, оставляя возможность существования разумов, созданных искусственно.

В 1936 году философ Альфред Айер рассмотрел обычный для философии вопрос касательно других разумов: как узнать, что другие люди имеют тот же сознательный опыт, что и мы? В своей книге «Язык, истина и логика» Айер предложил алгоритм распознавания осознающего человека и неосознающей машины: «Единственным основанием, на котором я могу утверждать, что объект, который кажется разумным, на самом деле не разумное существо, а просто глупая машина, является то, что он не может пройти один из эмпирических тестов, согласно которым определяется наличие или отсутствие сознания». Это высказывание очень похоже на тест Тьюринга, однако точно неизвестно, была ли известна Тьюрингу популярная философская классика Айера.

К 1956 году британские учёные уже на протяжении 10 лет исследовали «машинный интеллект». Этот вопрос был обычным предметом для обсуждения среди членов «Ratio Club» — неформальной группы британских кибернетиков и исследователей в области электроники, в которой состоял и Алан Тьюринг, в честь которого был назван тест.

Таким образом, к моменту публикации в 1950 году статьи «Вычислительные машины и разум» Тьюринг уже на протяжении многих лет рассматривал возможность существования искусственного интеллекта. Тем не менее данная статья стала первой статьёй Тьюринга, в которой рассматривалось исключительно это понятие.

Тьюринг начинает свою статью утверждением: «Я предлагаю рассмотреть вопрос „Могут ли машины думать?“». Он подчёркивает, что традиционный подход к этому вопросу состоит в том, чтобы сначала определить понятия «машина» и «интеллект». Тьюринг, однако, выбрал другой путь; вместо этого он заменил исходный вопрос другим, «который тесно связан с исходным и формулируется относительно недвусмысленно». По существу, он предлагает заменить вопрос «Думают ли машины?» вопросом «Могут ли машины делать то, что можем делать мы (как мыслящие создания)?». Преимуществом нового вопроса, как утверждает Тьюринг, является то, что он проводит «чёткую границу между физическими и интеллектуальными возможностями человека».

Чтобы продемонстрировать этот подход, Тьюринг предлагает тест, придуманный по аналогии с игрой для вечеринок «Imitation game» — имитационная игра. В этой игре мужчина и женщина направляются в разные комнаты, а гости пытаются различить их, задавая им серию письменных вопросов и читая напечатанные на машинке ответы на них. По правилам игры и мужчина, и женщина пытаются убедить гостей, что всё наоборот. Тьюринг предлагает переделать игру следующим образом: «Теперь зададим вопрос, что случится, если в этой игре роль А будет исполнять машина? Будет ли задающий вопросы ошибаться так же часто, как если бы он играл с мужчиной и женщиной? Эти вопросы заменяют собой исходный „Может ли машина думать?“».

В том же докладе Тьюринг позднее предлагает «эквивалентную» альтернативную формулировку, включающую судью, который беседует только с компьютером и человеком. Наряду с тем, что ни одна из этих формулировок точно не соответствует той версии теста Тьюринга, которая наиболее известна сегодня, в 1952 году учёный предложил третью. В этой версии теста, которую Тьюринг обсудил в эфире радио Би-Би-Си, жюри задаёт вопросы компьютеру, а роль компьютера состоит в том, чтобы заставить значительную часть членов жюри поверить, что он на самом деле человек.

В статье Тьюринга учтены 9 предполагаемых вопросов, которые включают все основные возражения против искусственного интеллекта, поднятые после того, как статья была впервые опубликована.

Элиза и PARRY

Блей Витби указывает на четыре основные поворотные точки в истории теста Тьюринга — публикация статьи «Вычислительные машины и разум» в 1950 году, сообщение о создании Джозефом Вейценбаумом программы Элиза (ELIZA) в 1966, создание Кеннетом Колби программы PARRY, которая была впервые описана в 1972 году, и Коллоквиум Тьюринга в 1990.

Работа Колби — PARRY — была описана как «Элиза с мнениями»: программа пыталась моделировать поведение параноидального шизофреника, используя схожий (если не более продвинутый) с Элизой подход, применённый Уайзенбаумом. Для того чтобы проверить программу, PARRY тестировали в начале 70-х, используя модификацию теста Тьюринга. Команда опытных психиатров анализировала группу, составленную из настоящих пациентов и компьютеров под управлением PARRY, используя телетайп. Другой команде из 33 психиатров позже показали стенограммы бесед. Затем обе команды попросили определить, кто из «пациентов» — человек, а кто — компьютерная программа. Психиатры лишь в 48 % случаев смогли вынести верное решение. Эта цифра согласуется с вероятностью случайного выбора. Эти эксперименты не являлись тестами Тьюринга в полном смысле, так как для вынесения решения данный тест требует, чтобы вопросы можно было задавать в интерактивном режиме, вместо чтения стенограммы прошедшей беседы.

Почти все разработанные программы и близко не подошли к прохождению теста. Хотя такие программы, как Элиза, иногда заставляли людей верить, что они говорят с человеком, как, например, в неформальном эксперименте, названном , но эти случаи нельзя считать корректным прохождением теста Тьюринга по целому ряду причин:

В 1980 году в статье «Разум, мозг и программы» Джон Сёрль выдвинул аргумент против теста Тьюринга, известный как мысленный эксперимент «Китайская комната». Сёрль настаивал, что программы (такие как Элиза) смогли пройти тест Тьюринга, просто манипулируя символами, значения которых они не понимали. А без понимания их нельзя считать «разумными» в том же смысле, что и людей. « Таким образом, — заключает Сёрль, — тест Тьюринга не является доказательством того, что машина может думать, а это противоречит изначальному предположению Тьюринга».

Такие аргументы, как предложенный Сёрлем, а также другие, основанные на философии разума, породили намного более бурные дискуссии о природе разума, возможности существования разумных машин и значимости теста Тьюринга, продолжавшиеся в течение 80-х и 90-х годов.

В 1990 году состоялась сороковая годовщина публикации статьи Тьюринга «Вычислительные машины и разум», что возобновило интерес к тесту. В этом году произошли два важных события.

Одно из них — коллоквиум Тьюринга, который проходил в апреле в Университете Сассекса. В его рамках встретились академики и исследователи из разнообразных областей науки, чтобы обсудить тест Тьюринга с позиций его прошлого, настоящего и будущего.

Вторым событием стало учреждение ежегодного соревнования на получение премии Лёбнера.

Ежегодный конкурс «AI Loebner» на получение премии Лёбнера является платформой для практического проведения тестов Тьюринга. Первый конкурс прошёл в ноябре 1991 года. Приз гарантирован Хью Лёбнером (Hugh Loebner). Кембриджский центр исследований поведения, расположенный в Массачусетсе (США), предоставлял призы до 2003 года включительно. По словам Лёбнера, соревнование было организовано с целью продвижения вперёд в области исследований, связанных с искусственным интеллектом, отчасти потому, что «никто не предпринял мер, чтобы это осуществить».

Появление конкурса на получение премии Лёбнера привело к возобновлению дискуссий о целесообразности теста Тьюринга, о значении его прохождения. В статье «Искусственная тупость» газеты The Economist отмечается, что первая программа — победитель конкурса смогла выиграть отчасти потому, что она «имитировала человеческие опечатки». ( Тьюринг предложил, чтобы программы добавляли ошибки в вывод, чтобы быть более хорошими «игроками»). Существовало мнение, что попытки пройти тест Тьюринга просто препятствуют более плодотворным исследованиям.

Во время первых конкурсов была выявлена вторая проблема: участие недостаточно компетентных судей, которые поддавались умело организованным манипуляциям, а не тому, что можно считать интеллектом.

Тем не менее с 2004 года в качестве собеседников в конкурсе принимают участие философы, компьютерные специалисты и журналисты.

Коллоквиум по разговорным системам, 2005

В ноябре 2005 года в Университете Суррея проходила однодневная встреча разработчиков ACE, которую посетили победители практических тестов Тьюринга, проходивших в рамках конкурса на получение премии Лёбнера: Робби Гарнер (Robby Garner), Ричард Уоллес (Richard Wallace), Ролл Карпентер (Rollo Carpenter). В числе приглашённых докладчиков были Дэвид Хэмилл (David Hamill), Хью Лёбнер и Хьюма Ша.

Симпозиум общества AISB по тесту Тьюринга, 2008

В 2008 году наряду с проведением очередного конкурса на получение премии Лёбнера, проходившего в Университете Рединга (University of Reading), Общество изучения искусственного интеллекта и моделирования поведения (The Society for the Study of Artificial Intelligence and Simulation of Behavior — AISB) провело однодневный симпозиум, на котором обсуждался тест Тьюринга. Симпозиум организовали Джон Бенден (John Barnden), Марк Бишоп (Mark Bishop), Хьюма Ша и Кевин Ворвик. В числе докладчиков были директор Королевского института баронесса Сьюзан Гринфилд (Susan Greenfield), Сельмер Брингсорд (Selmer Bringsjord), биограф Тьюринга Эндрю Ходжес (Andrew Hodges) и учёный Оуэн Холланд (Owen Holland). Никакого соглашения о каноническом тесте Тьюринга не появилось, однако Брингсорд предположил, что более крупная премия будет способствовать тому, что тест Тьюринга будет пройден быстрее.

Год Алана Тьюринга и Тьюринг-100 в 2012

В 2012 году отмечался юбилей Алана Тьюринга. На протяжении всего года проходило множество больших мероприятий. Многие из них проводились в местах, имевших большое значение в жизни Тьюринга: Кембридж, Манчестер и Блетчли Парк. Год Алана Тьюринга Архивная копия от 11 июня 2011 на Wayback Machine курируется организацией TCAC (Turing Centenary Advisory Committee), осуществляющей профессиональную и организационную поддержку мероприятий в 2012 году. Также поддержкой мероприятий занимаются: ACM, ASL, SSAISB, BCS, BCTCS, Блетчи Парк, BMC, BLC, CCS, Association CiE, EACSL, EATCS, FoLLI, IACAP, IACR, KGS и LICS.

Для организации мероприятий по празднованию в июне 2012 года столетия со дня рождения Тьюринга создан специальный комитет, задачей которого является донести мысль Тьюринга о разумной машине, отражённую в таких голливудских фильмах, как «Бегущий по лезвию», до широкой публики, включая детей. В работе комитета участвуют: Кевин Ворвик, председатель, Хьюма Ша, координатор, Ян Бланд (Ian Bland), Крис Чапмэн (Chris Chapman), Марк Аллен (Marc Allen), Рори Данлоуп (Rory Dunlop), победители конкурса на получение премии Лёбнера Робби Гарне и Фред Робертс (Fred Roberts). Комитет работает при поддержке организации «Женщины в технике» (Women in Technology) и Daden Ltd.

Тест Тьюринга на русском языке, 2015

Имитационная игра согласно описанию Тьюринга в статье «Вычислительные машины и разум». Игрок С путём задавания серии вопросов пытается определить, кто из двух других игроков — мужчина, а кто — женщина. Игрок А, мужчина, пытается запутать игрока С, а игрок В пытается помочь С.

Первоначальный тест на основе имитационной игры, в котором вместо игрока А играет компьютер. Компьютер теперь должен запутать игрока С, в то время как игрок В продолжает пытаться помочь ведущему.

Существуют по крайней мере три основных варианта теста Тьюринга, два из которых были предложены в статье «Вычислительные машины и разум», а третий вариант, по терминологии Сола Трейджера (Saul Traiger), является стандартной интерпретацией.

Наряду с тем, что существует определённая дискуссия, соответствует ли современная интерпретация тому, что описывал Тьюринг, либо она является результатом неверного толкования его работ, все три версии не считаются равносильными, их сильные и слабые стороны различаются.

Тьюринг, как мы уже знаем, описал простую игру для вечеринок, которая включает в себя минимум трёх игроков. Игрок А — мужчина, игрок В — женщина и игрок С, который играет в качестве ведущего беседу, любого пола. По правилам игры С не видит ни А, ни В и может общаться с ними только посредством письменных сообщений. Задавая вопросы игрокам А и В, С пытается определить, кто из них — мужчина, а кто — женщина. Задачей игрока А является запутать игрока С, чтобы он сделал неправильный вывод. В то же время задачей игрока В является помочь игроку С вынести верное суждение.

В той версии, которую С. Г. Стеррет (S. G. Sterret) называет «Первоначальный тест на основе имитационной игры» (Original Imitation Game Test), Тьюринг предлагает, чтобы роль игрока А исполнял компьютер. Таким образом, задачей компьютера является притвориться женщиной, чтобы сбить с толку игрока С. Успешность выполнения подобной задачи оценивается на основе сравнения исходов игры, когда игрок А — компьютер, и исходов, когда игрок А — мужчина.

Теперь мы спросим: «Что произойдёт, если машина выступит в качестве игрока А в этой игре?» Будет ли ведущий принимать неправильные решения, когда игра ведётся таким образом, так же часто как если бы в игре принимали участие мужчина и женщина? Эти вопросы заменят наш первоначальный: «Могут ли машины думать?»

We now ask the question, «What will happen when a machine takes the part of A in this game?» Will the interrogator decide wrongly as often when the game is played like this as he does when the game is played between a man and a woman? These questions replace our original, «Can machines think?»

Второй вариант предложен Тьюрингом в той же статье. Как и в «Первоначальном тесте», роль игрока А исполняет компьютер. Различие заключается в том, что роль игрока В может исполнять как мужчина, так и женщина.

«Давайте рассмотрим конкретный компьютер. Верно ли то, что модифицируя этот компьютер с целью иметь достаточно места для хранения данных, увеличивая скорость его работы и задавая ему подходящую программу, можно сконструировать такой компьютер, чтобы он удовлетворительно выполнял роль игрока А в имитационной игре, в то время как роль игрока В выполняет мужчина?», — Тьюринг, 1950, стр. 442.

В этом варианте оба игрока А и В пытаются склонить ведущего к неверному решению.

Главной мыслью данной версии является то, что целью теста Тьюринга является ответ не на вопрос, может ли машина одурачить ведущего, а на вопрос, может ли машина имитировать человека или нет. Несмотря на то что идут споры о том, подразумевался ли этот вариант Тьюрингом или нет, Стеррет считает, что этот вариант Тьюрингом подразумевался и, таким образом, совмещает второй вариант с третьим. В это же время группа оппонентов, включая Трейджера, так не считает. Но это всё равно привело к тому, что можно назвать «стандартной интерпретацией». В этом варианте игрок А — компьютер, игрок В — человек любого пола. Задачей ведущего является теперь не определить, кто из них мужчина и женщина, а кто из них компьютер, а кто — человек.

Имитационная игра в сравнении со стандартным тестом Тьюринга

Существуют разногласия по поводу того, какой же вариант имел в виду Тьюринг. Стеррет настаивает на том, что из работы Тьюринга следуют два различных варианта теста, которые, согласно Тьюрингу, неэквивалентны друг другу. Тест, в котором используется игра для вечеринок и сравнивается доля успехов, называется Первоначальным тестом на основе имитационной игры, в то время как тест, основанный на беседе судьи с человеком и машиной, называют Стандартным тестом Тьюринга, отмечая, что Стеррет приравнивает его к стандартной интерпретации, а не ко второму варианту имитационной игры.

Стеррет согласен, что Стандартный тест Тьюринга (STT — Standard Turing Test) имеет недостатки, на которые указывает его критика. Но он считает, что напротив первоначальный тест на основе имитационной игры (OIG Test — Original Imitation Game Test) лишён многих из них в силу ключевых различий: в отличие от STT он не рассматривает поведение, похожее на человеческое, в качестве основного критерия, хотя и учитывает человеческое поведение в качестве признака разумности машины. Человек может не пройти тест OIG, в связи с чем есть мнение, что это является достоинством теста на наличие интеллекта. Неспособность пройти тест означает отсутствие находчивости: в тесте OIG по определению считается, что интеллект связан с находчивостью и не является просто «имитацией поведения человека во время разговора». В общем виде тест OIG можно даже использовать в невербальных вариантах.

Тем не менее другие писатели интерпретировали слова Тьюринга как предложение считать саму имитационную игру тестом. Причём не объясняется, как связать это положение и слова Тьюринга о том, что тест, предложенный им на основе игры для вечеринок, базируется на критерии сравнительной частоты успехов в этой имитационной игре, а не на возможности выиграть раунд игры.

Должен ли судья знать о компьютере?

В своих работах Тьюринг не поясняет, знает ли судья о том, что среди участников теста будет компьютер, или нет. Что касается OIG, Тьюринг лишь говорит, что игрока А следует заменить машиной, но умалчивает, известно ли это игроку С или нет. Когда Колби, Ф. Д. Хилф (F. D. Hilf), А. Д. Крамер (A. D. Kramer) тестировали PARRY, они решили, что судьям необязательно знать, что один или несколько собеседников будут компьютерами. Как отмечает А. Седжин (A. Saygin), а также другие специалисты, это накладывает существенный отпечаток на реализацию и результаты теста.

Сильной стороной теста Тьюринга является то, что можно разговаривать о чём угодно. Тьюринг писал, что «метод вопросов и ответов кажется подходящим для обсуждения почти любой из сфер человеческих интересов, которую мы хотим обсудить». Джон Хогеленд добавил, что «одного понимания слов недостаточно; вам также необходимо разбираться в теме разговора».
Чтобы пройти хорошо поставленный тест Тьюринга, машина должна использовать естественный язык, рассуждать, иметь познания и обучаться. Тест можно усложнить, включив ввод с помощью видео или, например, оборудовав шлюз для передачи предметов: машине придётся продемонстрировать способность к зрению и робототехнике. Все эти задачи вместе отражают основные проблемы, стоящие перед теорией об искусственном интеллекте.

Уступчивость и простота

Несмотря на все свои достоинства и известность, тест критикуют на нескольких основаниях.

Человеческий разум и разум в целом

Поведение человека и разумное поведение.

Направленность теста Тьюринга ярко выражена в сторону человека (антропоморфизм). Проверяется только способность машины походить на человека, а не разумность машины вообще. Тест неспособен оценить общий интеллект машины по двум причинам:

«Исследователи в области искусственного интеллекта уделяют мало внимания прохождению теста Тьюринга, — отмечают Рассел и Норвиг, — с тех пор как появились более простые способы проверки программ, например, дать задание напрямую, а не окольными путями, первой обозначить некоторый вопрос в чат-комнате, к которой подключены и машины, и люди». Тьюринг никогда не предполагал использовать свой тест на практике, в повседневном измерении степени разумности программ; он хотел дать ясный и понятный пример для поддержки обсуждения философии искусственного интеллекта.

Следует подчеркнуть, что Тьюринг не раскрывал в развёрнутом виде свои цели и идею создания теста. Исходя из условий прохождения можно предположить, что в его время интеллект человека доминировал во всех областях, то есть был сильнее и быстрее любого другого. В настоящее же время некоторые программы, имитирующие интеллектуальную деятельность, настолько эффективны, что превосходят разум среднестатистического жителя Земли в определённых узких областях. Следовательно, при определённых условиях они могут пройти тест.

Реальный интеллект и имитируемый интеллект

В своей работе Тьюринг писал по поводу этих аргументов следующее: «Я не хочу создать впечатление, будто я думаю, что у сознания нет никакой загадки. Существует, например, своего рода парадокс, связанный с любой попыткой определить его местонахождение. Но я не думаю, что эти загадки обязательно надо разгадать до того, как мы сможем ответить на вопрос, которому посвящена данная работа».

Экстраполируя экспоненциальный рост уровня технологии в течение нескольких десятилетий, футурист Рэймонд Курцвейл предположил, что машины, способные пройти тест Тьюринга, будут изготовлены, по грубым оценкам, около 2020 года. Это перекликается с законом Мура.

Вариации теста Тьюринга

Многочисленные версии теста Тьюринга, включая описанные ранее, уже обсуждаются довольно долгое время.

Модификация теста Тьюринга, в которой цель или одну, или более ролей машины и человека поменяли местами, называется обратным тестом Тьюринга. Пример этого теста приведён в работе психоаналитика Уилфреда Биона, который был в особенности восхищён тем, как активизируется мыслительная активность при столкновении с другим разумом.

Развивая эту идею, Р. Д. Хиншелвуд (R. D. Hinshelwood) описал разум как «аппарат, распознающий разум», отметив, что это можно считать как бы «дополнением» к тесту Тьюринга. Теперь задачей компьютера будет определить, с кем он беседовал: с человеком или же с другим компьютером. Именно на это дополнение к вопросу и пытался ответить Тьюринг, но, пожалуй, оно вводит достаточно высокий стандарт на то, чтобы определить, может ли машина «думать» так, как мы обычно относим это понятие к человеку.

Пример — Искаженная строка smwm

Тест Тьюринга со специалистом

Эта вариация теста описывается следующим образом: ответ машины не должен отличаться от ответа эксперта — специалиста в определённой области знаний.

Тест бессмертия — это вариация теста Тьюринга, которая определяет, качественно ли передан характер человека, а именно возможно ли отличить скопированный характер от характера человека, послужившего его источником.

Минимальный интеллектуальный Signal-тест (MIST)

MIST предложен Крисом Мак-Кинстри (Chris McKinstry). В этой вариации теста Тьюринга разрешены лишь два типа ответов — «да» и «нет». Обычно MIST используют для сбора статистической информации, с помощью которой можно измерить производительность программ, реализующих искусственный интеллект.

В этой вариации теста субъект (скажем, компьютер) считают разумным, если он создал нечто, что он сам хочет проверить на разумность.

Организаторы премии Хаттера считают, что сжатие текста на естественном языке является трудной задачей для искусственного интеллекта, эквивалентной прохождению теста Тьюринга.

Тест по сжатию информации имеет определённые преимущества над большей частью вариантов и вариаций теста Тьюринга:

Основными недостатками подобного теста являются:

Другие тесты интеллекта

Существует множество тестов на уровень интеллекта, которые используют для тестирования людей. Возможно, что их можно использовать для тестирования искусственного интеллекта. Некоторые тесты (например, Си-тест), выведенные из «Колмогоровской сложности», используются для проверки людей и компьютеров.

Двум командам программистов удалось победить в конкурсе BotPrize, который называют «игровой версией» теста Тьюринга. Сообщение о результатах теста приведено на сайте BotPrize, кратко его результаты анализирует NewScientist.

Однако критики утверждают, что Женя Густман является лишь «чатботом»:

Тесты для учеников школ

Евгения Солодова

Эксперт по предмету «Психология»

преподавательский стаж — 8 лет

Психологический тест — это специальный инструмент, который используется для диагностики психических особенностей индивида. Процедура создания теста не регламентирована, поэтому любой человек может создать свой тест.

История психологических тестов

Психологическое тестирование — это направление, возникшее из экспериментальной и дифференциальной психологии. Первый объект исследования психологов был представлен человеческими реакциями. Примером может быть сужение зрачка при вспышках света. В первую очередь, ученые исследовали индивидуальные реакции испытуемых на стимулы и устойчивые поведенческие модели в выбранных ситуациях.

В начале 19 века в качестве объекта психологического тестирования выступал интеллект человека. Первый тест, измеряющий когнитивные способности, — методика Бине-Симона. Этот инструмент был предназначен для определения умственных способностей людей, а его задания группировались по возрастам (3 – 13 лет). Для каждой возрастной группы были подобраны свои тесты.

Категория «интеллектуальный тест» была введена в психологию экспериментальным психологом Дж. М. Кеттелом, который активно продвигал идею о необходимости использования тестов с целью анализа закономерностей работы человеческой психики. Автор предлагал не менее пятидесяти тестов, измеряющих чувствительность, время реакции на стимул и др.

Разделить людей на группы в соответствии со степенью умственного развития позволила методика В. Штерна, который стал основателем дифференциальной психологии и ввел показатель IQ. Этот критерий считался равным частному от деления умственного возраст на хронологический возраст с дальнейшим умножением на сто.

Классификация тестов

Какой тест подойдет для той или иной ситуации, решить трудно. Психолог и психиатр должен проводить тестирование с опорой на жалобы и симптомы конкретного человека.

Тесты могут оценивать:

«Разновидности психологических тестов» 👇

Разновидности тестов выделяются в зависимости от подклассов и признаков, взятых за основу деления. Самое значимое деление представлено классификацией тестов по форме и содержанию.

В соответствии с формой тесты могут являться индивидуальными и групповыми, письменными и устными, бланковыми, предметными, аппаратурными и компьютерными. Также они делятся на вербальные и невербальные (практические).

Индивидуальные тесты представляют собой вид методик, в которых взаимодействие экспериментатора и испытуемого осуществляется наедине. Этот тип теста обладает своими преимуществами, поскольку психолог получает возможность наблюдать за человеком (мимикой и непроизвольными реакциями). Он слышит и фиксирует непредусмотренные инструкцией высказывания, что позже позволит дать оценку отношению к обследованию, отметить функциональное состояние.

Индивидуальный вид тестов чаще всего требуется в работе с детьми младенческого и дошкольного возраста. Также он предназначен для тестирования лиц, у которых обнаружены соматические нарушения или физические недостатки. Разновидность тестов требует большое количество времени на осуществление эксперимента, поэтому ее считают менее экономичной в сравнении с групповым тестом.

Групповые тесты дают возможность одновременно провести обследование очень большой группы людей (до нескольких сотен испытуемых). При этом виде тестирования важно особенно строго соблюдать единообразие условий проведения эксперимента, поскольку обработка результатов объективизируется и для нее не требуется высокая квалификация.

Недостатки группового тестирования заключаются в том, что у экспериментатора мало возможностей в установке взаимопонимания с испытуемыми, пробуждении у них интереса и обеспечении сотрудничества. Любое случайное состояние испытуемого (например, болезнь, утомление, беспокойство и тревожность), влияющее на выполнение заданий, труднее выявляется в рамках группового тестирования.

Выделяют еще несколько видов тестов:

Вербальное тестирование берут за основу при отборе персонала на различные вакансии. Задания теста позволяют оценить способность человека к верному и логическому восприятию информации в письме, включая её интерпретацию. Помимо этого, результаты вербального теста дают возможность выявить способность к формированию логических выводов, самостоятельности в организации отчетов, точной формулировке мыслей и вопросов.

Тесты достижений концентрируются на оценке уровня навыков и знаний, которые достиг испытуемый, проверке на наличие потенциала. Данная категория тестирования в психологии разделяется на подкатегории. В них одни из тестов становятся узконаправленными испытаниями, а другие – более обширны. У этой формы тестирования не существует единой структуры. Испытуемого могут попросить выполнить некоторое действие или решить задачу.

Тест имитации является одним из самых популярных методов тестирования. При его осуществлении испытуемым предлагают выполнить практическое задание, и спрашивают, каким образом они собираются его выполнять. Например, человека, который пришёл устраиваться на должность преподавателя, могут попросить смоделировать ситуацию, когда ему необходимо успокоить детей, которые сильно шумят.

Самый знаменитый и распространённый тест — это тест на уровень IQ. Особенности данного теста состоят в том, что он позволяет оценить развитие наглядно-действенного, словесно-логического и образного мышления.

Находи статьи и создавай свой список литературы по ГОСТу

Поиск по теме

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *