Главная Случайная страница


Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






Предсказания по репрезентативности

Третье задание в этой серии выполняли студенты-психологи старших курсов, и оно – самое важное: расположите области специализации в порядке уменьшения вероятности, что Том В. учится на этой специальности. Испытуемым были известны важные статистические факты: априорная вероятность распределения студентов по каждой специальности и то, что источник описания Тома В. не вполне надежен. Тем не менее ожидалось, что участники эксперимента сосредоточатся исключительно на сходстве описания со стереотипами – названном нами репрезентативностью – и проигнорируют и априорную вероятность распределения, и сомнения в правдивости описания, а затем объявят редкую специальность (компьютерные науки) весьма вероятной, потому что именно у нее самый высокий показатель репрезентативности.
В Юджине мы с Амосом много работали, иногда я даже ночевал на работе. Именно в одну из таких ночей я составил опи сание, сталкивающее репрезентативность с априорной вероятностью. К утру я выдумал Тома В. Первым на работу в тот день пришел наш коллега и друг Робин Доус, опытный статистик, скептически относящийся к интуитивным суждениям. Он, как никто другой, понимал важность априорной вероятности. Я вручил ему задание и предложил угадать специальность Тома В. Хитро улыбнувшись, Доус спросил: «Компьютерщик?» Я обрадовался – даже великие не устояли. Разумеется, как только я упомянул априорную вероятность, Робин сразу же понял свою ошибку: не меньше других зная о роли априорной вероятности в предсказаниях, он пренебрег ей, увидев описание личности человека. Как и ожидалось, он заменил требуемую от него оценку вероятности суждением о репрезентативности.
Затем мы с Амосом предложили то же задание 114 студентам старших курсов, изучавшим психологию и прослушавшим курсы по статистике в трех разных университетах. Респонденты нас не разочаровали: их размещение девяти специальностей по в ероятности не слишком отличалось от расстановки по сходству со стереотипами. Подстановка в этом случае была идеальной: никаких признаков того, что участники оценивали что-то, кроме репрезентативности. Вопрос о вероятности был трудным, но вопрос сходства был гораздо легче, и отвечали именно на него. Это серьезная ошибка, потому что оценки сходства и вероятности подчиняются разным логическим правилам. Для оценок сходства вполне допустимо не учитывать априорные вероятности и возможность неточного описания, но игнорирование априорных вероятностей и качества информации при оценке вероятности неминуемо ведет к ошибкам.
Сама концепция «вероятности того, что Том В. изучает компьютерные науки» непроста. Логики и статистики не имеют единого мнения о ее смысле, а некоторые утверждают, что она вообще бессмысленна. Для многих экспертов это – мера субъективной веры. Есть события, в которых вы уверены (например, что утром встало солнце), и есть другие, которые вы считаете невозм ожными (например, полное замерзание Тихого океана). Существует множество событий (к примеру, то, что ваш сосед – компьютерщик), в которые вы верите в промежуточной степени. Эта степень и есть ваша вероятность этого события.
Логики и статистики разработали несовместимые, но при этом очень точные определения вероятности. Для обычных людей вероятность (синоним «правдоподобия») – неопределенное понятие, связанное с неуверенностью, предрасположенностью, правдоподобностью и удивлением. Его размытость в данном случае не слишком важна и особых неудобств не доставляет. Мы более или менее знаем, что имеем в виду, произнося слова «демократия» или «красота», а люди, с которыми мы разговариваем, более или менее понимают, что мы хотим сказать. За все годы, что я провел, задавая вопросы о вероятности событий, никто ни разу не спросил меня: «А что вы понимаете под вероятностью?», хотя это обязательно случилось бы, если бы я попросил их оценить что-то незнакомое. Все действовали т ак, будто знают, как отвечать на мои вопросы. Впрочем, я понимал, что просить испытуемых объяснить значение слова будет нечестно.
Люди, которым предлагают оценить вероятность, не теряются с ответом, потому что не пытаются оценивать вероятность в том смысле этого слова, в котором его используют статистики и философы. Вопрос о вероятности активирует «мысленную дробь», вызывая ответы на более легкие вопросы. Один из них – автоматическая оценка репрезентативности, которая совершенно обычна для понимания языка. (Неверное) утверждение «Родители Элвиса Пресли хотели, чтобы он стал стоматологом» немного смешно, поскольку автоматически определяется несоответствие между образом Пресли и стоматолога. Система 1 генерирует впечатление сходства без намерения это делать. Эвристика репрезентативности задействуется и в том случае, когда кто-то говорит: «Она победит на выборах, по ней это видно» или «Ученого из него не выйдет, слишком много татуировок». Оценивая потенциальные спосо бности политика по форме подбородка или по силе речей, мы полагаемся на репрезентативность.
Предсказания по репрезентативности распространены, но неоптимальны со статистической точки зрения. Бестселлер Майкла Льюиса «Человек, который изменил все» – это история о неэффективности такого способа предсказаний. Профессиональные тренеры-селекционеры, как правило, предсказывают успех потенциальных игроков, учитывая их сложение и внешность. Герой книги Льюиса – Билли Бин, менеджер бейсбольной команды «Окленд Атлетикс», – принял непопулярное решение отклонить предложения своих селекционеров и отбирать игроков по статистике проведенных игр. «Атлетикс» набирал недорогих игроков, которых другие команды отвергали из-за внешнего вида. Вскоре команда достигла отличных результатов за небольшие деньги.

 

Недостатки репрезентативности

У оценки вероятности по репрезентативности есть важные преимущества: интуитивные впечатлени я почти всегда оказываются точнее случайных догадок.

• В большинстве случаев люди, ведущие себя дружелюбно, и в самом деле дружелюбны.
• Высокий худощавый спортсмен, скорее всего, баскетболист, а не футболист.
• Люди с ученой степенью скорее подпишутся на The New York Times, чем те, у кого нет высшего образования.
• Молодые парни – более агрессивные водители, чем пожилые женщины.

Во всех этих – и во многих других – случаях стереотипы, определяющие оценки репрезентативности, в какой-то мере верны, и предсказания, основанные на этом эвристическом методе, могут быть правильными. В других ситуациях стереотипы лгут и эвристика репрезентативности сбивает с толку, особенно если из-за нее пренебрегают информацией об априорной вероятности, указывающей в другом направлении. Даже когда эвристический метод в определенной степени оправдан, доверие исключительно к нему сопряжено с се рьезными ошибками статистической логики.
Один из «грехов» репрезентативности – чрезмерная склонность предсказывать появление событий с низкой априорной вероятностью. Рассмотрим пример: вы видите в нью-йоркском метро женщину, читающую The New York Times. Какое из следующих предположений о незнакомке более вероятно?

У нее есть ученая степень.
У нее нет высшего образования.

Репрезентативность подскажет вам сделать ставку на степень, но это необязательно разумно. Второй вариант тоже нужно серьезно рассмотреть, поскольку в нью-йоркском метро ездит намного больше людей без высшего образования, чем тех, у кого есть степень. А если некую женщину описывают как «застенчивую любительницу поэзии» и вам нужно угадать, изучает ли она китайскую литературу или управление бизнесом, то стоит выбрать второй вариант. Даже если все девушки, изучающие китайскую литературу, застенчивы и любят поэзию, робких любите льниц поэзии почти наверняка больше среди студентов экономических специальностей.
Люди, не изучавшие статистику, вполне способны при определенных условиях применять априорные вероятности для предсказаний. В первой версии задачи о Томе В., которая не сообщает о нем никаких сведений, очевидно, что вероятность того, что он изучает те или иные науки, равна частоте, с которой студенты выбирают эту специальность. Но априорные вероятности теряют значение, как только мы знакомимся с описанием личности Тома В.
Исходя из первых результатов, мы с Амосом решили, что априорную вероятность при доступной информации о конкретном случае будут игнорировать всегда, но этот вывод оказался слишком строгим. Психологи проводили разные эксперименты, где априорные вероятности представлены как часть задания и влияют на многих испытуемых, но тем не менее информации о конкретном случае почти всегда придают большее значение, чем простой статистике. Норберт Шварц с коллег ами продемонстрировали, что указания «мыслить как статистик» увеличивают использование информации об априорной вероятности, а требование «мыслить как практикующий врач» производит противоположный эффект.
Со студентами в Гарварде несколько лет назад провели эксперимент, который удивил меня своими результатами: дополнительная активизация Системы 2 давала значительное повышение точности предсказаний в задании про Тома В. В эксперименте старую задачу соединили с современной вариацией на тему когнитивных навыков. Половине студентов сказали надуть щеки во время выполнения задания, а другим – нахмуриться. Как известно, нахмуривание обычно усиливает бдительность Системы 2 и снижает уверенность и склонность полагаться на интуицию. Студенты, надувавшие щеки (эмоционально нейтральное выражение), повторили исходные результаты: они учитывали лишь репрезентативность и игнорировали априорную вероятность. Хмурившиеся участники продемонстрировали увеличение чувствительности к апри орным вероятностям, как и предсказывали авторы эксперимента. Это – полезный результат.
В вынесении неправильного интуитивного суждения следует винить и Систему 1, и Систему 2: Система 1 предлагает неверную догадку, а Система 2 принимает ее и выражает в качестве суждения. У ошибки Системы 2 могут быть две причины: невежество или лень. Одни игнорируют априорную вероятность, потому что считают ее неважной при наличии индивидуальной информации. Другие делают ту же ошибку, потому что не сосредоточились на задании. Если разница появляется из-за нахмуренных бровей, то именно лень правильно объясняет пренебрежение априорной вероятностью – по крайней мере, среди студентов Гарварда. Их Система 2 «знает» о важности априорной вероятности, даже если она не упомянута, но для применения этого знания требуются дополнительные усилия.
Второй недостаток репрезентативности – нечувствительность к качеству данных. Вспомните правило Системы 1: что ты видишь, то и е сть. В примере Тома В. его описание независимо от того, точное оно или нет, активизирует ваш ассоциативный механизм. Прочитав, что Том В. «плохо ощущает других и мало им сочувствует», вы, как и большинство читателей, вероятно, решили, что он вряд ли изучает общественные науки и социальную работу, несмотря на то что вас предупредили: этому описанию не стоит доверять!
Скорее всего, вы понимаете, что ненадежная информация мало чем отличается от полного ее отсутствия, но из-за правила WYSIATI применять этот принцип довольно трудно. Если только вы сразу же не решите отбросить полученные сведения (к примеру, определив, что вам их сообщил лжец), ваша Система 1 автоматически обработает имеющуюся информацию как верную. Если вы сомневаетесь в качестве информации, следует оставить ваши оценки вероятности близкими к априорной вероятности. Подобное дисциплинированное поведение дается нелегко: оно требует самоконтроля и значительных усилий по наблюдению за собой.
Правильный ответ на вопрос о Томе В. состоит в том, что следует оставаться очень близко к первоначальным убеждениям, слегка уменьшая изначально высокие вероятности попадания Тома В. в распространенные специальности (гуманитарные науки и образование, общественные науки и социальная работа) и чуть увеличивая низкие вероятности редких специальностей (библиотечное дело, компьютерные науки). Вы не совсем в тех же условиях, как если бы вообще ничего не знали о Томе В., но скудным данным нельзя доверять, так что в оценках должна доминировать априорная вероятность.

 

Как тренировать интуицию

Ваша предположение, что завтра будет дождь, – это субъективная уверенность, но не следует позволять себе верить всему, что приходит в голову. Чтобы быть полезными, ваши убеждения должны ограничиваться логикой вероятности. Если вы считаете, что вероятность дождя завтра 40 %, также следует верить, что вероятность того, что дождя не будет, сост авляет 60 %, и не следует верить, что вероятность дождя завтра утром 50 %. А если вы верите, что кандидат Х. станет президентом с вероятностью 30 % и, в случае избрания, будет переизбран с вероятностью 80 %, то вы должны верить, что он будет избран дважды с вероятностью 24 %.
Правила, важные для случаев вроде задачи о Томе В., предлагаются байесовской статистикой. Этот важный современный подход к статистике назван в честь преподобного Томаса Байеса, английского священника XVIII века, сделавшего первый крупный вклад в решение серьезной задачи: логику того, как следует менять свое мнение в присутствии фактов. Правило Байеса определяет, как сочетать существующие убеждения (априорные вероятности) с диагностической ценностью информации, то есть насколько гипотезу следует предпочитать альтернативе. Например, если вы считаете, что 3 % студентов-магистров занимаются компьютерными науками (априорная вероятность), и также считаете, что, судя по описанию, Том В. в четыре раз а вероятнее изучает именно их, чем другие науки, то по формуле Байеса следует считать, что вероятность того, что Том В. – компьютерщик, составляет 11 %. Если априорная вероятность составляла 80 %, то новая степень уверенности будет 94,1 %, и так далее.
Математические подробности в этой книге не важны. Необходимо помнить два важных положения о ходе байесовских рассуждений и о том, как мы его обычно нарушаем. Во-первых, априорные вероятности важны даже при наличии информации о рассматриваемом случае. Часто это интуитивно не очевидно. Во-вторых, интуитивные впечатления о диагностической ценности информации часто преувеличены. WYSIATI и ассоциативная когерентность заставляют нас верить в истории, которые мы сами для себя сочиняем. Ключевые правила упорядоченных байесовских рассуждений формулируются очень просто:

• Оценку вероятности результата следует основывать на достоверной априорной вероятности.
• Необходимо сомневат ься в диагностической ценности вашей информации.

Оба правила просты и ясны. Как ни странно, меня никогда не учили, как ими пользоваться, и даже сейчас следование им кажется мне неестественным.

 

Разговоры о репрезентативности


«Газон ухожен, секретарь в приемной выглядит профессионалом, мебель красива, но из этого не следует, что компанией хорошо управляют. Надеюсь, совет директоров не пойдет на поводу у репрезентативности».

«Эта новая компания выглядит многообещающе, но априорная вероятность успеха в этой отрасли очень низкая. Откуда мы знаем, что в данном случае все будет по-другому?»

«Они постоянно делают одну и ту же ошибку: предсказывают маловероятные события на основании недостаточных данных. При недостатке информации всегда лучше придерживаться априорных вероятностей».

«Я понимаю, что этот изобличительный отчет, возм ожно, основывается на веских доказательствах, но уверены ли мы в этом? При его рассмотрении следует учитывать сомнительность данных».

 

15
Линда: лучше меньше


В нашем самом известном эксперименте, вызвавшем больше всего споров, речь шла о вымышленной женщине по имени Линда. Мы с Амосом придумали ее, чтобы убедительно показать роль эвристики в суждениях и несовместимость эвристических методов с логикой. Линду мы описывали так:

Линде 31 год, она не замужем, откровенная и очень умная. В университете изучала философию. Будучи студенткой, она уделяла много внимания вопросам дискриминации и социальной справедливости, а также участвовала в демонстрациях против использования ядерного оружия.

В 1980-е годы, услышав это описание, все смеялись, потому что немедленно понимали, что Линда училась в Калифорнийском университете в Беркли, который в то время слав ился своими радикальными, политически активными студентами. В одном из экспериментов мы предоставили испытуемым список из восьми сценариев развития событий, возможных для Линды. Как и в задаче про Тома В., некоторые располагали их по репрезентативности, другие – по вероятности. Задача про Линду напоминает задачу про Тома В., но с некоторыми важными изменениями.

Линда – учительница начальной школы.
Линда работает в книжном магазине и занимается йогой.
Линда – активистка феминистского движения.
Линда – социальный работник в психиатрии.
Линда – член Лиги женщин-избирательниц.
Линда – кассир в банке.
Линда – страховой агент.
Линда – кассир в банке и активистка феминистского движения.

По многим признакам видно, что это старое задание. Лига женщин-избирательниц уже не играет такой роли, ка к раньше, а мысль о феминистском «движении» кажется странной из-за изменений в статусе женщин, произошедших за последние тридцать лет. И все-таки даже в эпоху «Фейсбука» легко угадать почти единодушное мнение: Линда хорошо подходит на роль активной феминистки, неплохо – на роль сотрудницы книжного магазина, занимающейся йогой, и вряд ли подходит на роль страхового агента или банковского кассира.
Теперь обратите внимание на важный момент: похожа ли она больше на кассира или на кассира – активистку феминистического движения? Все сходятся во мнении, что Линда больше подходит под образ «кассира-феминистки», чем под стереотипное представление о кассирах. Обычные кассиры – не феминистки, добавление этой подробности делает историю более когерентной.
Важное изменение содержится в оценках вероятности, поскольку между этими двумя сценариями существует логическое отношение. Представьте себе диаграмму Венна. Множество кассиров-феминисток полностью включе но во множество кассиров, поскольку каждая кассир-феминистка – кассир. Следовательно, вероятность того, что Линда – кассир-феминистка, обязана быть меньше вероятности того, что она – кассир. Чем больше подробностей возможного события вы упоминаете, тем меньше его вероятность. Таким образом, задание порождает конфликт между предчувствием репрезентативности и логикой вероятности.
Первый эксперимент был межкатегориальный (between-subject). Каждый участник знакомился с семью вариантами, среди которых был только один важный пункт («кассир» или «кассир-феминистка»). Некоторые располагали ответы по сходству, другие – по вероятности. Как и в случае с Томом В., «кассир-феминистка» в обоих случаях оказалась в среднем выше расположенной, чем просто «кассир».
Затем мы провели внутрикатегориальный (within-subject) эксперимент, представив испытуемым вышеприведенный список вопросов, где «кассир» располагался на шестом месте, а «кассир-феминистка» – на после днем. Мы были убеждены, что участники заметят отношение между двумя вариантами и поступят в соответствии с логикой, а потому не собирались проводить отдельный эксперимент. В лаборатории проходило еще одно исследование, и моя ассистентка попросила участников предыдущего эксперимента перед уходом заполнить анкету про Линду.
В лотке на столе собрался десяток опросников. Я мельком проглядел их и обнаружил, что все участники сочли «кассира-феминистку» более вероятной, чем просто «кассира». Я тогда так удивился, что до сих пор помню и серый металлический стол, и где кто стоял в тот миг, когда я сделал свое открытие. Я позвонил Амосу и в большом волнении рассказал ему, что в столкновении логики с репрезентативностью победила репрезентативность!
Выражаясь языком этой книги, наблюдается ошибка Системы 2: у испытуемых была возможность заметить, что уместно применить правила логики, поскольку в список были включены оба варианта. Они этой возможностью не воспользовались. Расширив эксперимент, мы обнаружили, что логику вероятности нарушили 89 % студентов из нашей выборки. Мы твердо считали, что респонденты, знающие статистику, справятся лучше, и потому задали те же вопросы аспирантам программы изучения принятия решений Стэнфордской высшей школы бизнеса, прослушавшим курсы по теории вероятностей, статистике и теории принятия решений. Мы снова удивились: 85 % этих респондентов также решили, что «кассир-феминистка» вероятнее, чем просто «кассир».
Потом мы предпринимали все более отчаянные попытки избавиться от ошибки, представляя Линду большим группам людей и задавая им простой вопрос:

Какой из вариантов вероятнее?
Линда – кассир.
Линда – кассир в банке и активистка феминистского движения.

Эта урезанная версия задания сделала Линду знаменитостью в определенных кругах и вызвала годы полемики. Примерно от 85 до 90 % студенто в крупных университетов – вопреки логике – выбрали второй вариант. Что примечательно, они не слишком стыдились своей ошибки. Когда я с некоторым негодованием спросил у большой аудитории: «Вы понимаете, что нарушили элементарное логическое правило?!», кто-то из задних рядов прокричал мне в ответ: «И что?», а студентка старших курсов, допустившая ту же оплошность, объяснила ее так: «Я думала, вы просто интересуетесь моим мнением».
Выражения «ошибка умозаключения» или «ложный аргумент» обычно используют, когда люди не применяют необходимое и уместное логическое правило. Мы с Амосом ввели понятие ошибка конъюнкции, которую совершают, когда при непосредственном сравнении считают, что совпадение двух событий (в данном случае того, что Линда – кассир и феминистка) возможно с большей вероятностью, чем одно из них.
Как и иллюзия Мюллера-Лайера, ошибка конъюнкции кажется привлекательной, даже если вы ее распознаете. Натуралист Стивен Джей Гулд, зная пр авильный ответ, так описал свою борьбу с задачей про Линду: «В голове продолжал прыгать крошечный гомункулус, крича: „Она не может быть просто кассиром, почитай ее описание!“» «Крошечный гомункулус» Гулда – это, конечно же, настойчивая Система 1 (в то время терминологии двух систем еще не существовало).
Лишь в одном из наших экспериментов большинство испытуемых дали правильный ответ на сокращенную версию задачи про Линду: 64 % из группы студентов старших курсов на факультете социальных наук в Беркли правильно посчитали, что исход «кассир-феминистка» менее вероятен, чем просто «кассир». В версии с восемью вариантами ответа, приведенной в начале главы, только 15 % аналогичной группы студентов старших курсов сделали такой выбор. Разница поучительна. В более длинной версии два самых важных варианта разделены пунктом «страховой агент», и читатели оценивали их раздельно, не сравнивая. Более короткая версия, напротив, требовала прямого сравнения, которое мобилизовало Сис тему 2 и позволило большинству студентов, знающих статистику, избежать ошибки. К сожалению, мы не исследовали обоснование неверного выбора довольно значительного меньшинства (36 %) в этой группе.
Предложенные респондентами оценки вероятности и в задании про Тома В., и в списке вопросов про Линду в точности соответствовали оценкам по репрезентативности (сходству со стереотипами). Репрезентативность – это часть группы тесно связанных базовых оценок, которые с большой вероятностью генерируются совместно. Самые репрезентативные результаты в соединении с описанием личности дают самые когерентные истории – необязательно самые вероятные, зато правдоподобные, а опрометчивые люди легко путают понятия когерентности, правдоподобия и вероятности.
Некритическая замена вероятности правдоподобием пагубно влияет на оценки при использовании сценариев в качестве инструментов прогнозирования. Следующие два сценария представили разным группам с просьбой оценить их вероятность:

В будущем году в Северной Америке случится наводнение, в котором погибнет более 1000 человек.
В будущем году в Калифорнии произойдет землетрясение, которое вызовет наводнение, и погибнет более 1000 человек.

Сценарий о землетрясении в Калифорнии более правдоподобен, чем сценарий о наводнении в Северной Америке, хотя его вероятность, безусловно, ниже. Как и ожидалось, вопреки логике, сценарий с бо́льшим количеством подробностей посчитали более вероятным. Это – ловушка для прогнозистов и их клиентов: сценарии с дополнительными подробностями более убедительны, но сбываются с меньшей вероятностью.
Чтобы оценить роль правдоподобия, обдумайте следующие вопросы:

Что вероятнее?
У Марка есть волосы.
У Марка светлые волосы.

и

Что вероятнее?
Джейн – учительница.
Джейн – учительница и ходит на работу пешком.

У обоих вопросов та же логическая структура, что и у задачи про Линду, но ошибок в ответах на них не бывает, поскольку более подробный вариант не кажется более правдоподобным, более когерентным или лучшей историей. Оценка правдоподобия и когерентности не предлагает ответа на вопрос о вероятности. В отсутствие конфликта с интуицией логика торжествует.

 

Последнее изменение этой страницы: 2016-06-09

lectmania.ru. Все права принадлежат авторам данных материалов. В случае нарушения авторского права напишите нам сюда...