
Полная версия
Искусственный интеллект от А до Б
Психиатрам не должно быть позволено делать прогнозы относительно долгосрочной будущей опасности обвиняемого в деле о смертной казни, по крайней мере, в тех обстоятельствах, когда психиатр претендует на то, чтобы давать показания в качестве медицинского эксперта, обладающего прогностическими знаниями в этой области. Хотя психиатрические обследования могут позволить краткосрочные прогнозы насильственного или агрессивного поведения, медицинские знания просто не продвинулись до такой степени, чтобы долгосрочные прогнозы – тип свидетельских показаний, о которых идет речь в данном случае – могли быть сделаны даже с разумной точностью. Большое количество исследований в этой области показывает, что даже при самых благоприятных условиях психиатрические прогнозы долгосрочной опасности в будущем неверны, по крайней мере, в двух из каждых трех случаев.
Прогноз будущего насильственного поведения со стороны обвиняемого является, по сути, непрофессиональным определением, а не экспертным психиатрическим заключением. В той мере, в какой такие прогнозы имеют какую-либо обоснованность, они могут быть сделаны только на основе, по существу, актуарных данных, к которым психиатры, как психиатры, не могут привнести специальных навыков интерпретации. С другой стороны, использование психиатрических показаний по данному вопросу наносит серьезный ущерб подсудимому. Если облечь актуарные данные в «экспертное» заключение, показания психиатра, скорее всего, получат чрезмерный вес. Кроме того, это позволяет присяжным избежать сложных актуарных вопросов, ища убежища в медицинском диагнозе, который создает ложную ауру уверенности. По этим причинам показания психиатров о будущей опасности недопустимо искажают процесс установления фактов в делах, например, караемых смертной казнью.
Даже если психиатрам при определенных обстоятельствах разрешается выносить экспертное медицинское заключение по вопросу о будущей опасности, что им никогда не должно быть позволено делать это, если они не провели психиатрическое обследование обвиняемого. Из свидетельских показаний по этому делу очевидно, что ключевым клиническим определением, на которое опирались оба психиатра, был их диагноз «социопатия» или «антисоциальное расстройство личности». Однако такой диагноз просто не может быть поставлен на основании гипотетического вопроса. При отсутствии углубленного психиатрического обследования и оценки психиатр не может исключить альтернативные диагнозы. Он также не может гарантировать, что необходимые критерии для постановки рассматриваемого диагноза соблюдены. В результате он не может вынести медицинское заключение с разумной степенью уверенности.
Эти недостатки лишают психиатрические показания всякой ценности в данном контексте. Даже если предположить, что диагноз антисоциального расстройства личности является доказательством будущей опасности – предположение, с которым мы не согласны, – тем не менее, ясно, что ограниченные факты, приведенные в гипотетическом исследовании, не опровергают другие болезни, которые явно не указывают на общую склонность к совершению преступных деяний. Более того, эти другие заболевания могут быть более поддающимися лечению, что может еще больше снизить вероятность агрессивного поведения обвиняемого в будущем.
Психиатрические категории практически не имеют связи с насилием, и их использование часто затмевает невпечатляющие статистические или интуитивные основания для прогнозирования.
Таким образом, ошибка может быть в некоторой степени переложена на ответчика. Обсуждая гражданские процедуры заключения под стражу, основанные на определении опасности, заявляется, что в свете ненадежности психиатрических прогнозов, «потеря мониторинга, частое наблюдение и готовность изменить свое мнение о рекомендациях и распоряжениях по лечению для склонных к насилию лиц, будь то в рамках правовой системы или за ее пределами, является единственной приемлемой практикой, если психиатр должен играть полезную роль в этих оценках опасности».
Вопрос о различиях, которые могут существовать между различными человеческими расами, или между различными подвидами одной и той же расы, или между политическими объединениями людей в национальные группы, может легко стать предметом самой ожесточенной дискуссии. Антропологи Франции и Германии вскоре после окончания франко-прусской войны вели еще одну национальную войну, но в небольшом масштабе. Трудно не допустить расовой ненависти и антипатии в самых научных исследованиях в этой области. Спор становится особенно ожесточенным, когда речь заходит о психических особенностях. Никто не может сильно возмущаться, обнаружив, что его раса классифицируется по размерам черепа, росту или цвету волос, но стоит человеку обнаружить, что его раса неразумна или эмоционально нестабильна, и он сразу же будет готов к битве.
До недавнего времени у нас не было доступных методов научного измерения умственных способностей, так что литература о расовых различиях состоит в основном из мнений студентов, которые очень склонны к предвзятости, когда, покидая твердую область физических измерений, вступают в более неуловимую область оценки умственных способностей.
Постепенно, однако, различные исследователи, используя более или менее тонкие психологические измерения, начали собирать массив данных, который когда-нибудь достигнет приличных размеров. С 1910 года мы стали свидетелями замечательного развития в методах проверки интеллекта, и эти методы стали применяться для изучения расовых различий. Разрозненные исследования сообщают и сравнивают показатели интеллекта детей белых, негритянских или индейских родителей, а иногда и оценки детей различных национальностей или групп происхождения. Однако результаты этих исследований почти невозможно соотнести, так как они были сделаны разными методами, разными измерительными шкалами, на детях самых разных хронологических возрастов и, прежде всего, на сравнительно небольших группах испытуемых, так что выводы на основе исследований не имеют высокой степени достоверности.
Армейские умственные тесты позволяют нам анализировать элементы, проникающие в американскую разведку. В нашем распоряжении имеются данные об испытаниях интеллекта уроженцев коренных народов, иностранцев и негров. Эти документы заслуживают самого серьезного изучения. Но прежде, чем рассматривать результаты армейских испытаний, человек должен быть хорошо осведомлен о характере испытаний и о том, как они были построены.
Армейские психологические тесты включали в себя три вида обследования:
(А) Групповой экзамен альфа, который включал в себя восемь различных видов тестов, большинство из которых включали умение читать.
(Б) Групповой экзамен бета, который включал в себя семь различных видов тестов, ни один из которых не включал в себя способность читать или понимать разговорный язык, тесты, состоящие из картинок, рисунков и т. д., и даваемые в виде инструкций в пантомиме.
(В) Индивидуальные обследования двух видов:
(А) Те, которые включают использование родного языка, и
(Б) Те, которые не связаны с родным языком, состоят из сборных головоломок и т. д., инструкции даются жестами, «шкалой производительности».
Когда отряд явился на психологическое обследование, первым шагом было отделение грамотных от тех, кто неграмотен. Тем, кто говорил был грамотным, была дана экзамен альфа. Все остальные были отправлены в бета-версию. По окончании экзамена альфа все мужчины, набравшие низкие баллы, были отправлены в бета-версию. После того, как была проведена бета-версия, экзаменаторы попытались вызвать для индивидуальных обследований всех мужчин, набравших низкий балл в бета-версии. В спешке экзаменов было невозможно отозвать всех мужчин для индивидуальных экзаменов, которым следовало бы дать специальные экзамены, и некоторые мужчины были оценены по альфе, которые должны были быть оценены по бете, и наоборот, но большинство мужчин были правильно оценены грубыми методами, которые использовались. На каждом из экзаменов разброс баллов был настолько велик, что большинство мужчин имели возможность набрать баллы.
Большой вклад комитета, который первым разработал методы экзаменов в армии, и людей, которые впоследствии разработали дополнительные методы в армии, состоял в создании и стандартизации групповых экзаменов альфа и бета. Методы индивидуального обследования уже существовали, шкала Стэнфорда-Бине была развитием шкалы «умственного возраста» Бине, а тесты шкалы производительности были более или менее полностью разработаны другими исследователями. Задача обследования людей в больших группах была впервые успешно выполнена в армии. До первой мировой войны многие психологи насмехались над идеей обследования двухсот или трехсот человек одновременно, выдавая им буклеты с различными видами тестов, но обследования в больших группах стали повседневным делом. Групповые тесты впоследствии были опробованы в школах и на промышленных предприятиях с отличными результатами с точки зрения проведения тестов. Действительно, когда в октябре 1919 года в Университете штата Огайо проводился армейский экзамен по альфе, практически весь студенческий состав, числом 6000 человек, был проверен пятью экзаменаторами за восемь часов. В службе было установлено, что один экзаменатор может с легкостью управлять группой из 200 человек. Экзаменатор прочитал инструкции для альфы, и мужчины приказали стартовать и останавливаться в нужное время. Бета-тест был более сложным в проведении и проводился в небольших группах.
Статистические методы обработки результатов армейских испытаний, использованные в данном исследовании, довольно сложны, но их принципы легко понять. Прежде всего, надо откровенно признать, что в трех видах проводимых обследований были допущены незначительные ошибки. Мы не можем исправить тип тестов, которые использовались, но мы можем скорректировать метод их оценки. Большая часть трудностей с подсчетом баллов возникает из-за того, что использовались разные типы измерительных шкал. Во время войны различные шкалы были преобразованы в одну общую шкалу буквенных оценок (A, B, C+, C, C−, D и D−). Этот метод был грубым, и, хотя он отвечал целям армии того времени, его нельзя использовать ни в какой научной интерпретации результатов.
Экзамен альфа оценивался путем нахождения баллов по каждому из восьми тестов, сложения для получения общей суммы, а затем преобразования общей суммы в буквенную оценку. Бета была оценена аналогичным образом. Очевидно, что некоторые тесты в альфа-версии могут быть сложнее других, что некоторые тесты в бета-версии могут быть проще, чем любые другие тесты в альфа-версии, и что могут произойти изменения, которые невозможно было предсказать на момент проведения исследований. Осознав эти факты, армейские статистики разработали другой метод подсчета результатов, который устраняет все эти источники ошибок. Этот метод известен как комбинированная шкала, теоретическая шкала интеллекта от 0 до 25, в которую можно преобразовать альфа, бета и индивидуальные экзаменационные баллы, так что в итоге мы получим одно измерение вместо трех.
Психологические измерения включают в себя гораздо больше, чем создание тестов и проведение тестов. После того, как все результаты получены, у нас все еще есть проблема интерпретации результатов, и эта интерпретация в значительной степени является статистической проблемой. Нельзя не отдать должное сотрудникам психологического отдела Главного хирургического управления, которые продолжали службу еще долго после окончания войны, терпеливо изучая и анализируя результаты. Объединенная шкала в значительной степени была работой двух молодых психологов, Карла Р. Брауна и Марка А. Мэя, и их работа над этой проблемой… Это, без сомнения, величайший вклад, который был сделан до сих пор в статистические аспекты науки о ментальных измерениях.
Теория, лежащая в основе комбинированной шкалы, заключается в том, что каждый тест альфа и бета рассматривается как отдельная шкала измерения. Одна группа людей, включающая 1047 мужчин, родившихся в англоязычных странах, была обследована на альфу, повторно обследована на бете и, если возможно, снова обследована по шкале Стэнфорда-Бине. Эта группа из 1047 случаев составила основу, на основе которой был эмпирически разработан метод объединения отдельных тестов в комбинированную шкалу.
С этого момента, в ходе изучения протоколов армейских испытаний, мы должны рассматривать альфа и бета как две брошюры, содержащие в общей сложности пятнадцать различных шкал измерения интеллекта.
На протяжении всего этого исследования все измерения проводились в терминах средних значений и вариабельности относительно среднего значения. Интерпретируя средние значения, мы никогда не должны забывать, что они обозначают целое распределение. Беспечные мыслители склонны выбирать один или два ярких примера способностей из определенной группы, а затем твердо полагаться на убеждение, что они опровергли аргумент, основанный на общем распределении способностей. Шаги, которые должны быть предприняты для сохранения или увеличения нынешнего интеллектуального потенциала, должны, конечно, быть продиктованы наукой, а не политической целесообразностью.
Может быть полезно определить некоторые из наиболее эзотерических юридических терминов, которые используются: действовать целесообразно подразумевает психическое состояние, охватывающее намерение обманывать, манипулировать или обманывать; стандарт разумного человека относится к гипотетическому индивидууму, проявляющему среднюю осмотрительность, навыки и суждение в поведении; разумный человек выступает в качестве сравнительного стандарта для определения ответственности; нечто является диспозитивным, когда оно является решающим или окончательным и, например, разрешает спор или вопрос; когда вы приводите доводы по делу любой из сторон, говорят, что кто-то выступает в суде; что-то имеет существенность, если оно имеет отношение и имеет последствия для обсуждаемого вопроса. Она не обязательно должна быть «статистически значимой», чтобы быть существенной. В любом судебном постановлении суд может заявить: «упущенный факт является существенным, если существует значительная вероятность того, что разумный акционер сочтет его важным при принятии решения о том, как голосовать»;
Правило яркой линии является абсолютным критерием; в данном случае статистическая значимость не является таким правилом яркой линии при принятии решения о раскрытии доказательств инвесторам.
За последние 15 лет этот суд трижды признавал недействительными части системы вынесения приговоров. Призрак расовой дискриминации был признан, сославшись на исследования, предполагающие вынесение смертного приговора с расовой дискриминацией, а нестандартные законодательные акты на рассмотрении суда «чреваты дискриминацией». Подтверждением тому являются статистические данные, свидетельствующие о том, что негров казнят гораздо чаще, чем белых, в процентном отношении к их процентному соотношению к населению. Исследования показывают, что, хотя более высокий уровень казней среди негров отчасти объясняется более высоким уровнем преступности, существуют свидетельства расовой дискриминации. Например, к 1977 году в Джорджии было казнено 62 мужчины за изнасилование с тех пор, как федеральное правительство начало собирать статистику в 1930 году. Из этих мужчин 58 были чернокожими и 4 белыми. Три года спустя суд в деле Годфри признал один из статутных отягчающих обстоятельств штата неконституционным расплывчатым, поскольку он привел к «нестандартному и необоснованному вынесению смертных приговоров по неконтролируемому усмотрению в основном необученных присяжных.... Судья Маршалл, соглашаясь с решением, отметил, что позорные искажающие последствия расовой дискриминации и бедности по-прежнему болезненно проявляются при вынесении смертных приговоров.
Этот исторический обзор уголовного законодательства Джорджии не является обвинительным актом, призывающим государство к ответу за прошлые преступления. Ссылка на прошлые практики не оправдывает автоматического осуждения нынешних. Но было бы нереалистично игнорировать влияние истории при оценке правдоподобных выводов системами искусственного интеллекта. Американцы делятся с миром историческим опытом, который привел к тому, что люди в этой культуре повсеместно придают значение расе, которое является иррациональным и часто выходит за рамки их сознания.
Продолжающееся влияние истории признается, как отмечает большинство, в «непрекращающихся усилиях по искоренению расовых предрассудков из системы уголовного правосудия». Эти усилия, однако, означают не устранение проблемы, а ее сохранение. Дела отражают осознание множества возможностей влияния расовых соображений на уголовное судопроизводство: в осуществлении императивных отводов, в выборе большого жюри, в выборе малого жюри, в осуществлении прокурорского усмотрения, в ведении прений, а также в сознательной или неосознанной предвзятости присяжных.
Дискреционные полномочия, предоставленные прокурорам и присяжным заседателям в системе вынесения смертных приговоров в Джорджии, создают такие возможности. Нет никаких руководящих принципов, регулирующих решения прокуратуры о вынесении смертного приговора, и судебная система не предоставляет присяжным ни перечня отягчающих и смягчающих факторов, ни каких-либо стандартов для их сопоставления друг с другом. Как только присяжные определяют один отягчающий фактор, они имеют полное право выбора жизни или смерти, и им не нужно формулировать свои основания для выбора пожизненного заключения.
12 июля 1974 года был подписан Закон о национальных исследованиях, в соответствии с которым была создана Национальная комиссия по защите людей в области биомедицинских и поведенческих исследований. Одна из задач, поставленных перед Комиссией, состояла в том, чтобы определить основные этические принципы, которые должны лежать в основе проведения биомедицинских и поведенческих исследований с участием человека, и разработать руководящие принципы, которым следует следовать, чтобы гарантировать, что такие исследования проводятся в соответствии с этими принципами. При проведении вышеизложенного Комиссии было поручено рассмотреть: (i) границы между биомедицинскими и поведенческими исследованиями и принятой и рутинной медицинской практикой, (ii) роль оценки критериев риска и пользы в определении целесообразности исследований с участием людей, (iii) соответствующие руководящие принципы для отбора людей для участия в таких исследованиях и (iv) природу и определение информированного согласия в различных исследовательских условиях.
В докладе Бельмонта предпринята попытка обобщить основные этические принципы, выявленные Комиссией в ходе ее обсуждений. Она является результатом интенсивного четырехдневного периода обсуждений, которые состоялись в феврале 1976 года в конференц-центре Бельмонта Смитсоновского института, и дополнен ежемесячными обсуждениями Комиссии, которые проводились в течение почти четырех лет. Это заявление об основных этических принципах и руководящих принципах, которые должны помочь в решении этических проблем, связанных с проведением исследований с участием человека.
Этические принципы и руководящие принципы для исследований с участием человека:
Научные исследования принесли существенные социальные выгоды. Это также поставило некоторые тревожные этические вопросы. Общественное внимание к этим вопросам привлекли сообщения о злоупотреблениях в отношении людей в биомедицинских экспериментах, особенно во время Второй мировой войны. Во время Нюрнбергского процесса над военными преступниками Нюрнбергский кодекс был составлен в виде набора стандартов для оценки врачей и ученых, проводивших биомедицинские эксперименты над узниками концентрационных лагерей. Этот кодекс стал прототипом многих более поздних кодексов, призванных гарантировать, что исследования с участием людей в качестве субъектов будут проводиться этичным образом.
Кодексы состоят из правил, одни из которых являются общими, другие конкретными, которыми руководствуются исследователи или рецензенты исследований в своей работе. Такие правила часто недостаточны для охвата сложных ситуаций; иногда они вступают в противоречие, и их часто трудно интерпретировать или применить. Более широкие этические принципы обеспечат основу, на которой могут быть сформулированы, подвергнуты критике и интерпретированы конкретные правила.
В этом заявлении определены три принципа, или общих предписывающих суждений, которые имеют отношение к исследованиям с участием человека. Другие принципы также могут иметь значение. Тем не менее, эти три документа являются всеобъемлющими и сформулированы на уровне обобщения, который должен помочь ученым, испытуемым, рецензентам и заинтересованным гражданам понять этические проблемы, присущие исследованиям с участием человека. Эти принципы не всегда могут быть применены для решения конкретных этических проблем. Цель состоит в том, чтобы обеспечить аналитическую основу, которая будет направлять решение этических проблем, возникающих в результате исследований с участием человека.
Важно проводить различие между биомедицинскими и поведенческими исследованиями, с одной стороны, и практикой принятой терапии, с другой, знать, какие виды деятельности должны быть подвергнуты экспертизе для защиты человека – объекта исследования. Различие между исследованием и практикой размыто отчасти потому, что оба они часто происходят вместе (как в исследованиях, предназначенных для оценки терапии), а отчасти потому, что заметные отклонения от стандартной практики часто называют «экспериментальными», когда термины «экспериментальный» и «исследование» не имеют четкого определения.
По большей части, термин «практика» относится к вмешательствам, которые предназначены исключительно для улучшения благополучия отдельного пациента или клиента и которые имеют разумные ожидания успеха. Целью медицинской или поведенческой практики является постановка диагноза, профилактическое лечение или терапия конкретным людям. В противоположность этому, термин «исследование» обозначает деятельность, направленную на проверку гипотезы, создание условий для получения выводов и тем самым на развитие или внесение вклада в обобщаемое знание (выраженное, например, в теориях, принципах и утверждениях о взаимосвязях). Исследование обычно описывается в официальном протоколе, в котором излагается цель и набор процедур, разработанных для достижения этой цели.
Когда клиницист существенно отклоняется от стандартной или принятой практики, инновация сама по себе не является исследованием. Тот факт, что процедура является «экспериментальной» в смысле новой, непроверенной или иной, не помещает ее автоматически в категорию исследований. Однако радикально новые процедуры такого рода должны стать объектом формального исследования на ранней стадии, чтобы определить, являются ли они безопасными и эффективными. Таким образом, комитеты по медицинской практике обязаны, например, настаивать на том, чтобы крупное новшество было включено в официальный исследовательский проект.3
Исследования и практика могут проводиться одновременно, когда исследования направлены на оценку безопасности и эффективности терапии. Это не должно вызывать путаницы в отношении того, требует ли деятельность проверки; Общее правило заключается в том, что если в деятельности присутствует какой-либо элемент исследования, то эта деятельность должна быть подвергнута проверке на предмет защиты людей-субъектов.
Выражение «основные этические принципы» относится к тем общим суждениям, которые служат основным обоснованием многих конкретных этических предписаний и оценок человеческих действий. Три основных принципа, среди общепринятых в нашей культурной традиции, особенно актуальны для этики исследований с участием людей: принципы уважения к личности, благодеяния и справедливости.
1. Уважение к личности. – Уважение к личности включает в себя, по крайней мере, два этических убеждения: во-первых, что к людям следует относиться как к автономным агентам, а во-вторых, что лица с ограниченной автономией имеют право на защиту. Таким образом, принцип уважения к личности делится на два отдельных моральных требования: требование признания автономии и требование защиты тех, кто обладает ограниченной автономией.
Автономная личность – это индивид, способный обдумывать личные цели и действовать в соответствии с этим руководством. Уважать автономию означает придавать вес взвешенным мнениям и выбору автономных людей, воздерживаясь при этом от препятствования их действиям, если они не наносят явного ущерба другим. Проявлять неуважение к автономному агенту – значит отвергать взвешенные суждения этого человека, отказывать индивиду в свободе действовать в соответствии с этими взвешенными суждениями или утаивать информацию, необходимую для вынесения взвешенного суждения, когда для этого нет веских причин.
Однако не каждый человек способен к самоопределению. Способность к самоопределению созревает в течение жизни человека, и некоторые люди теряют эту способность полностью или частично из-за болезни, умственной отсталости или обстоятельств, которые сильно ограничивают повышения благосостояния конкретного человека и, в то же время, предоставления определенной пользы другим (например, вакцинация, которая защищает как вакцинируемого человека, так и общество в целом). Тем не менее, тот факт, что некоторые формы практики имеют элементы, отличные от непосредственной пользы для человека, получающего вмешательство, не должен смешивать общее различие между исследованием и практикой. Даже в тех случаях, когда процедура, применяемая на практике, может принести пользу другому лицу, она остается вмешательством, направленным на повышение благосостояния конкретного лица или группы лиц; таким образом, это практика и не нуждается в пересмотре как исследование.