Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта. Благодаря им мы улучшаем сайт!
Принять и закрыть

Читать, слущать книги онлайн бесплатно!

Электронная Литература.

Бесплатная онлайн библиотека.

Читать: Слово как улика. Всё, что вы скажете, будет использовано против вас - Джон Олссон на бесплатной онлайн библиотеке Э-Лит


Помоги проекту - поделись книгой:

Так произошло и с господином Обломовым. Он работал в чужой стране, вдали от дома, и его задачей было создание сельскохозяйственных курсов, которые принесли бы долгосрочную пользу фермерской науке. Проведя в стране совсем немного времени, он получил следующее письмо:

Текст 1: Первое анонимное электронное письмо[32]

Господин Обломов,

сообщаю вам по секрету, что некая группа людей запланировала ваше убийство, встретившись в городском баре. некоторые из них, кажется, работали в вашей компании и уволились некоторое время назад. Их их шестеро, трое из нних похожи на [название племени]. Один из [название племени] – известный наемный убийца, работающий в [название города]. Они планировали похитить вас по пути в аэропорт, но вы отбыли на день или два раньше. Они хотели перехватить вас возле [название места] и отвезти в [название места] плантации, и вас бы никто никогда больше не увидел. У всех у них есть ваши фотографии. Они ззнали, что вы поедете на лендровере, бМв или красной хонде. они координируют свои действия по мобильным телефонам. я не знаю, зачем они за вашей жизнью, но они выглядят очень целеустремленно. сейчас они ждут, чтобы вернуться и заполучить вас, они даже знают дату, когда вы собираетесь приехать, и хотят поймать вас по дороге из аэропорта. кто-то из вашей компании помогает им с подробностями.я узнал об этом, сидя за соседним столиком, один из них забыл кое-какие бумаги с подробностями, они не боялись говорить и выглядели слегка пьяными. Я сидел прямо позади них около тридцати минитно совсем не боялся. еще они говорили, что работа стоит 20 000, и что все деньги, которые они при вас найдут, тоже будут их. я советую вам держаться подальше, я не знаю вас, но хочу помочь вам.это настоящие убийцы.

Спустя немного времени господин Обломов получил второе письмо:

Текст 2: Второе анонимное электронное письмо

Борис,

Я – один из четырех работников, все еще находящихся в офисе. Я скрываю свою личность, потому что понял, что тайна перестала быть тайной и автор анонимного документа теперь известен публике. Я пишу по причине искреннего беспокойства.

Мы, работники офиса, убеждены, что существует реальная угроза к вашей жизни, какие-то загадочные люди ищут вас (в разное время разные).Они не те, за кого себя выдают. Копы тоже вас ищут, они говорят, что хотят вернуть вас на скамью подсудимых, и выглядят они так, как будто знают что-то, чего не знаем мы.

с наилучшими пожеланиями.

Как раз перед получением этих писем господин Обломов поссорился с секретарем организации. Обломов заподозрил, что анонимные письма мог послать этот джентльмен, мистер Гонсалес, и отправил нескольких коллег повидаться с ним и доставить письмо, в котором Обломов обрисовал свое беспокойство. Вот что он получил в ответ (выдержка):

Текст 3: Письмо от бывшего работника

Во-первых, я проинформировал их, а теперь хочу также проинформировать и вас о том, что я против вас НИЧЕГО НЕ ИМЕЮ. Вы сказали, что получили угрожающие SMS и электронные письма, и мне было жаль слышать это. Я должен обратить ваше внимание на то, что я также получал похожие сообщения, вероятно, даже хуже. Я показывал эти сообщения своей команде, и они все были в шоке, они все еще на моем телефоне и я их вам покажу. Я также получал электронные сообщения, вы расплачетесь, когда прочтете их. У меня совсем нет времени сидеть и писать такие письма, они выдают очень мелкую личность. Если у меня будет, что вам сказать, я напишу вам прямо и никогда не буду скрываться, какими бы горькими ни были мои слова. Я показал команде единственное SMS, которое я когда-либо писал напрямую вам, и я сделал это из лучших побуждений, прошу прощения, если это задевает вас, я никогда не намеревался этого делать. Все мы пришли к заключению, что кто-то пытается рассорить нас с вами и раздувает это дело; вероятно, он хочет разрушить вашу организацию. Поэтому важно, чтобы вы выяснили источник этой информации, сообщили в полицию и усилили свою личную охрану, пожалуйста, не рискуйте с вашей жизнью.

Наконец, я прошу вас убедить автора этого документа открыться публике, открыться хотя бы вам, пояснить свои претензии, и тогда мы с вами могли бы их обсудить. Давайте оставаться позитивными и развеем впечатление возникшей между нами враждебности, которой нет.

Спасибо вам,

П. У. Гонсалес. 

Первым мне бросилось в глаза то, что в этих текстах несколько раз упоминается «ваша жизнь», каждый раз с разными предшествующими предлогами. Так, в двух анонимных документах встречаются «Я не знаю, зачем они за вашей жизнью, но они выглядят очень целеустремленными» и «Мы, работники офиса, убеждены, что существует реальная угроза к вашей жизни», в то время как в тексте Гонсалеса мы имеем «усилили свою личную охрану, пожалуйста не рискуйте с вашей жизнью». Не обязательно это как-то связано с авторством, но, тем не менее, это интересно в свете вполне компетентного обращения с предлогами в остальном тексте. Другим зачастую сложным для изучающих английский язык аспектом является употребление определенного артикля the. По большей части в данных текстах этот артикль используется довольно грамотно, хотя есть и ошибки, например to airport и from airport вместо to the airport и from the airport («в аэропорт», «из аэропорта»). Однако лексико-грамматика[33] очень уверенная: слова «перехватить», «беспокоиться», «целеустремленный», «убеждены» применяются без затруднений. Поэтому местоимение I («я»), несколько раз написанное с большой буквы, и were («были»), написанное как wer, не убеждают меня в том, что автору недостает компетентности и базовых языковых навыков. Рассмотрим также тот факт, что текст 1 начинается с маленькой буквы, secretly в нем написано как secretely («в тайне», «по секрету»), а BMW – как bMw. Вместе с тем leftsometimes (искаж. «уволился некоторое время»), kknew (искаж. «знал») и waitng (искаж. «ждать») и странная расстановка регистров в слове bMw призваны указать на то, что автор якобы не очень уверенно обращается с клавиатурой. Но я полагаю, что на самом деле автор анонимных писем сознательно искажает свой стиль и уровень владения клавиатурой. Кажущееся неумение пользоваться клавиатурой и простейшие опечатки часто применяются в целях сокрытия авторства. Однако этим попыткам продемонстрировать недостаток навыков противоречат признаки хорошего владения языком, в том числе приведенные выше примеры. Поэтому мне стало интересно, действительно ли это письма «искреннего беспокойства», как в них утверждается, и действительно ли их автор хотел «помочь».

Также мне показалось любопытным то, что мистер Гонсалес рассматривает смертельные угрозы в адрес господина Обломова исключительно в плоскости проблем, существующих между ними: «Все мы пришли к заключению, что кто-то пытается рассорить нас с вами и раздувает это дело», – и: «Кое-кто из бывших сотрудников проявил большой интерес к этому делу, и у меня есть предчувствие, что нельзя отметать возможность их участия в раздувании этой ссоры».

Это тоже еще ничего не говорит об авторстве, но подводит нас к следующему пункту: упоминания «кого-то» и особенно фраза «кое-кто из бывших сотрудников» в письме Гонсалеса явно отсылают к словам «некоторые из них, кажется, работали в вашей компании» из первого анонимного письма. Отметим также параллель между «Кто-то из вашей компании помогает им с подробностями» в том же письме и «кто-то слил им сведения». Как и многие анонимные письма, тексты 1 и 2 полны намеков. Так, в анонимках присутствуют расплывчатые фразы «группа людей» и «какие-то загадочные люди», в письме же Гонсалеса присутствует упоминание «кого-то».

Также примечательно, что и в анонимных письмах, и в письме Гонсалеса утверждается, что сведения сливает один человек, а в заговоре участвуют более одного бывшего сотрудника.

Рассматривая ряд анонимных сообщений, важно помнить, что они могут быть написаны более чем одним автором. Мне показались интересными такие связи между текстами, как упомянутые отсылки к «каким-то людям», очевидно, безграмотное использование предлогов со словом «жизнь» – «они за вашей жизнью», «угроза к вашей жизни», «рисковать со своей жизнью» и «настоящие убийцы» вместо «настоящей угрозы». Хотя это определенно не признаки единого авторства, я бы не сказал, что они не могут на него указывать.

Наконец, я обращаю внимание читателя вот на это предложение из текста 2: «автор анонимного документа теперь известен публике». Я думаю, что здесь автор имеет в виду, что «публике» стало известно о получении Обломовым анонимного документа. Это похоже на «Я прошу вас убедить автора документа открыться публике» из письма Гонсалеса тем, как использовано слово «публика». Дело не только в коллокации[34] слов «автор», «документ» и «публика», но и в первую очередь в том, как использовано слово «публика». В пассаже «автор анонимного документа теперь известен публике» под «публикой» пишущий подразумевает людей из компании Обломова, а не широкую публику. Я полагаю, что подобное толкование применимо и к письму мистера Гонсалеса: «Я прошу вас убедить автора этого документа открыться публике, открыться хотя бы вам». Он начинает с предложения Обломову «убедить автора… открыться публике». Однако это вновь не означает того, что автор должен открыться широкой публике, а лишь господину Обломову или компании господина Обломова, как становится понятно из «открыться хотя бы вам». Итак, слово «публика» в обоих текстах используется в очень специфическом значении, во всяком случае – в очень специфическом контексте.

В этом месте анализа я должен сказать, что мне больше нечего добавить: определенно, между письмом Гонсалеса и анонимными текстами есть связь, но больше ничего сказать нельзя. Я, конечно, не стал бы исключать его из списка возможных авторов. К сожалению, я больше не видел ни одного текста этого анонимного автора или авторов, так как вскоре после получения мной этого заказа господин Обломов исчез из виду. По сей день я не знаю, что с ним случилось.

Глава 14

«Профессиональный» анализ: ложное обвинение

Билл Джонсон – бизнесмен со Среднего запада, для которого самым большим удовольствием было слетать на личном самолете в Мексику, чтобы отдохнуть в своем летнем доме. Он был членом одного летного клуба на Среднем западе и часто помогал другим членам клуба, устраивая для них увеселительные воздушные прогулки, консультируя их на тему приобретения авиатехники; он даже помог парочке из них со строительством собственных ангаров на землях аэропорта. Однако летные клубы, подобно клубам рыбаков, шахматным клубам и клубам автолюбителей, бывают рассадниками зависти и соперничества: клубные группировки соревнуются друг с другом за положение в комитете, за лучшие парковочные места для своих машин и за благосклонность председателя. Билл Джонсон давно решил держаться подальше от внутриполитических дрязг клуба – он там был только за тем, чтобы летать. У него было множество клиентов по всем Соединенным Штатам, и ему не было нужды завоевывать положение в клубе. Чаще всего он летал по выходным.

Однажды он получил предложение снять участок земли на территории аэропорта на 25 лет. Он арендовал участок и построил на нем ангар по последнему слову техники. Вообразите же, как он ужаснулся, приехав однажды воскресным утром в аэропорт и обнаружив, что владельцы летного клуба заперли его самолет в его же ангаре. Его даже не пустили туда забрать личные вещи. Причиной для столь резкого шага со стороны клуба было то, что Джонсон якобы инкогнито вел интернет-журнал, который, по мнению правления клуба, вредил доходам их организации. Они показали Джонсону интернет-журнал, редактором которого, по их утверждению, он являлся. Я буду называть этот журнал документом Икс. Статьи в нем содержали умеренную критику в адрес правления летного клуба, но назвать его причиняющим убытки было бы преувеличением. На самом деле это больше походило на веселое, местами полуграмотное описание причуд одних членов клуба, тщеславия и амбиций других и общей неразберихи, которая всегда возникает, когда десяток людей занимаются одним делом и вроде бы должны ладить друг с другом. Джонсон оскорбился, так как в этом журнале слегка хромали грамматика, орфография и пунктуация.

Несколько здоровяков из числа членов клуба проводили его к ограде и сказали, что собираются не только оставить себе самолет и ангар, но и отсудить у него все до последнего цента.

В ответ на заявления о своей невиновности Билл Джонсон услышал, что у него «нет шансов». Несколько здоровяков из числа членов клуба проводили его к ограде и сказали, что собираются не только оставить себе самолет и ангар, но и отсудить у него все до последнего цента. Они ликующе улыбались, перечисляя принадлежащую ему собственность, о которой, как оказалось, им было известно довольно много. Подозрения касательно их истинных мотивов усиливались у Джонсона с каждой минутой, и он немедленно связался со своим адвокатом для того, чтобы предпринять ответные действия. Осознав, что жертва собирается сопротивляться, клуб пригласил некоего профессора оценить вероятность того, что автором материала Икс является мистер Джонсон. Отчет был составлен, а адвокаты мистера Джонсона наняли меня для того, чтобы узнать, «можно ли что-нибудь сделать».

Во-первых, я должен сказать, что упомянутый профессор весьма известен в своей области и, я полагаю, популярен в своем университете. Однако оказалось, что он не обладает детальным пониманием как судебной лингвистики, так и проблем установления авторства. Я не смог найти каких бы то ни было упоминаний его публикаций по вопросам судебной лингвистики или установления авторства, и, насколько мне известно, он не является и никогда не являлся членом Международной ассоциации судебной лингвистики, которая представляет эту область в академической сфере, издает собственный рецензируемый журнал и регулярно проводит международные конференции.

Отсутствие подобного опыта стало сказываться с самого начала. Например, профессор неправильно подошел к отбору текстов, и, на мой взгляд, некоторые его предположения о распределении слов в речи были ошибочны. Его статистические методики также вызывали вопросы. Однако что подумают судьи? Вот что было самое главное.

Я также заметил, что профессор Уиллерби (имя изменено), по-видимому, не был объективен при написании отчета. К примеру, он утверждал, что его задача заключалась в том, чтобы «предоставить отчет о лингвистических сходствах ряда текстов (писем обычных и электронных), написанных мистером Биллом Джонсоном, и другим рядом текстов, взятых из Икс…» Автор отчета, кажется, уже принял решение о том, что сходства будут значительными, и теперь просто искал подтверждение своим взглядам. Расследование подобного дела должно быть совершенно беспристрастным, и цели его следует заявлять куда более нейтральным тоном, например: «…предоставить отчет о возможных лингвистических сходствах Икс и Игрек». Я также отметил, что Уиллерби не упомянул о том, что его отчет был написан в помощь какому бы то ни было суду. Судебный лингвист работает не ради клиента – даже будучи нанятым, он помогает суду.

В предисловии Уиллерби утверждает, что:

…область судебной лингвистики, занимающаяся подобными вопросами, называется установлением авторства. У этой области давняя история, известная широкой публике главным образом по делам об оспаривании авторства таких известных писателей, как Уильям Шекспир. Однако эти же методы использовались и в таких судебных расследованиях, как идентификация Унабомбера, которая была произведена на основе его личного блокнота и широко распространенного манифеста.

В приведенной цитате, раз уж она выражает взгляд эксперта, есть несколько сомнительных моментов. Во-первых, судебная лингвистика – область сравнительно новая, у нее не было «долгой истории». Термин forensic linguistics («судебная лингвистика») впервые использовал в 1968 году Ян Свартвик. Я однажды спросил его о том, как он придумал это словосочетание, и он сказал, что в 60-х годах смотрел телесериал «Quincy». В каждом эпизоде звучало слово forensics («криминалистика»), и он подумал, что его можно вполне успешно применить в качестве прилагательного к слову «лингвистика». Это же словосочетание стало заглавием самой первой научной работы об этом предмете[35]. Однако широко этот термин стал употребляться лишь в 1994 году, когда начал издаваться первый академический журнал с этими словами в заголовке. Более того, установление авторства не является подразделом только лишь судебной лингвистики. Оно является обычным делом в литературной поэтике с ее куда более богатой историей. Авторство произведений Шекспира не относится к судебной области: это давний публичный диспут, малоинтересный в академическом смысле, а каноническое литературное авторство относится к области академических исследований, не имеющих никакого законодательного аспекта и поэтому не могущих называться судебной лингвистикой. Ошибочны даже замечания Уиллерби об Унабомбере: сперва он был идентифицирован на основе стилистических факторов, обнаруженных в его письмах к брату и свояченице, а не на основании его блокнотов, как заявляет Уиллерби; блокноты были найдены уже после ареста Унабомбера. Я располагаю этими сведениями из первых рук, от весьма уважаемого спецагента ФБР, работавшего над этим делом, – Джима Фитцджеральда.

Говоря об установлении авторства, Уиллерби заявляет о существовании трех процедур и перечисляет их: 1) неформальный анализ лингвистического своеобразия, 2) статистический анализ распределения служебных слов и 3) обучение нейросетей с помощью технологий искусственного интеллекта.

На самом деле Уиллерби, по-видимому, путается в терминологии. Сначала он говорит о трех типах процедур. Затем упоминает «общий метод», который в дальнейшем называет «процедурой», потом снова «методом» и, наконец, останавливается на «приеме». Из-за этой путаницы в терминологии я полагаю, что Уиллерби не понимает разницы между методами, процедурами и приемами. А о подходах он даже не заговаривает.

Было бы правильно начать с подхода к задаче. Простейшим подходом является субъективная оценка лингвистического своеобразия, то есть черт, специфически присущих некоторому автору (или кажущихся таковыми). У этого подхода есть свои области применения, но кто-то считает его «ненаучным» из-за того, что он плохо поддается численному выражению. Альтернативным подходом является количественный: любой из количественных методов может быть применен к любым лингвистическим аспектам. Три основные области количественного подхода связаны с измерением и статистическим анализом1) лексики текста, 2) служебных слов[36] и 3) моделированием языка, например, с помощью алгоритмов сжатия, нейросетей и так далее. В рамках каждого из этих подходов существует множество методов измерения и анализа.

О своем втором «методе» Уиллерби говорит: «Второй общий метод заключается в статистическом анализе распределения контекстонезависимых слов». Затем он цитирует двух авторов, библиографические ссылки на которых приведены в конце отчета, но конкретные номера страниц не указаны. В отчетах и вообще в академических работах совершенно необходимо предоставлять читателю точные ссылки на справочный материал. Просто привести названия работ недостаточно по той простой причине, что у читателя тогда не будет всех сведений, необходимых для проверки утверждений автора отчета.

Затем в отношении своего второго «метода» Уиллерби утверждает, что «эта процедура получила широкое признание в этой области», но я должен возразить. Широкого признания в этой области не получила ни одна процедура. И, в любом случае, о какой области идет речь? Если о судебной лингвистике, то это попросту неверно: я не знаю ни об одном лингвисте, представившем суду отчет по установлению авторства на основании подсчета служебных слов. Если речь идет об области компьютерной лингвистики, которая интенсивно занимается вопросами авторства, но положение которой не позволяет ей сделать вклад в судебную лингвистику, то, возможно, это действительно так. Однако следует отметить, что специалисты по компьютерной лингвистике обычно работают с очень длинными текстами: романами, крупными эссе и прочими объемными трудами. Судебной лингвистике приходится иметь дело с анализом почти исключительно кратких текстов. Нередко приходится проводить расследование, располагая лишь тремя текстами не более нескольких сот слов каждый, а то и меньше пятидесяти. По этой причине приемы судебной лингвистики обычно несколько отличаются от приемов установления авторства литературного произведения. В любом случае я никогда не слышал о специалисте по компьютерной лингвистике, который давал бы в суде экспертную оценку в области установления авторства.

Порой авторы экспертных отчетов делают сильные заявления, не выдерживающие испытания скрупулезным перекрестным допросом. Так, Уиллерби пишет: «Совсем недавно утверждалось, что полный синтаксический анализ обоих текстов является более прямым методом достижения той же цели, хотя он куда более трудозатратен и провести его за время, отведенное для настоящего анализа, было невозможно». Возникает ощущение, что мистер Уиллерби обладает необходимыми знаниями и программным обеспечением для выполнения подобной работы и, самое главное, – таким опытом. Насколько мне известно, лишь несколько аналитиков решились бы провести «полный» анализ документа или набора документов объемом 20 000 слов, и, как бы то ни было, выполнение синтаксического анализа – это работа для узкого специалиста, и мало какой лингвист может ее выполнить.

Также Уиллерби говорит: «Широко признано, что частота многих слов этого типа может служить своего рода отпечатком пальца каждого автора». Может быть, это и широко признано, но с этим не согласны те лингвисты, которые хоть как-то соприкасались с установлением авторства. На самом деле это во многом противоречит нашему пониманию того, как язык усваивается и используется, развивается и атрофируется на протяжении человеческой жизни. Уиллерби не привел никаких подтверждений тому, что подобное представление является «широко признанным».

В своем анализе Уиллерби упоминает печально известный метод установления авторства, отвергнутый судами более десяти лет назад. Он известен как метод накопленных сумм и был совместно разработан викарием и ученым-программистом. Его решительно атаковали как лингвисты, так и психологи. Под заголовком «Анализ служебных слов» Уиллерби утверждает, что метод накопленных сумм был отвергнут из-за того, что «множество двух– и трехбуквенных слов и слов, начинающихся с гласной, не является естественной лингвистической категорией». На самом деле это далеко не главная причина, по которой метод накопленных сумм был отвергнут. Главная причина в том, что он нарушает несколько основополагающих научных принципов и совершенно не учитывает ряда элементарных постулатов лингвистики. Для меня было неожиданностью, что мистер Уиллерби всего этого не знает, учитывая его положение в крупном образовательном учреждении. Я также удивился тому, что в отчете по установлению авторства «эксперт» говорит о методе, давно отвергнутом всем сообществом судебной лингвистики.

Далее по теме анализа служебных слов он добавляет: «В ходе первых исследований в области установления авторства было принято думать, что важным показателем является средняя длина предложения». Ирония здесь в том, что он говорит о работе, проведенной математиками сто лет назад – сначала Аугустусом де Морганом и Т. С. Менденхоллом, а позднее Адни Юлом. Ни один из этих математиков – весьма выдающихся, впрочем, – не был связан с лингвистикой и даже не увлекался серьезно изучением языка. Поэтому называть их работу «первыми исследованиями в области установления авторства» будет по меньшей мере лукавством. Также меня вновь озадачило то, что Уиллерби говорит о методе, а затем отбрасывает его, заявляя, что он не подходит для решения задачи установления авторства.

Еще по теме разбора служебных слов Уиллерби упоминает такую меру, как показатель лексического разнообразия текста. Это лингвистический показатель богатства словарного запаса в некотором объеме текста. Он равен отношению числа разных слов в тексте к длине текста, измеренной в словах. Однако измерение лексического разнообразия обычно не предпринимают в отношении служебных слов. Любопытно, что Уиллерби вновь описывает меру, которая, по его собственному признанию, мало подходит для анализа с целью установления авторства.

Уиллерби говорит, что тексты Джонсона и материала Икс были предоставлены ему в печатном виде. Учитывая то, что материал Икс был размещен в интернете во всеобщем доступе, мне показалось странным то, что он взял распечатанный текст и отсканировал его с применением технологии распознавания символов и последующей уточняющей корректурой. Странно, что аналитик воспроизводит электронный документ, сначала распечатывая его, а затем сканируя и вычитывая, и ожидает, что полученный таким образом текст будет в точности таким же, как оригинальный электронный текст. Уиллерби утверждает, что «каждая страница была вычитана OCR-ассистентом». Он не сообщает, был этот ассистент человеком или компьютерной программой. OCR-ассистенты входят во многие пакеты программного обеспечения и по большей части помогают решать вопросы верстки, организации текста и так далее. Он говорит, что «для исправления ошибок, не встречающихся в исходном тексте, использовалась программа проверки орфографии». Я не уверен в том, что понимаю, что именно он имеет в виду. То, что программа проверки орфографии использовала стандартный орфографический словарь для устранения ошибок, или же то, что эта программа была использована для сохранения ошибок, сделанных в источнике? Не знаю, как подобная программа может в этом помочь; скорее всего, это сделал сам Уиллерби.

Те же замечания относятся и к текстам Билла Джонсона. В большинстве своем это были электронные письма, написанные мистером Джонсоном ранее. Если это уже были электронные документы, то зачем их распечатывать, сканировать и вычитывать? Раньше пакеты OCR-программ для сканеров славились тем, что нагружали процессор и допускали массу ошибок, особенно в таких документах, как электронные письма. Между прочим, в данном контексте со словом «ошибка» следует обращаться очень обдуманно. Под ошибкой здесь подразумевается не грамматическая, орфографическая или пунктуационная ошибка. Речь идет об отличиях текста, произведенного в процессе сканирования, от текста первоначального. Если сканер честно воспроизводит фрагмент текста, содержащий ошибку, то с точки зрения судебной лингвистики – это не ошибка. Сканирование проведено корректно. И напротив, если сканер «исправляет» ошибку посредством встроенного алгоритма проверки орфографии, то это ошибка, несмотря на то что произведенный текст грамматически и орфографически корректен. Обычно назначение корректировщика в распознающем программном обеспечении сканера – исправлять обнаруженные им ошибки правописания; но в судебном контексте важно ничего не исправлять, поскольку текст-свидетельство должен быть представлен как он есть.

Я очень сильно сомневаюсь, что кто-либо способен вычитать 20 000 слов и в соответствии с этими высокими требованиями не допустить ошибок, особенно в условиях ограниченного времени (о котором Уиллерби также говорит в своем отчете). Даже самый аккуратный автор совершает разного рода ошибки, и если они были исправлены в процессе сканирования либо как-то неверно интерпретированы, то версия Уиллерби, весьма вероятно, не вполне точно отражает исходный материал. То же касается и текстов мистера Джонсона. Джонсон попросил дать ему ознакомиться с электронными письмами, использованными для экспертизы, но Уиллерби ему в этом отказал. Это крайне необычно, так как означает невозможность проверить опорные документы на точность и достоверность.

Следующий раздел в отчете Уиллерби озаглавлен «Выбор образцов». Насколько я могу судить, все описанные им методы были отвергнуты. Он до сих пор не упомянул тех методов, которые собирается применить для установления авторства. Более того, в судебной работе проверяемые тексты никогда не называют «образцами» (samples). Все тексты в наборе являются обязательными, так как целью исследования является установление личности их автора, или, выражаясь более научно, выяснить, на каком основании эти тексты можно приписать или не приписать тому или иному автору.

Но самая серьезная лингвистическая слабость отчета Уиллерби еще впереди. Она связана с тем, какого типа тексты были выбраны им для сравнения. Уиллерби говорит, что все они относятся к «объяснительной прозе». Этим термином называют тексты, призванные объяснять что-либо, чаще всего технические. Часть сравнительных текстов Уиллерби действительно подпадают в категорию объяснительной прозы; например, он включил в корпус текстов для сравнения студенческое эссе и часть кандидатской диссертации по лингвистике (возможно, своей собственной?). Однако можно усомниться в том, что электронные письма Билла Джонсона (даже те, которые касаются довольно формальных тем) полностью отвечают критериям объяснительной прозы, поскольку тексты, написанные для асинхронного электронного средства связи[37], зачастую куда менее структурированы по сравнению с более формальной прозой и склонны к неформальности по части [адресованности] и тона. Более того, мы можем усомниться и в том, что один из текстов, включенных Уиллерби в корпус, – написанная им самим лекция для студентов, – относится к прозе в традиционном смысле этого слова, поскольку она писалась для того, чтобы читать ее вслух перед группой людей, а не для того, чтобы кто-то читал ее в индивидуальном порядке. Мне удивительно и то, что в качестве критерия классификации он выбрал объяснительную прозу. Материал Икс определенно не был объяснительной прозой. Если чем он и был, так это умеренной политической сатирой.

Меня также несколько озадачило то, что для установления авторства он использовал собственную работу. За почти пятнадцать лет работы в области лингвистики мне ни разу не доводилось слышать, чтобы кто-нибудь так поступал. В контексте судебной практики это совершенно непрофессионально и выдает отсутствие опыта в этой области. Это все равно как если бы исследователь голосования, стремясь усилить впечатление поддержки населением некоторой политической партии, учел собственные избирательные предпочтения как часть исследуемого им голосования. Мы определенно назовем результаты исследования, проведенного подобным образом, предвзятыми. Я сильно сомневаюсь в том, что какой бы то ни было академический ученый включал когда-либо свою собственную работу в корпус для исследования, если только речь не шла о каких-то чрезвычайных обстоятельствах, в данном случае отсутствующих.

Итак, здесь мы видим совершенно перемешанные типы и жанры текстов, что ведет к путанице с регистром, которую я опишу подробнее в дальнейшем. Однако прежде, чем я заговорю о регистре, стоит отметить разнообразие типов текстов и смешение жанров в корпусе текстов Уиллерби. Что касается типа текстов, то они представлены лекциями, электронными письмами, одним эссе и диссертацией. Большинству проведенных или исследованных мною анализов с целью установления авторства свойственно стремление к однородности сравнительных текстов по типу, если только против этого нет практических соображений, например, если исследуемый текст относится к особо редкому типу. В данном случае это, конечно же, не так. Однако я понимаю, что Уиллерби использовал электронные письма мистера Джонсона потому, что не располагал никакими другими его текстами для сравнения, но в таком случае ему следовало ограничиться электронными письмами или, в крайнем случае, использовать для сравнения только электронные письма и записи из сетевого журнала. Следует отметить и смешение жанров: академические тексты сочетаются с текстами, относящимися к управлению комитетом, и сравниваются с анонимными записями, критикующими правление летного клуба. Это трудно назвать корпусом текстов, единообразных по жанру. Наконец, Уиллерби, по-видимому, не учел то обстоятельство, что он имеет дело с текстами не просто неизвестного автора, но автора анонимного. Уиллерби не учитывает такую возможность: анонимный автор может искажать свой стиль, так же как человек, анонимно звонящий по телефону, искажает свой голос. Без сомнения, попытки автора скрыться повлияют на итоги любой исследовательской процедуры.

Но вернемся к регистру. Нам необходимо обсудить этот термин для того, чтобы понять, где Уиллерби сбился с пути. Понятие регистра в лингвистике касается таких вопросов, как способ производства текста, его адресованность, формальность его структуры и содержания и так далее. Тремя составляющими регистра являются:

1. Модальность [модус] — используемый речевой канал: произведен ли текст посредством письма, говорения или диктовки; произведен ли он в одной форме с последующим переводом в другую (например, новостные сводки и лекции пишут для того, чтобы зачитывать); представлен ли наряду с речью некий дополнительный материал (например, фотографии и карикатуры в газете, графики и таблицы в академическом журнале). При сравнении текстов с целью выяснения авторства и при любом другом лингвистическом анализе важно единообразие речевой модальности. В последние годы было проведено много исследований асинхронных электронных средств связи, таких как электронная почта и SMS-сообщения, и считается, что у них много общего с устной речью. Поэтому я не считаю, что можно с пользой сопоставлять электронные письма и диссертации или, например, электронные письма и электронный журнал. Тот факт, что одним из текстов для сравнения является лекция, написанная для того, чтобы читать ее перед аудиторией, в то время как другим является адресованное коллеге электронное письмо, а третьим – студенческое эссе, указывает на то, что Уиллерби, по-видимому, не принял фактор регистра всерьез, что несколько удивительно при его академической образованности. Он утверждает, что все его тексты-образцы относятся к «объяснительной прозе» и что это достаточно узкий класс текстов, поэтому гарантировано некое единообразие корпуса. Думаю, ни один лингвист с этим не согласится.

2. Направление [тональность] — область регистра, касающаяся отношений между создателем текста и его получателем, то есть автора и читателя, говорящего и слушателя, лектора и аудитории и так далее. В предыдущем разделе я описал то, как смешение языковых модальностей делает бесполезным сравнение текстов из корпуса Уиллерби с материалом Икс, и я утверждаю, что то же самое касается и вопросов лингвистической тональности. Так, студент, пишущий эссе, адресует его своему преподавателю для оценки. Автор электронного письма может быть знаком или незнаком с его адресатом, но отношения автор – читатель в этом случае не обязательно сравнимы с отношениями студент – преподаватель, которые очевидно противоположны отношениям преподаватель – студенческая аудитория, свойственным лекционной среде (учтем, что Уиллерби включает лекцию в корпус текстов для сравнения). По этой причине для сравнительного анализа с целью установления авторства обычно подбирают тексты, совпадающие с исследуемым текстом в отношении тональности.

3. Критически важным вопросом регистра является поле. Под ним подразумевается тематика текста или набора текстов и предназначение текста. Относимые к полю свойства сравнительных текстов, отобранных Уиллерби, столь же разнообразны, как их модус и тональность. Например, в их числе есть сложная академическая проза о лингвистике (дипломная работа), электронные письма о комитетах и администрировании, лекция по лингвистике и студенческое эссе на свободную тему. Сравнительные тексты подозреваемого включают электронные письма в адрес летного клуба об авиации и о делах клуба. Это довольно близко к исследуемым текстам – материалу Икс, – но совершенно не соответствует вышеупомянутым опорным текстам других авторов. Однако соответствие ограничено полем, но не типом текстов, и, как уже отмечалось, разнообразие типов текстов ограничивает возможность полезного сравнения с целью установления авторства. Составляя корпус таким образом, Уиллерби лишил процедуру проверки объективности и выставил Джонсона наиболее вероятным автором.

4. Прочие социолингвистические факторы: нам не известен ни возраст, ни пол, ни уровень образования большинства кандидатов на авторство. Еще важнее то, что в отчете Уиллерби нет никаких упоминаний о попытках соответствовать социолингвистическим критериям. В отсутствие группы кандидатов, соответствующей подозреваемому (например, персонала компании или организации, в которой работает главный подозреваемый), для анализа с целью установления авторства обычно пытаются подобрать группу кандидатов, подобно тому, как это делается при опознании преступника. Например, довольно трудно представить себе, чтобы на опознании присутствовали высокий лысый человек среднего возраста, низкорослый юный волосатый толстяк, молодая женщина, пожилой человек (не важно, какого пола) и так далее. Более того, в идеальном расследовании мы, вероятно, хотели бы удостовериться в том, что наши кандидаты происходят из одной и той же географической области, что их занятия и достижения схожи, что все тексты написаны в пределах одного и того же достаточно короткого периода времени. Ни о чем подобном Уиллерби не упоминает.

В своем докладе Уиллерби пусть неявно, но принимает как данность, что у материала Икс был лишь один автор. Он все же исключает «письма к редактору» и иные очевидно неподходящие тексты, но забывает упомянуть о том, что у текстов Икс может быть несколько авторов. Следует помнить, что нередко публикации (независимо от их типа) приписывают одному автору, хотя в их создании и редактировании участвовали несколько лиц. Более того, в разного рода журналах не редкость и сотрудничество двух и более авторов в написании текста или текстов, подлежащих дальнейшей редактуре ради придания им характерного стиля издания. Поэтому непосвященный читатель отчета Уиллерби легко сочтет, что можно без опаски предположить наличие одного-единственного автора, а если возможность множественного авторства даже не рассматривается, это может повлиять на восприятие читателя, создавая у него определенную предвзятость.

В итоге работа Уиллерби не является профессиональным отчетом, отвечающим стандартам, установленным для вспомогательных судебных материалов. Я сделал такой вывод по нескольким причинам:

• Неправильно проведена выборка текстов: собственные работы Уиллерби смешаны с работами других авторов. Он не учитывает вопросы жанра, типа текстов, модуса, поля и тональности. Он пренебрегает социологическими аспектами возраста, пола и образования. Он полностью избегает вопросов двойного авторства и сокрытия авторства.

• Он, по-видимому, не осознает того факта, что служебные слова все же зависят от контекста, и, похоже, считает длину главного предложения и соотношение числа разных слов к общей длине текста связанными с вопросами анализа служебных слов. К тому же вызывает подозрения его метод подготовки текста. Почему он решил отсканировать электронные тексты? Насколько точным был полученный результат?

• В поддержку его выводов не приведены теоретические обоснования: мы не знаем, почему он считает, что авторам присущи «лингвистические отпечатки пальцев», когда на самом деле есть серьезные причины полагать обратное, если учитывать, например, тот факт, что язык усваивается в социуме, а не наследуется, что он подвержен влияниям и переменчив, в том числе под воздействием таких макросоциальных гомогенизирующих факторов, как образование и СМИ.

На мой профессиональный взгляд, уровень понимания Уиллерби данной темы и то, как он провел подбор корпуса текстов, полностью лишает его отчет какой бы то ни было ценности. Тем не менее, далее я продемонстрирую еще две области, в которых он допускает серьезные ошибки, а именно: порочность его метода лингвистического анализа и его метода составления статистического отчета.

Для того чтобы объяснить свою позицию, я сначала расскажу о двух основных типах слов в языке. Это знаменательные слова и служебные слова. Знаменательные слова передают значение, и к ним относятся имена существительные, имена прилагательные, глаголы и некоторые наречия. Служебные же слова не передают независимого значения, но выполняют в языке грамматическую функцию; к этой категории относятся предлоги, артикли и служебные наречия. Таково традиционное деление слов на типы или уровни семантической структуры, первоначально выдвинутое Генри Суитом, который говорил о «смысловых единицах» (то есть знаменательных словах) и «формальных единицах» (то есть служебных словах) (Sweet, 1891: 22).

По разделу «Подбор образцов» сложновато составить представление о процедуре, которой следовал Уиллерби. По-видимому, он взял пятьдесят самых часто встречающихся слов из каждого набора текстов и оставил из них только «контекстонезависимые». Он говорит, что отбросил «контекстозависимые» слова, такие как taxi-way («рулежная дорожка»). Мне не ясно, что он имеет в виду: отбросил ли он все знаменательные слова или только те знаменательные слова, которые посчитал зависящими от контекста? Каково основание или определение зависимости от контекста? В любом случае зависимость служебных слов от контекста следует поставить под вопрос. Можно подумать, что распределение служебных слов не зависит от контекста, но не для каждого из них это так. Распределение некоторых из них оказывается одинаковым независимо от жанра и типа текста, и потому они являются контекстонезависимыми в смысле распределения. У некоторых же распределение оказывается разным в текстах разных типов и жанров, то есть они контекстозависимы.

Тогда, если корпус состоит из текстов разных типов, то в результате такой процедуры частота употребления этих слов окажется искаженной и картина, с которой мы будем сравнивать текст устанавливаемого автора, не будет точной. Ниже я проиллюстрирую это положение, приведя некоторые примеры частоты служебных слов в текстах разного типа, полученные с помощью простого программного обеспечения для подсчета слов. Сначала я определил частоту слов в носителе, подобном исследуемым текстам, а именно – в газетных статьях. Затем я сравнил частоту слов в этом носителе с частотой в электронных письмах – носителе, использованном в корпусе Уиллерби. Я решил использовать только самые распространенные служебные слова: определенные и неопределенные артикли. Результаты приведены в таблице 14.1. Как видно из этой таблицы, хотя распределение артикля a(n) в этих двух типах текстов похоже, распределение артикля the в них значительно различается.

Таблица 14.1. Распределение артиклей the и a/an в небольшом корпусе новостных статей и текстов электронных писем
Таблица 14.2. Распределение некоторых личных местоимений в небольшом корпусе новостных статей и электронных писем

Из таблицы 14.2 видно, что выбранные местоимения практически отсутствуют в новостных статьях, но относительно часто встречаются в текстах электронных писем. На самом деле для этого есть веские лингвистические причины, поскольку газетные статьи крайне редко повествуют о первом или втором грамматическом лице (I, you – «я», «ты»), в то время как электронные письма, как правило, либо о «тебе», либо обо «мне», либо местоимения «ты» и «я» используются в них для ведения беседы о чем-то еще. Таким образом, показатели в таблицах 14.1 и 14.2, по-видимому, указывают на то, что при сравнении текстов разного типа мы не должны полагаться на частоту употребления некоторых распространенных служебных слов при установлении авторства: влияние типа текстов и их жанра может искажать результат. Например, если мы возьмем электронные письма и новостные статьи одного и того же автора, есть причины полагать, что тексты этих типов будут следовать вышеприведенным закономерностям.

Именно поэтому следует обращаться с терминами «контекстозависимые» и «контекстонезависимые» с некоторой осторожностью. В то время как служебные слова в теории могут быть контекстонезависимыми или менее контекстозависимыми, чем знаменательные слова, судя по всему, понятие независимости от контекста не является полезным при решении столь требовательной к точности задачи, как установление авторства. Установление авторства – серьезное дело, особенно когда от него зависит чья-то репутация, свобода или, порой, даже жизнь, и определения, полезные в академических дискуссиях, не обязательно являются таковыми применительно к точным и важным задачам вроде установления авторства. После того как я представил свой анализ суду, летный клуб отозвал свое заявление против мистера Джонсона и уплатил ему существенную компенсацию за причиненные моральные страдания. Никто не знает, о чем думало правление клуба, начав подобное дело против одного из преданнейших его членов. В какой-то момент мистер Джонсон видел, как работники клуба фотографировали из припаркованной машины его маленьких внуков, играющих в саду, что столь же необъяснимо[38].

Что касается профессора Уиллерби, то я не слышал о его дальнейших потугах в судебной лингвистике, и хотя я желаю, чтобы его карьера в избранной им области была долгой и успешной, я уверен, что все останется без изменений до тех пор, пока он не приобретет соответствующие знания и опыт, позволяющие решать вопросы, которые в настоящий момент выходят за рамки привычной для него области.

Глава 15

В камере смертников

Днем в среду 18 мая 1994 года в штате Южная Каролина у себя дома в Адамс Ран неподалеку от города Чарльстон скончались от огнестрельных ран Джозеф и Барбара Лафайетт. На следующий день был арестован молодой человек, проезжавший через этот штат, позже его признали виновным в этом преступлении. В ожиданни казни он находился в камере смертников в исправительном учреждении Либер в Риджвилле, Южная Каролина. Его номер в Департаменте по вопросам исполнения наказаний – 5041. Его имя – Джеймс Эрл Рид, и на момент ареста он только что вышел из федеральной тюрьмы в Кентукки. Он был арестован по пути домой неподалеку от Чарльстона. Как оказалось, он был знаком с Лафайеттами до того, как попал в тюрьму. Суд постановил, что это убийство было совершено из мести, поскольку когда-то Джеймс встречался с их дочерью. Молодая пара поссорилась, и Джеймс, предположительно, в гневе сбил на машине нового ухажера их дочери, за что и отбывал наказание в Кентукки. Суд постановил, что он вернулся в Южную Каролину отомстить девушке. Не сумев ее разыскать, он со злости застрелил ее родителей. После осуждения Джеймс Эрл Рид просидел в камере смертников почти двенадцать лет, пытаясь заставить людей выслушать его точку зрения. Он утверждал, что заявление, составленное детективами, не соответствовало тому, что он рассказал. Наконец, он связался с частным сыщиком по имени Филип Аптон. Аптон выслушал Рида, после чего направил мне копию заявления и примеры письменной речи Рида. Жернова правосудия мелют медленно во всем мире, и в отношении приговоренных к смертной казни это особенно верно. Джеймс Эрл Рид научился терпению и продолжал утверждать, что невиновен.

После осуждения Джеймс Эрл Рид просидел в камере смертников почти двенадцать лет, пытаясь заставить людей выслушать его точку зрения. Он утверждал, что заявление, составленное детективами, не соответствовало тому, что он рассказал.

Объем заявления, приписываемого Риду, составляет около 1500 слов. В конце главы я приведу его целиком, так как это поможет пониманию фактической стороны дела.

Заявление написано рукой детектива Д. Р. Хейла, работавшего в офисе окружного шерифа Чарльстона, Южная Каролина, и датировано 19 мая 1994 года. В заявлении описано, как мистер Рид покинул федеральную тюрьму в Манчестере, Кентукки, в апреле 1994 года, как он прибыл в город Гринвилл, приобрел оружие и боеприпасы и как затем добрался до Чарльстона, Южная Каролина, прибыв туда 17 мая – за день до стрельбы в Адамс Ран. В заявлении описано, как Рид связался с миссис Лафайетт вечером 17 мая, как он провел ночь под открытым небом рядом с супермаркетом, как пришел к дому Лафайеттов 18 мая, встретился с ними и застрелил их. Затем он покинул место преступления, воспользовавшись их автомобилем, и добрался до близлежащей грунтовой дороги под названием Скотт-Уайт-Роуд, где, согласно заявлению, он бросил машину и избавился от пистолета и гильз. Заявление завершается арестом Рида на следующее утро. В комплекте с заявлением пришел документ, озаглавленный «Отчет о происшествии», также написанный рукой детектива Хейла. В этих записях изложены события вечера 18 мая 1994 года – то, как Хейлу сообщили по рации о стрельбе, произошедшей в Адамс Ран, и то, что ему было приказано явиться в госпиталь местного университета. Также эти записи повествуют о событиях следующего дня, когда детективы Хейл и Коуксум допрашивали обвиняемого Джеймса Эрла Рида. Третья страница записей посвящена неким административным вопросам, связанным с делом, имевшим место несколькими днями ранее. Вот выдержка из записей детектива от 19 мая 1994 года:

5—19—94

09:50 Допрос подозреваемого – Устное «предупреждение Миранды»[39] – получить у подозреваемого (Джеймс Рид) подпись под отказом от правила Миранды. Присутствует дет. С. Коуксум.

I/O покинул комнату и дал дет. Коуксуму поговорить с подозреваемым

11:00 Дет. Коуксум сообщает I/O, что подозреваемый признался в убийстве двух человек и готов показать помощникам шерифа место в лесу, где был выброшен пистолет.

11:30 Покидаем штаб-квартиру вместе с подозреваемым

12:00 Прибываем на 162 шоссе возле Таулз-Роуд – ищем пистолет в лесу

Ориентиры – Белый забор, темный забор, белые камни у дороги, пень на другой стороне 162 шоссе к востоку от Таулз-Роуд.

В поисках участвуют – дет. Филдс, Титтл, л-т Смоук, пом. шер. МакМиккинг, помощник Преснелл, дет. Коуксум



Поделиться книгой:

На главную
Назад