Так произошло и с господином Обломовым. Он работал в чужой стране, вдали от дома, и его задачей было создание сельскохозяйственных курсов, которые принесли бы долгосрочную пользу фермерской науке. Проведя в стране совсем немного времени, он получил следующее письмо:
Текст 1: Первое анонимное электронное письмо[32]
Спустя немного времени господин Обломов получил второе письмо:
Текст 2: Второе анонимное электронное письмо
Как раз перед получением этих писем господин Обломов поссорился с секретарем организации. Обломов заподозрил, что анонимные письма мог послать этот джентльмен, мистер Гонсалес, и отправил нескольких коллег повидаться с ним и доставить письмо, в котором Обломов обрисовал свое беспокойство. Вот что он получил в ответ (выдержка):
Текст 3: Письмо от бывшего работника
Первым мне бросилось в глаза то, что в этих текстах несколько раз упоминается «ваша жизнь», каждый раз с разными предшествующими предлогами. Так, в двух анонимных документах встречаются «Я не знаю, зачем они
Также мне показалось любопытным то, что мистер Гонсалес рассматривает смертельные угрозы в адрес господина Обломова исключительно в плоскости проблем, существующих между ними: «Все мы пришли к заключению, что кто-то пытается рассорить нас с вами и раздувает это дело», – и: «Кое-кто из бывших сотрудников проявил большой интерес к этому делу, и у меня есть предчувствие, что нельзя отметать возможность их участия в раздувании этой ссоры».
Это тоже еще ничего не говорит об авторстве, но подводит нас к следующему пункту: упоминания «кого-то» и особенно фраза «кое-кто из бывших сотрудников» в письме Гонсалеса явно отсылают к словам «некоторые из них, кажется, работали в вашей компании» из первого анонимного письма. Отметим также параллель между «Кто-то из вашей компании помогает им с подробностями» в том же письме и «кто-то слил им сведения». Как и многие анонимные письма, тексты 1 и 2 полны намеков. Так, в анонимках присутствуют расплывчатые фразы «группа людей» и «какие-то загадочные люди», в письме же Гонсалеса присутствует упоминание «кого-то».
Также примечательно, что и в анонимных письмах, и в письме Гонсалеса утверждается, что сведения сливает один человек, а в заговоре участвуют более одного бывшего сотрудника.
Рассматривая ряд анонимных сообщений, важно помнить, что они могут быть написаны более чем одним автором. Мне показались интересными такие связи между текстами, как упомянутые отсылки к «каким-то людям», очевидно, безграмотное использование предлогов со словом «жизнь» – «они за вашей жизнью», «угроза к вашей жизни», «рисковать со своей жизнью» и «настоящие убийцы» вместо «настоящей угрозы». Хотя это определенно не признаки единого авторства, я бы не сказал, что они не могут на него указывать.
Наконец, я обращаю внимание читателя вот на это предложение из текста 2: «автор анонимного документа теперь известен публике». Я думаю, что здесь автор имеет в виду, что «публике» стало известно о получении Обломовым анонимного документа. Это похоже на «Я прошу вас убедить автора документа открыться публике» из письма Гонсалеса тем, как использовано слово «публика». Дело не только в коллокации[34] слов «автор», «документ» и «публика», но и в первую очередь в том, как использовано слово «публика». В пассаже «автор анонимного документа теперь известен публике» под «публикой» пишущий подразумевает людей из компании Обломова, а не широкую публику. Я полагаю, что подобное толкование применимо и к письму мистера Гонсалеса: «Я прошу вас убедить автора этого документа открыться публике, открыться хотя бы вам». Он начинает с предложения Обломову «убедить автора… открыться публике». Однако это вновь не означает того, что автор должен открыться широкой публике, а лишь господину Обломову или компании господина Обломова, как становится понятно из «открыться хотя бы вам». Итак, слово «публика» в обоих текстах используется в очень специфическом значении, во всяком случае – в очень специфическом контексте.
В этом месте анализа я должен сказать, что мне больше нечего добавить: определенно, между письмом Гонсалеса и анонимными текстами есть связь, но больше ничего сказать нельзя. Я, конечно, не стал бы исключать его из списка возможных авторов. К сожалению, я больше не видел ни одного текста этого анонимного автора или авторов, так как вскоре после получения мной этого заказа господин Обломов исчез из виду. По сей день я не знаю, что с ним случилось.
Глава 14
«Профессиональный» анализ: ложное обвинение
Билл Джонсон – бизнесмен со Среднего запада, для которого самым большим удовольствием было слетать на личном самолете в Мексику, чтобы отдохнуть в своем летнем доме. Он был членом одного летного клуба на Среднем западе и часто помогал другим членам клуба, устраивая для них увеселительные воздушные прогулки, консультируя их на тему приобретения авиатехники; он даже помог парочке из них со строительством собственных ангаров на землях аэропорта. Однако летные клубы, подобно клубам рыбаков, шахматным клубам и клубам автолюбителей, бывают рассадниками зависти и соперничества: клубные группировки соревнуются друг с другом за положение в комитете, за лучшие парковочные места для своих машин и за благосклонность председателя. Билл Джонсон давно решил держаться подальше от внутриполитических дрязг клуба – он там был только за тем, чтобы летать. У него было множество клиентов по всем Соединенным Штатам, и ему не было нужды завоевывать положение в клубе. Чаще всего он летал по выходным.
Однажды он получил предложение снять участок земли на территории аэропорта на 25 лет. Он арендовал участок и построил на нем ангар по последнему слову техники. Вообразите же, как он ужаснулся, приехав однажды воскресным утром в аэропорт и обнаружив, что владельцы летного клуба заперли его самолет в его же ангаре. Его даже не пустили туда забрать личные вещи. Причиной для столь резкого шага со стороны клуба было то, что Джонсон якобы инкогнито вел интернет-журнал, который, по мнению правления клуба, вредил доходам их организации. Они показали Джонсону интернет-журнал, редактором которого, по их утверждению, он являлся. Я буду называть этот журнал документом Икс. Статьи в нем содержали умеренную критику в адрес правления летного клуба, но назвать его причиняющим убытки было бы преувеличением. На самом деле это больше походило на веселое, местами полуграмотное описание причуд одних членов клуба, тщеславия и амбиций других и общей неразберихи, которая всегда возникает, когда десяток людей занимаются одним делом и вроде бы должны ладить друг с другом. Джонсон оскорбился, так как в этом журнале слегка хромали грамматика, орфография и пунктуация.
Несколько здоровяков из числа членов клуба проводили его к ограде и сказали, что собираются не только оставить себе самолет и ангар, но и отсудить у него все до последнего цента.
В ответ на заявления о своей невиновности Билл Джонсон услышал, что у него «нет шансов». Несколько здоровяков из числа членов клуба проводили его к ограде и сказали, что собираются не только оставить себе самолет и ангар, но и отсудить у него все до последнего цента. Они ликующе улыбались, перечисляя принадлежащую ему собственность, о которой, как оказалось, им было известно довольно много. Подозрения касательно их истинных мотивов усиливались у Джонсона с каждой минутой, и он немедленно связался со своим адвокатом для того, чтобы предпринять ответные действия. Осознав, что жертва собирается сопротивляться, клуб пригласил некоего профессора оценить вероятность того, что автором материала Икс является мистер Джонсон. Отчет был составлен, а адвокаты мистера Джонсона наняли меня для того, чтобы узнать, «можно ли что-нибудь сделать».
Во-первых, я должен сказать, что упомянутый профессор весьма известен в своей области и, я полагаю, популярен в своем университете. Однако оказалось, что он не обладает детальным пониманием как судебной лингвистики, так и проблем установления авторства. Я не смог найти каких бы то ни было упоминаний его публикаций по вопросам судебной лингвистики или установления авторства, и, насколько мне известно, он не является и никогда не являлся членом Международной ассоциации судебной лингвистики, которая представляет эту область в академической сфере, издает собственный рецензируемый журнал и регулярно проводит международные конференции.
Отсутствие подобного опыта стало сказываться с самого начала. Например, профессор неправильно подошел к отбору текстов, и, на мой взгляд, некоторые его предположения о распределении слов в речи были ошибочны. Его статистические методики также вызывали вопросы. Однако что подумают судьи? Вот что было самое главное.
Я также заметил, что профессор Уиллерби (имя изменено), по-видимому, не был объективен при написании отчета. К примеру, он утверждал, что его задача заключалась в том, чтобы «предоставить отчет о лингвистических сходствах ряда текстов (писем обычных и электронных), написанных мистером Биллом Джонсоном, и другим рядом текстов, взятых из Икс…» Автор отчета, кажется, уже принял решение о том, что сходства будут значительными, и теперь просто искал подтверждение своим взглядам. Расследование подобного дела должно быть совершенно беспристрастным, и цели его следует заявлять куда более нейтральным тоном, например: «…предоставить отчет о возможных лингвистических сходствах Икс и Игрек». Я также отметил, что Уиллерби не упомянул о том, что его отчет был написан в помощь какому бы то ни было суду. Судебный лингвист работает не ради клиента – даже будучи нанятым, он помогает суду.
В предисловии Уиллерби утверждает, что:
В приведенной цитате, раз уж она выражает взгляд эксперта, есть несколько сомнительных моментов. Во-первых, судебная лингвистика – область сравнительно новая, у нее не было «долгой истории». Термин forensic linguistics («судебная лингвистика») впервые использовал в 1968 году Ян Свартвик. Я однажды спросил его о том, как он придумал это словосочетание, и он сказал, что в 60-х годах смотрел телесериал «
Говоря об установлении авторства, Уиллерби заявляет о существовании трех процедур и перечисляет их: 1) неформальный анализ лингвистического своеобразия, 2) статистический анализ распределения служебных слов и 3) обучение нейросетей с помощью технологий искусственного интеллекта.
На самом деле Уиллерби, по-видимому, путается в терминологии. Сначала он говорит о трех типах процедур. Затем упоминает «общий метод», который в дальнейшем называет «процедурой», потом снова «методом» и, наконец, останавливается на «приеме». Из-за этой путаницы в терминологии я полагаю, что Уиллерби не понимает разницы между методами, процедурами и приемами. А о
Было бы правильно начать с
О своем втором «методе» Уиллерби говорит: «Второй общий метод заключается в статистическом анализе распределения
Затем в отношении своего второго «метода» Уиллерби утверждает, что «эта процедура получила широкое признание в этой области», но я должен возразить. Широкого признания в этой области не получила ни одна процедура. И, в любом случае, о какой области идет речь? Если о судебной лингвистике, то это попросту неверно: я не знаю ни об одном лингвисте, представившем суду отчет по установлению авторства на основании подсчета служебных слов. Если речь идет об области компьютерной лингвистики, которая интенсивно занимается вопросами авторства, но положение которой не позволяет ей сделать вклад в судебную лингвистику, то, возможно, это действительно так. Однако следует отметить, что специалисты по компьютерной лингвистике обычно работают с очень длинными текстами: романами, крупными эссе и прочими объемными трудами. Судебной лингвистике приходится иметь дело с анализом почти исключительно кратких текстов. Нередко приходится проводить расследование, располагая лишь тремя текстами не более нескольких сот слов каждый, а то и меньше пятидесяти. По этой причине приемы судебной лингвистики обычно несколько отличаются от приемов установления авторства литературного произведения. В любом случае я никогда не слышал о специалисте по компьютерной лингвистике, который давал бы в суде экспертную оценку в области установления авторства.
Порой авторы экспертных отчетов делают сильные заявления, не выдерживающие испытания скрупулезным перекрестным допросом. Так, Уиллерби пишет: «Совсем недавно утверждалось, что полный синтаксический анализ обоих текстов является более прямым методом достижения той же цели, хотя он куда более трудозатратен и провести его за время, отведенное для настоящего анализа, было невозможно». Возникает ощущение, что мистер Уиллерби обладает необходимыми знаниями и программным обеспечением для выполнения подобной работы и, самое главное, – таким опытом. Насколько мне известно, лишь несколько аналитиков решились бы провести «полный» анализ документа или набора документов объемом 20 000 слов, и, как бы то ни было, выполнение синтаксического анализа – это работа для узкого специалиста, и мало какой лингвист может ее выполнить.
Также Уиллерби говорит: «Широко признано, что частота многих слов этого типа может служить своего рода отпечатком пальца каждого автора». Может быть, это и широко признано, но с этим не согласны те лингвисты, которые хоть как-то соприкасались с установлением авторства. На самом деле это во многом противоречит нашему пониманию того, как язык усваивается и используется, развивается и атрофируется на протяжении человеческой жизни. Уиллерби не привел никаких подтверждений тому, что подобное представление является «широко признанным».
В своем анализе Уиллерби упоминает печально известный метод установления авторства, отвергнутый судами более десяти лет назад. Он известен как метод накопленных сумм и был совместно разработан викарием и ученым-программистом. Его решительно атаковали как лингвисты, так и психологи. Под заголовком «Анализ служебных слов» Уиллерби утверждает, что метод накопленных сумм был отвергнут из-за того, что «множество двух– и трехбуквенных слов и слов, начинающихся с гласной, не является естественной лингвистической категорией». На самом деле это далеко не главная причина, по которой метод накопленных сумм был отвергнут. Главная причина в том, что он нарушает несколько основополагающих научных принципов и совершенно не учитывает ряда элементарных постулатов лингвистики. Для меня было неожиданностью, что мистер Уиллерби всего этого не знает, учитывая его положение в крупном образовательном учреждении. Я также удивился тому, что в отчете по установлению авторства «эксперт» говорит о методе, давно отвергнутом всем сообществом судебной лингвистики.
Далее по теме анализа служебных слов он добавляет: «В ходе первых исследований в области установления авторства было принято думать, что важным показателем является средняя длина предложения». Ирония здесь в том, что он говорит о работе, проведенной математиками сто лет назад – сначала Аугустусом де Морганом и Т. С. Менденхоллом, а позднее Адни Юлом. Ни один из этих математиков – весьма выдающихся, впрочем, – не был связан с лингвистикой и даже не увлекался серьезно изучением языка. Поэтому называть их работу «первыми исследованиями в области установления авторства» будет по меньшей мере лукавством. Также меня вновь озадачило то, что Уиллерби говорит о методе, а затем отбрасывает его, заявляя, что он не подходит для решения задачи установления авторства.
Еще по теме разбора служебных слов Уиллерби упоминает такую меру, как показатель лексического разнообразия текста. Это лингвистический показатель богатства словарного запаса в некотором объеме текста. Он равен отношению числа разных слов в тексте к длине текста, измеренной в словах. Однако измерение лексического разнообразия обычно не предпринимают в отношении служебных слов. Любопытно, что Уиллерби вновь описывает меру, которая, по его собственному признанию, мало подходит для анализа с целью установления авторства.
Уиллерби говорит, что тексты Джонсона и материала Икс были предоставлены ему в печатном виде. Учитывая то, что материал Икс был размещен в интернете во всеобщем доступе, мне показалось странным то, что он взял распечатанный текст и отсканировал его с применением технологии распознавания символов и последующей уточняющей корректурой. Странно, что аналитик воспроизводит электронный документ, сначала распечатывая его, а затем сканируя и вычитывая, и ожидает, что полученный таким образом текст будет в точности таким же, как оригинальный электронный текст. Уиллерби утверждает, что «каждая страница была вычитана OCR-ассистентом». Он не сообщает, был этот ассистент человеком или компьютерной программой. OCR-ассистенты входят во многие пакеты программного обеспечения и по большей части помогают решать вопросы верстки, организации текста и так далее. Он говорит, что «для исправления ошибок, не встречающихся в исходном тексте, использовалась программа проверки орфографии». Я не уверен в том, что понимаю, что именно он имеет в виду. То, что программа проверки орфографии использовала стандартный орфографический словарь для устранения ошибок, или же то, что эта программа была использована для сохранения ошибок, сделанных в источнике? Не знаю, как подобная программа может в этом помочь; скорее всего, это сделал сам Уиллерби.
Те же замечания относятся и к текстам Билла Джонсона. В большинстве своем это были электронные письма, написанные мистером Джонсоном ранее. Если это уже были электронные документы, то зачем их распечатывать, сканировать и вычитывать? Раньше пакеты OCR-программ для сканеров славились тем, что нагружали процессор и допускали массу ошибок, особенно в таких документах, как электронные письма. Между прочим, в данном контексте со словом «ошибка» следует обращаться очень обдуманно. Под ошибкой здесь подразумевается не грамматическая, орфографическая или пунктуационная ошибка. Речь идет об
Я очень сильно сомневаюсь, что кто-либо способен вычитать 20 000 слов и в соответствии с этими высокими требованиями не допустить ошибок, особенно в условиях ограниченного времени (о котором Уиллерби также говорит в своем отчете). Даже самый аккуратный автор совершает разного рода ошибки, и если они были исправлены в процессе сканирования либо как-то неверно интерпретированы, то версия Уиллерби, весьма вероятно, не вполне точно отражает исходный материал. То же касается и текстов мистера Джонсона. Джонсон попросил дать ему ознакомиться с электронными письмами, использованными для экспертизы, но Уиллерби ему в этом отказал. Это крайне необычно, так как означает невозможность проверить опорные документы на точность и достоверность.
Следующий раздел в отчете Уиллерби озаглавлен «Выбор образцов». Насколько я могу судить, все описанные им методы были отвергнуты. Он до сих пор не упомянул тех методов, которые собирается применить для установления авторства. Более того, в судебной работе проверяемые тексты никогда не называют «образцами» (samples). Все тексты в наборе являются обязательными, так как целью исследования является установление личности их автора, или, выражаясь более научно, выяснить, на каком основании эти тексты можно приписать или не приписать тому или иному автору.
Но самая серьезная лингвистическая слабость отчета Уиллерби еще впереди. Она связана с тем, какого типа тексты были выбраны им для сравнения. Уиллерби говорит, что все они относятся к «объяснительной прозе». Этим термином называют тексты, призванные объяснять что-либо, чаще всего технические. Часть сравнительных текстов Уиллерби действительно подпадают в категорию объяснительной прозы; например, он включил в корпус текстов для сравнения студенческое эссе и часть кандидатской диссертации по лингвистике (возможно, своей собственной?). Однако можно усомниться в том, что электронные письма Билла Джонсона (даже те, которые касаются довольно формальных тем) полностью отвечают критериям объяснительной прозы, поскольку тексты, написанные для асинхронного электронного средства связи[37], зачастую куда менее структурированы по сравнению с более формальной прозой и склонны к неформальности по части [адресованности] и тона. Более того, мы можем усомниться и в том, что один из текстов, включенных Уиллерби в корпус, – написанная им самим лекция для студентов, – относится к прозе в традиционном смысле этого слова, поскольку она писалась для того, чтобы читать ее вслух перед группой людей, а не для того, чтобы кто-то читал ее в индивидуальном порядке. Мне удивительно и то, что в качестве критерия классификации он выбрал объяснительную прозу. Материал Икс определенно не был объяснительной прозой. Если чем он и был, так это умеренной политической сатирой.
Меня также несколько озадачило то, что для установления авторства он использовал собственную работу. За почти пятнадцать лет работы в области лингвистики мне ни разу не доводилось слышать, чтобы кто-нибудь так поступал. В контексте судебной практики это совершенно непрофессионально и выдает отсутствие опыта в этой области. Это все равно как если бы исследователь голосования, стремясь усилить впечатление поддержки населением некоторой политической партии, учел собственные избирательные предпочтения как часть исследуемого им голосования. Мы определенно назовем результаты исследования, проведенного подобным образом, предвзятыми. Я сильно сомневаюсь в том, что какой бы то ни было академический ученый включал когда-либо свою собственную работу в корпус для исследования, если только речь не шла о каких-то чрезвычайных обстоятельствах, в данном случае отсутствующих.
Итак, здесь мы видим совершенно перемешанные типы и жанры текстов, что ведет к путанице с регистром, которую я опишу подробнее в дальнейшем. Однако прежде, чем я заговорю о регистре, стоит отметить разнообразие типов текстов и смешение жанров в корпусе текстов Уиллерби. Что касается типа текстов, то они представлены лекциями, электронными письмами, одним эссе и диссертацией. Большинству проведенных или исследованных мною анализов с целью установления авторства свойственно стремление к однородности сравнительных текстов по типу, если только против этого нет практических соображений, например, если исследуемый текст относится к особо редкому типу. В данном случае это, конечно же, не так. Однако я понимаю, что Уиллерби использовал электронные письма мистера Джонсона потому, что не располагал никакими другими его текстами для сравнения, но в таком случае ему следовало ограничиться электронными письмами или, в крайнем случае, использовать для сравнения только электронные письма и записи из сетевого журнала. Следует отметить и смешение жанров: академические тексты сочетаются с текстами, относящимися к управлению комитетом, и сравниваются с анонимными записями, критикующими правление летного клуба. Это трудно назвать корпусом текстов, единообразных по жанру. Наконец, Уиллерби, по-видимому, не учел то обстоятельство, что он имеет дело с текстами не просто неизвестного автора, но автора анонимного. Уиллерби не учитывает такую возможность: анонимный автор может искажать свой стиль, так же как человек, анонимно звонящий по телефону, искажает свой голос. Без сомнения, попытки автора скрыться повлияют на итоги любой исследовательской процедуры.
Но вернемся к
1.
2.
3. Критически важным вопросом регистра является
4.
В своем докладе Уиллерби пусть неявно, но принимает как данность, что у материала Икс был лишь один автор. Он все же исключает «письма к редактору» и иные очевидно неподходящие тексты, но забывает упомянуть о том, что у текстов Икс может быть несколько авторов. Следует помнить, что нередко публикации (независимо от их типа) приписывают одному автору, хотя в их создании и редактировании участвовали несколько лиц. Более того, в разного рода журналах не редкость и сотрудничество двух и более авторов в написании текста или текстов, подлежащих дальнейшей редактуре ради придания им характерного стиля издания. Поэтому непосвященный читатель отчета Уиллерби легко сочтет, что можно без опаски предположить наличие одного-единственного автора, а если возможность множественного авторства даже не рассматривается, это может повлиять на восприятие читателя, создавая у него определенную предвзятость.
В итоге работа Уиллерби не является профессиональным отчетом, отвечающим стандартам, установленным для вспомогательных судебных материалов. Я сделал такой вывод по нескольким причинам:
• Неправильно проведена выборка текстов: собственные работы Уиллерби смешаны с работами других авторов. Он не учитывает вопросы жанра, типа текстов, модуса, поля и тональности. Он пренебрегает социологическими аспектами возраста, пола и образования. Он полностью избегает вопросов двойного авторства и сокрытия авторства.
• Он, по-видимому, не осознает того факта, что служебные слова все же зависят от контекста, и, похоже, считает длину главного предложения и соотношение числа разных слов к общей длине текста связанными с вопросами анализа служебных слов. К тому же вызывает подозрения его метод подготовки текста. Почему он решил отсканировать электронные тексты? Насколько точным был полученный результат?
• В поддержку его выводов не приведены теоретические обоснования: мы не знаем, почему он считает, что авторам присущи «лингвистические отпечатки пальцев», когда на самом деле есть серьезные причины полагать обратное, если учитывать, например, тот факт, что язык усваивается в социуме, а не наследуется, что он подвержен влияниям и переменчив, в том числе под воздействием таких макросоциальных гомогенизирующих факторов, как образование и СМИ.
На мой профессиональный взгляд, уровень понимания Уиллерби данной темы и то, как он провел подбор корпуса текстов, полностью лишает его отчет какой бы то ни было ценности. Тем не менее, далее я продемонстрирую еще две области, в которых он допускает серьезные ошибки, а именно: порочность его метода лингвистического анализа и его метода составления статистического отчета.
Для того чтобы объяснить свою позицию, я сначала расскажу о двух основных типах слов в языке. Это
По разделу «Подбор образцов» сложновато составить представление о процедуре, которой следовал Уиллерби. По-видимому, он взял пятьдесят самых часто встречающихся слов из каждого набора текстов и оставил из них только «контекстонезависимые». Он говорит, что отбросил «контекстозависимые» слова, такие как taxi-way («рулежная дорожка»). Мне не ясно, что он имеет в виду: отбросил ли он все знаменательные слова или только те знаменательные слова, которые посчитал зависящими от контекста? Каково основание или определение зависимости от контекста? В любом случае зависимость служебных слов от контекста следует поставить под вопрос. Можно подумать, что распределение служебных слов не зависит от контекста, но не для каждого из них это так. Распределение некоторых из них оказывается одинаковым независимо от жанра и типа текста, и потому они являются контекстонезависимыми в смысле распределения. У некоторых же распределение оказывается разным в текстах разных типов и жанров, то есть они контекстозависимы.
Тогда, если корпус состоит из текстов разных типов, то в результате такой процедуры частота употребления этих слов окажется искаженной и картина, с которой мы будем сравнивать текст устанавливаемого автора, не будет точной. Ниже я проиллюстрирую это положение, приведя некоторые примеры частоты служебных слов в текстах разного типа, полученные с помощью простого программного обеспечения для подсчета слов. Сначала я определил частоту слов в носителе, подобном исследуемым текстам, а именно – в газетных статьях. Затем я сравнил частоту слов в этом носителе с частотой в электронных письмах – носителе, использованном в корпусе Уиллерби. Я решил использовать только самые распространенные служебные слова: определенные и неопределенные артикли. Результаты приведены в таблице 14.1. Как видно из этой таблицы, хотя распределение артикля a(n) в этих двух типах текстов похоже, распределение артикля the в них значительно различается.
Из таблицы 14.2 видно, что выбранные местоимения практически отсутствуют в новостных статьях, но относительно часто встречаются в текстах электронных писем. На самом деле для этого есть веские лингвистические причины, поскольку газетные статьи крайне редко повествуют о первом или втором грамматическом лице (I, you – «я», «ты»), в то время как электронные письма, как правило, либо о «тебе», либо обо «мне», либо местоимения «ты» и «я» используются в них для ведения беседы о чем-то еще. Таким образом, показатели в таблицах 14.1 и 14.2, по-видимому, указывают на то, что при сравнении текстов разного типа мы
Именно поэтому следует обращаться с терминами «контекстозависимые» и «контекстонезависимые» с некоторой осторожностью. В то время как служебные слова в теории могут быть контекстонезависимыми или менее контекстозависимыми, чем знаменательные слова, судя по всему, понятие независимости от контекста не является полезным при решении столь требовательной к точности задачи, как установление авторства. Установление авторства – серьезное дело, особенно когда от него зависит чья-то репутация, свобода или, порой, даже жизнь, и определения, полезные в академических дискуссиях, не обязательно являются таковыми применительно к точным и важным задачам вроде установления авторства. После того как я представил свой анализ суду, летный клуб отозвал свое заявление против мистера Джонсона и уплатил ему существенную компенсацию за причиненные моральные страдания. Никто не знает, о чем думало правление клуба, начав подобное дело против одного из преданнейших его членов. В какой-то момент мистер Джонсон видел, как работники клуба фотографировали из припаркованной машины его маленьких внуков, играющих в саду, что столь же необъяснимо[38].
Что касается профессора Уиллерби, то я не слышал о его дальнейших потугах в судебной лингвистике, и хотя я желаю, чтобы его карьера в избранной им области была долгой и успешной, я уверен, что все останется без изменений до тех пор, пока он не приобретет соответствующие знания и опыт, позволяющие решать вопросы, которые в настоящий момент выходят за рамки привычной для него области.
Глава 15
В камере смертников
Днем в среду 18 мая 1994 года в штате Южная Каролина у себя дома в Адамс Ран неподалеку от города Чарльстон скончались от огнестрельных ран Джозеф и Барбара Лафайетт. На следующий день был арестован молодой человек, проезжавший через этот штат, позже его признали виновным в этом преступлении. В ожиданни казни он находился в камере смертников в исправительном учреждении Либер в Риджвилле, Южная Каролина. Его номер в Департаменте по вопросам исполнения наказаний – 5041. Его имя – Джеймс Эрл Рид, и на момент ареста он только что вышел из федеральной тюрьмы в Кентукки. Он был арестован по пути домой неподалеку от Чарльстона. Как оказалось, он был знаком с Лафайеттами до того, как попал в тюрьму. Суд постановил, что это убийство было совершено из мести, поскольку когда-то Джеймс встречался с их дочерью. Молодая пара поссорилась, и Джеймс, предположительно, в гневе сбил на машине нового ухажера их дочери, за что и отбывал наказание в Кентукки. Суд постановил, что он вернулся в Южную Каролину отомстить девушке. Не сумев ее разыскать, он со злости застрелил ее родителей. После осуждения Джеймс Эрл Рид просидел в камере смертников почти двенадцать лет, пытаясь заставить людей выслушать его точку зрения. Он утверждал, что заявление, составленное детективами, не соответствовало тому, что он рассказал. Наконец, он связался с частным сыщиком по имени Филип Аптон. Аптон выслушал Рида, после чего направил мне копию заявления и примеры письменной речи Рида. Жернова правосудия мелют медленно во всем мире, и в отношении приговоренных к смертной казни это особенно верно. Джеймс Эрл Рид научился терпению и продолжал утверждать, что невиновен.
После осуждения Джеймс Эрл Рид просидел в камере смертников почти двенадцать лет, пытаясь заставить людей выслушать его точку зрения. Он утверждал, что заявление, составленное детективами, не соответствовало тому, что он рассказал.
Объем заявления, приписываемого Риду, составляет около 1500 слов. В конце главы я приведу его целиком, так как это поможет пониманию фактической стороны дела.
Заявление написано рукой детектива Д. Р. Хейла, работавшего в офисе окружного шерифа Чарльстона, Южная Каролина, и датировано 19 мая 1994 года. В заявлении описано, как мистер Рид покинул федеральную тюрьму в Манчестере, Кентукки, в апреле 1994 года, как он прибыл в город Гринвилл, приобрел оружие и боеприпасы и как затем добрался до Чарльстона, Южная Каролина, прибыв туда 17 мая – за день до стрельбы в Адамс Ран. В заявлении описано, как Рид связался с миссис Лафайетт вечером 17 мая, как он провел ночь под открытым небом рядом с супермаркетом, как пришел к дому Лафайеттов 18 мая, встретился с ними и застрелил их. Затем он покинул место преступления, воспользовавшись их автомобилем, и добрался до близлежащей грунтовой дороги под названием Скотт-Уайт-Роуд, где, согласно заявлению, он бросил машину и избавился от пистолета и гильз. Заявление завершается арестом Рида на следующее утро. В комплекте с заявлением пришел документ, озаглавленный «Отчет о происшествии», также написанный рукой детектива Хейла. В этих записях изложены события вечера 18 мая 1994 года – то, как Хейлу сообщили по рации о стрельбе, произошедшей в Адамс Ран, и то, что ему было приказано явиться в госпиталь местного университета. Также эти записи повествуют о событиях следующего дня, когда детективы Хейл и Коуксум допрашивали обвиняемого Джеймса Эрла Рида. Третья страница записей посвящена неким административным вопросам, связанным с делом, имевшим место несколькими днями ранее. Вот выдержка из записей детектива от 19 мая 1994 года: