Кафедра Ваннаха: Экономика священных камней
Автор: Михаил Ваннах
Ах, какой уютной казалась Европа два десятилетия назад, особенно если смотреть на неё из России образца февраля 1992 года. Изобильные магазины, твёрдая валюта, чистые улицы, высокие зарплаты… Да и у тех, кто не мог или не хотел найти работу, всё было неплохо – высокие социальные выплаты, казалось, надёжно страховали европейцев от бедности…
Прошло два десятилетия. Ну, репертуар в европейских магазинах всё ещё несопоставимо разнообразнее, нежели в отечественных, а цены – ниже. И улицы в Европе несопоставимо чище – нет там таких фокусов, как в типичном российском полумилионнике, где сокращают число дворников с 7000 до 1300 и пенсионерка может выйти на обледенелую улицу только в привезённых из Баварии горных башмаках на триконах.
Но вот на экране бесятся "граждане греки, потомки великих людей" (как некогда писал Паустовский). Стотысячная толпа резвится в Афинах, поджигая дома и грабя магазины. Семь тысяч полицейских не в состоянии справиться с погромщиками – слезоточивый газ малоэффективен, даром что ли во Второй мировой химия не применялась. Но жалеть греков не стоит: даже сокращённая минимальная зарплата в этой стране составляет 560 евро в месяц (а средняя зарплата была где-то 2400 евро). Сравните с нашим Нечерноземьем, где климат куда строже.
Но вот есть очень интересные цифры. Их любезно представляет нам Статистическое бюро Комиссии Европейских Сообществ (Евростат). Относятся эти цифры к такому явлению, как бедность. Которое, казалось бы, осталось где-то глубоко в прошлом, во всяком случае для того Золотого Миллиарда, о котором любят говорить отечественные публицисты. И цифры эти – довольно неожиданны.
Вот что говорится в отчёте, опубликованном 8 февраля этого года. Оказывается, в 2010 году (масштабная статистика неизбежно запаздывает!) 115 миллионов счастливых европейцев, что составляет 23,4 процента населения ЕС, оказались перед риском бедности или вытеснения из социальной жизни. Это на 0,3 процента больше, чем в кризисном 2009 году.
Риск бедности Евростат определяет как соответствие хотя бы одному из критериев: доходы ниже прожиточного минимума; нехватка денег на текущие платежи (скажем, коммунальные); низкая интенсивность труда в данном домохозяйстве. Хуже всего дела обстоят в Болгарии – там с проблемой бедности столкнулось 42 процента населения. Дальше – Румыния (41 процент), Латвия (38 процентов), Литва (33 процента) и Венгрия (30 процентов).
Как видим, живо протестующей Греции среди этих стран нет, а доходы в Венгрии весьма скромны. Средняя зарплата 900 евро, ну а после уплаты налогов от неё остается около пяти сотен… Запомним пока эту цифру и обратимся к распределению бедности. Оказывается, самой подверженной ей категорией (несмотря на все игры в социальные государства) являются дети в возрасте до 18 лет – им бедность грозит в 27 процентах случаев. Ну а самой благополучной – граждане старше 64 лет, тут риску подвержен каждый пятый. Трудоспособные возраста – 23 процента.
Так почему же призрак бедности (нет, бедности достаточно жирной, не сравнить ни с Африкой, ни с депрессивными регионами нашей страны) возник в благополучной Европе, весело заплясал на её "священных камнях"? Для ответа на этот вопрос обратимся к книге, с которой началась политэкономия. Это был "Treatise of taxes and contributions" – "Трактат о налогах и сборах". Вышла эта книга в свет в 1662-м году. И написал её Уильям Петти (1623-1687), личность весьма колоритная.
Сын суконщика из Хэмпшира, в четырнадцать лет он поступает юнгой на флот. Списанный с переломом ноги поступает в Канский колледж во Франции – достаточное с точки зрения отцов-иезуитов знание латыни для этого он получил в местной школе своего родного городка. Ну а в колледже он постигает французский с греческим, математику и астрономию.
В 1640 году Петти возвращается в Англию, живёт в Лондоне, зарабатывает на жизнь черчением морских карт. Обратим внимание: Петти работает в области информационного обеспечения флота, а он, и военный, Королевский, и торговый, был критически важен для тогдашней Англии, отнюдь ещё не правившей морями, но уже осознавшей важность морской торговли.
Какое-то время Петти проводит в рядах Королевского Флота, потом возвращается на Континент, к учёбе. Изучает анатомию в Амстердаме и Париже, работает секретарем Томаса Гоббса, общается с блистательнейшими умами того времени - Гассенди, Декартом, Мерсенном… В 1646-м возвращается в Англию, где патентует копировальную машину (механическую, естественно, пантографическую, но весьма полезную при черчении карт) и учит медицину в Оксфорде. Вступает в Лондонское Философическое Общество и общается с Бойлем и, возможно, Мильтоном. В 1651 году Петти - профессор анатомии в Оксфорде и музыки в Лондоне.
В 1652 году Петти отправляется с подавлявшей Ирландское восстание армией Кромвеля в Ирландию в качестве её главного медика. Там он опять займётся предпринимательством в доцифровой ИТ-области. Петти берёт в 1654 году подряд на картирование и межевание покорённой Ирландии.
Эта работа была завершена в 1656-м и известна в истории как "The Down Survey". Петти заработал на ней гигантскую по тем временам сумму в 9000 фунтов стерлингов и стал собственником 120 кв. км ирландских земель. К этому было приложено и рыцарское звание сэра. Всё получено честным трудом (ну, если не считать того, что ирландцы были ограблены…).
После Реставрации Петти продолжает трудиться на плодотворной ирландской ниве – он становится генеральным контролёром Ирландии и возводится в достоинство пэра Англии. (Оккупация англичанами Ирландии оплачивалась посредством конфискаций земель и экстраординарных налогов у самих ирландцев – понятно, что порядок тут был крайне важен.) Но интереса к науке он не теряет.
Петти – член-учредитель Королевского общества. И из его "Трактата о налогах и сборах" через "Капитал" Маркса пришло к россиянам ставшее общеизвестным суждение: "Труд есть отец и активнейший принцип богатства, а земля - его мать". Ну, в земле Петти толк знал – недаром же так аккуратно и деловито отнимал её у жителей Эйре. Ну и с трудом всё понятно. Бездельником-то Петти никак не назовёшь. (И в утешение ирландцам: он помог под конец жизни организовать Дублинское общество…)
Так вот, возьмём и посмотрим, как у нынешних европейцев обстоят дела с трудом. На ком мы остановились, на Венгрии? Ну, вот что нам любезно сообщает "Компьюлента": 2300 работников будут сокращены с заводов Nokia в этой стране. Рабочие места перетекают в Юго-Восточную Азию. Сколько получали мадьяры на Nokia, найти не удалось, но давайте в первом приближении плясать от средней зарплаты в 900 евро.
А вот соседнее предприятие в Нечерноземье. Оно предлагает радиомонтажницам зарплату в 35 тысяч рублей в месяц. (Это – пошли в российскую оборонку 20 триллионов.) Налоги у нас поменьше, так что "чистыми" останется побольше, чем остающиеся у венгров со средней зарплаты 500 евро. (Но в Нечерноземье и еда, и тряпки, и даже недвижимость подороже будапештских будут…)
Но для Nokia труд европейцев по таким тарифам слишком дорог. Азиаты – дешевле. И на логистике можно сэкономить – комплектующие-то нынче тоже производятся у тёплых морей. И экономят в Nokia не только на венграх, но и на самих жителях Суоми - 1000 финнов потеряет на её заводах работу. Так что это дополнительный вклад в численность европейцев с низкой интенсивностью труда.
И пастор родственной церкви из старинного голландского городка пишет, что японцы закрывают у них завод – 1600 человек прямых сокращений, но есть же и мелкие фирмы, которые поставляли на завод компьютеры, бухгалтерские (по местному законодательству и стандартам) пакеты, монтировали и обслуживали информационные сети, готовили и привозили еду в столовую, мыли полы и тротуары…
Складывается социальная ситуация, которую европейцы в возрасте "за шестьдесят" никогда не видели. И формирует эту ситуацию не политика, а технология. Делающая ненужными многие виды труда. Ну, давно ли вы, уважаемые читатели, пользовались бумажной газетой? Пресса прочно ассоциируется нынче с экраном планшета, ноутбука на кухонном столе или наладонника.
Нет, бумажные газеты, конечно, тоже нужны. Рекламные издания, привезённые в багажнике из ближайшего бизнес-центра, вполне пригодны для того, чтобы во время ремонта накидать их на лестничную клетку, дабы они впитали растекающуюся побелку… (Бригада молодёжная, и не гастарбайтерская – два юриста и два экономиста, столкнувшиеся с реальностью рынка труда…)
Из сферы информационного оборота бумага и многочисленные связанные с нею профессии уходят. Как бы ни было жаль свежего журнала, пахнущего типографской краской, но это – навсегда. (Хм, запатентовать, что-ли, идею читалок и планшетов, в начале чтения нового файла испускающих запах краски, слабеющий по мере чтения…) Слишком долго тащится к читателю бумага. Слишком большие издержки с этим связаны.
Да и реклама удобнее в электронном виде. На редкие товары вам услужливо подсунет её поисковик. В случае популярной продукции с высокой маржей (скажем, квартир) вам придётся пробиваться через информационный шум, но это задача решаемая, а из рекламных газет привлекательные объявления будут, скорее всего, полностью изъяты посредниками, и вы с ними не встретитесь никак. Но это – другой разговор.
А вот нарастание бедности в благополучной Европе – факт. Связанный, прежде всего, с уходом из неё индустриального труда. (Скажем, в социалистической Болгарии доля индустрии в ВВП была почти половинной, а сейчас – чуть больше четверти…) И от процессов этих мы не застрахованы.
Вот, при сравнимых с оборонно-нечернозёмными зарплатах, Nokia завод-то закрыла. Да, у нас, в отличие от Европы, есть ещё и земля. И земля сельхозназначения (российское зерно опять рентабельно на мировом рынке), и, главное, горные богатства, лежащие под ней. Именно на ней, на горной ренте, основан российский экономический рост начала двадцать первого века. И приличные зарплаты монтажницам радиоаппаратуры обусловлены тем, что землю эту надо защищать - надо суметь удержать её в руках.
Но на процессы в Европе надо смотреть внимательно. И потому, что Европа – крупнейший покупатель российских углеводородов. И потому, что судьба европейской индустрии даёт нам очень жестокий урок, который, возможно, есть смысл выучить…
Василий Щепетнёв: Место для рынка
Автор: Василий Щепетнев
Общественные науки в медицинском институте доминировали над остальными. Часов, отведённых на изучение истории партии, политической экономики, диалектического материализма, материализма исторического, научного коммунизма и научного атеизма, в сумме было намного больше, нежели отведённых на дерматовенерологию или на глазные болезни. Да что в сумме, и по отдельности больше.
Сидишь вечером в библиотеке, конспектируешь "Три источника и три составные части марксизма", а сам думаешь, что в работе врача это не пригодится. Вряд ли. Но преподаватели общественных наук говорили: для страны важнее, чтобы человек из института вышел пусть и не хватающим звёзд с медицинского неба доктором, зато убеждённым борцом за дело коммунизма, нежели беспринципным специалистом с гнилой буржуазной сердцевиной.
Однако концы с концами не сходились. О марксистко-ленинском учении можно говорить всякое, но уж чему-чему, а жизни в нерассуждении оно не учит. Возьмите любою работу основоположников. Где тут робость и покорность? Напротив, бунт, и бунт разумный. Со смыслом. Человек, владеющий азами диалектики, уже не проглотит молча любой бред и не будет тянуть руку, голосуя единогласно за "бред кобылы сивой, одна штука".
И в то же время в институте от нас требовали жить именно в нерассуждении, тянуть руку вверх единогласно по команде. То ж и после института. То есть о футболе рассуждать дозволялось, если рассуждения патриотические, а вот о системе оплаты за труд – ни-ни. Размышлять же вслух о возможности выбирать руководителя страны считалось верным признаком шизофрении.
Сидел я в минуту затишья на неудобном диване (к ставке дерматовенеролога больницы в райцентре Тёплое я брал сотню часов дежурствами с дислокацией в избушке "скорой помощи") и думал: в чём, собственно, выражается создаваемая мной прибавочная стоимость? Вот полчаса назад я освидетельствовал водителя, совершившего ДТП. Заполнил акт и отдал капитану милиции. Что ж, этот акт и есть стоимости? А час назад привезли парня с ущемлённой грыжей. Я вызвал хирургов, которые сейчас оперируют больного. Где в моём действии стоимость, простая и прибавочная? А ведь должна быть, иначе за что же я получаю зарплату?
Потихоньку продолжил: ага, я обслуживаю в первую очередь гегемон. Рабочий класс и социалистическое крестьянство. Привожу его в порядок по мере собственных способностей, доступности медикаментов и прочих лечебных факторов и всеобщего развития медицинской науки. А уж он-то, гегемон, и производит настоящую стоимость. Значит, в его труде есть и мой, но только капелька. Из этих капелек и складывается оклад врача-дерматовенеролога, сто двадцать пять рублей в сельской местности и сто десять в городской. Минус налоги. Мало? Тогда либо бери подработку, либо иди к станку.
Решив таким образом насущные вопросы, я шёл далее: поскольку оклад есть штука постоянная, то чем меньше человек работает, тем эффективнее его труд, не так ли? То есть если я работал много и – условно – вылечил за месяц пятьсот человек, то стоимость излечения одной души (в помещичье-крепостном смысле) составляет двадцать пять копеек.
Если же я вылечу только сто человек, то стоимость излечения души составит рубль двадцать пять. А если вылечу всего десять человек? Эге! Это получится двенадцать с полтиной, оплата всей коммуналки. А если, предположим, я вообще никого не вылечу? Делим сто двадцать пять на ноль и получаем… получаем…
Здесь меня спас коллега-хирург, пришедший после операции узнать, нет ли ещё какой работы: мол, не ломай голову, платят нам вовсе не за лечение людей, а за проведённые на рабочем месте часы. То есть государство в лице центральной районной больницы покупает время нашей жизни. А мы его, время, продаём. По расценкам обыкновенным, вот как я, или по расценкам сверхурочным, вот как он сейчас, оперируя с полуночи до трёх. Потому что больше нам, пролетариям от медицины, продавать нечего.
И он ушёл досыпать остаток ночи, фельдшер с водителем поехали в дальнюю деревню на вызов "понос у ребёнка пятый день, терпели, терпели, а толку нет", а я остался в избушке.
Можно было и подремать, но не дремалось. На полочке лежала книжка в мягкой обложке белого цвета. Ленин, "Империализм как высшая стадия капитализма". Говорят, прежний водитель когда-то учился в заочном техникуме – и тоже конспектировал. Закончив учёбу, он перешёл в "Сельхозтехнику" на полуответственную должность, оставив книжку, похожую на парус надежды, в назидание другим: ученье – свет!
И я стал читать про империализм. Рынки сбыта, рынки сырья… Из-за них и войны. Должен же капитализм кому-нибудь продавать присвоенную прибавочную стоимость. А кому? Поскольку трудящиеся денег за неё не получают по определению, кто ж её купит в своей стране? Внешние рынки и выручают. Поскольку же внешних рынков не так и много, идёт борьба за их передел. Порой она, борьба, проявляется в виде империалистической войны.
Я читал, но было немного странно. В начале восьмидесятых любой импортный товар, хоть обувь, хоть крем для бритья, хоть даже носки, доставать нужно было с боем. Или по знакомству. Импортный – это польский, венгерский, болгарский… Изделия из стран империалистических в розничной торговле не встречались, а приобретались с рук по ценам, казавшимся астрономическими: штаны – две месячные зарплаты врача, магнитофон – трёхгодовая зарплата, на компьютер IBM PC нужно было работать всю жизнь (я о цене знал от товарища, у которого знакомый видел человека, который ходил в гости к сыну члена Политбюро, у которого такой компьютер был).
Значит, завоевать рынок желаете? Наш? Хм… С одной стороны, это очень плохо, а с другой… Нужно же чем-то бриться и в чём-то ходить? Борьба за рынки – понимаю. Наша страна и Асуанскую плотину построила, перебив контракт у буржуев, и всякие трактора, сеялки и комбайны назло Западу поставляет африканским братьям в долг, то есть даром: даже и сельскому врачу было совершенно ясно, что никогда Эфиопия и прочие мозамбики расплачиваться за поставки не станут. Не понимаю, почему нет лезвий для бритья, мыла и батареек для фонарика. Советскими лезвиями "Спутник" не пользовались даже в посёлке Тёплое, уж больно кроваво выходило.
Или на фабриках тоже почасовая оплата? Государству и здесь нужно время человека, а лезвия, мыло и батарейки – дело десятое?
Но если… Но если случится немыслимое и капитализм победит во всём мире? Победит, захватит рынки до единого? Дальше, дальше-то что? Если весь-весь мир станет Огромной Империей Зла, где она, Империя, найдёт рынок сбыта?
И тут то ли от переутомления, то ли по иной причине, но меня осенило: рынки не вовне, не в пространстве! Рынки в головах! Те же компьютеры: не было прежде никакого рынка компьютеров, а теперь появился. Или дезодоранты: жили веками без дезодорантов. Мылись, тем и довольствовались, а ныне – шалишь.
Капитализм будет изобретать новые и новые потребности, навязывать их массам, тем и спасётся. В избушке я был один, и потому крамольную мысль о спасении капитализма произнёс вслух. Или мог произнести, что, в сущности, одно и то же. Война будет идти, уже идёт не за внешние рынки, а за умы потребителей. Заставил потребителя купить что-нибудь такое, чего он раньше никогда не покупал, – тем победил. И я тут же записал ночные мысли тезисно. Карандашом на внутренней стороне обложки работы Ленина.
А сырьевые рынки? Нефть, газ, руда, пушнина, лягушки (упорно ходили слухи, что где-то поблизости выращивают лягушек и продают во Францию за валюту)? Ну, во-первых, сырьё возьмёт на себя функцию денег, что и снимет проблему "чем расплачиваться за прибавленную стоимость". А во-вторых (тут меня опять осенило), сырьём могут стать те же умы! Скупать будут умных на корню, таких, которые сразу или же после предварительной обработки смогут придумывать новые процессы, которые воплотятся в новые товары, которые будут завоевывать новые рынки (усталость давала-таки о себе знать, и косноязычие всё больше овладевало мной). Потом, оглянувшись на всякий случай, я спрятал книгу в портфель. Никто её и не хватился, а то б я вернул, я бы непременно вернул!
Отработав до восьми на дежурстве и, без перерыва, до трёх на приёме, я пришёл домой. Понимая, что далеко не Ленин, раз, и далеко не в Швейцарии, два, я переложил книгу с тезисами в коробку "неоконченного", где она и лежала до недавнего времени вместе с повестью о жизни Вересаева, прерванной на восьмой странице, переделкой беляевского романа "Человек-Амфибия" и прочими дерзаниями молодости.
Голубятня: Чудо Compreno
Автор: Сергей Голубицкий
Больше всего на свете мне хочется выделить тему сегодняшнего рассказа из потока рядовых событий IT, которыми заполняется информационное пространство моей колонки. Новые гаджеты - это замечательно. Новый удачный софт -бальзам на истерзанную душу пользователя. Проект Compreno, над которым компания ABBYY корпит уже 15 лет и выводит, дай бог, в этом году на стадию готового к потреблению продукта - это не новое, и тем более - не очередное событие.
Compreno - это полноценная, не имеющая аналогов в истории технологическая революция. Масштаб этой революции, значение ее для людей (именно для всех людей, а не только для любителей компьютеров) сопоставимы разве что с изобретением World Wide Web или электронной почты. Никак не меньше. Для наглядности можно перевести эту революцию в понятные материально-купюрные реалии: если ABBYY спокойно, без суеты коммерциализирует Compreno хотя бы в десятой части возможных ее практических применений, а затем выйдет на фондовый рынок, капитализация компании затмит всех кумиров сегодняшнего дня - от Apple, грамотно и стильно эксплуатирующего весьма и весьма посредственные в технологическом отношении решения, до Google, умудряющегося заводить в тупик охапками большую часть собственных перспективных начинаний.
Впрочем, довольно авансов и эмоций (хотя завсегдатаев Голубятен ни тем, ни другим давно не удивишь ☺ - пора представить Compreno во всем его величии. Начну с лапидарного компендиума: Compreno - это технология перевода любого человеческого языка на универсальный язык понятий. Соответственно, Compreno включает в себя и сам этот универсальный язык понятий, который ABBYY 15 лет (тайком ☺ разрабатывала в своих исследовательских лабораториях.
Результат ошеломляет: Универсальная Семантическая Иерархия (УСИ) - ядро языка понятий - насчитывает сегодня 60 тысяч элементов в универсальном разделе когнитивной модели, 80 тысяч - в русском разделе, и 90 тысяч - в английском! Ничего даже отдаленного в мире не существует.
Перспективы, которые открывает Compreno, безбрежны и разнообразны:
- компьютеризированный перевод текста с любого языка на любой на качественном уровне, несопоставимым со всеми распространенными сегодня системами перевода;
- полноценный интеллектуальный поиск без специализированного синтаксиса запросов (Поиск по смыслу, извлечение фактов и связей между объектами поиска/мониторинга; мониторинг компаний и персоналий и построение аналитических отчетов на основе параметров разного типа и др.);
системы искусственного интеллекта самых разнообразных профилей и применений;
- автоматическое распознавание речи;
- классификация документов и поиск похожих документов по смыслу;
- анализ тональности в мониторинге;
- реферирование и аннотирование (написание краткого содержания длинных документов)
и это только начало.
За пару дней до своей индийской зимовки я встретился с Татьяной Даниэлян, заместителем директора по лингвистическим технологиям компании ABBYY, и Сергеем Андреевым, генеральным директором и президентом группы компаний ABBYY и на протяжении полных двух часов сидел, широко разинув рот и охая от восторга по мере того, как в мое сознание вливались подробности революционного проекта, подкрепленные полноценной демонстрацией действующего прототипа движков машинного перевода и системы интеллектуального поиска.
Все то время, что Сергей и Татьяна, сами едва сдерживая восторг от собственных достижений, стягивали завесу тайны с Compreno, меня не покидало чувство того, что я участвую в каком-то акте добровольного промышленного шпионажа. Согласитесь, масштаб проекта ошеломляет: 15 лет интенсивной работы сотен людей, 50 миллионов долларов собственных инвестиций, совсем недавно усиленных сколковским грантом в 475 миллионов рублей. Вся компьютерная мощь головного офиса ABBYY (а он, поверьте на слово, ошеломляет: 6 этажей 7-этажногоогромного П-образного здания) в любую свободную минуту задействована для просчетов, необходимых для отладки и совершенствования Compreno, в первую очередь УСИ.
Впрочем, шпионаж - это лишь в моей голове, поскольку, разумеется, беседа наша состоялась в момент, когда Abbyy вышла на финишную прямую и была готова раскрыть миру свои карты.
Подробности Compreno я донесу читателям со слов Сергея Андреева и Татьяны Даниэлян - не потому, что не доверяю собственным суждениям, а потому что рассказ у обоих получился гладким и содержательным, зачем же плодить сущности?
Начало разработки Compreno пришлось на 90е годы, когда в арсенале ABBYY (в те годы - еще BIT Software) уже числилось два ледокола: словари Lingvo и программа для распознавания текста FineReader. Продукты продавались по всему миру, были хитами и приносили стабильную прибыль - манна небесная для романтических проектов вроде Compreno, стресс которых не пережил бы ни один сторонний инвестор (вкладывать миллионы долларов в нечто совершенно революционное да к тому же и с неизвестными перспективами? а вдруг ничего не получится? нет уж увольте!).
ABBYY обошлась без чужих денег и это спасло Compreno, позволив довести до победного конца проект со столь колоссальными материальными и людскими затратами.
Успех обеспечил и правильный изначальный выбор направления для разработки системы автоматического перевода. В 90-е в мире правила одна королева - Rule-Based Translation Model, классическая модель перевода, основанная на ограниченном наборе готовых правил для некоторой пары языков. Одна из проблем RBTM - в накоплении все новых и новых правил, которые в какой-то момент просто начинают конфликтовать между собой. Анализируя предложение, мы можем применить разные комплекты правил, при этом машине неведомы приоритеты. Перевод, основанный на RBTM, как правило, не озабочен полным синтаксическим анализом: вместо него предложение делится на фреймы, на которые затем интерполируют существующие в системе правила для получения перевода. RBMT системы не учитывают семантику.
В начале XXI века усилиями Google мир подсел на иглу нового алгоритма перевода - так называемой статистической модели. Основа СМ - наличие обширной базы разнонаправленных переводов. Мы задаем статистическому движку предложение для перевода, он ищет в базе данных как в словаре варианты уже существующих переводов аналогичного текста и после незначительных изменений выдает вполне приличный результат.
Изменения не самые существенные. Предположим нам нужно перевести предложение «в комнате стоит красный стул», а в статистической базе уже есть переведенная фраза «в комнате стоит зеленый стол» - решение элементарно: берется уже существующий шаблон перевода и новые слова просто заменяются по словарю.
Поскольку в СМ используются уже готовые человеческие переводы заведомо высокого качества, то на выходе получается весьма недурственный результат, ибо для осуществления перевода не нужно погружаться в синтаксис, специфику фразеологии конкретного языка и проч.
Все замечательно, однако, лишь до тех пор, пока дело не касается переводов в направлениях с так называемым низким покрытием (скажем, каким-нибудь, румынско-русским или тайско-венгерским).
Где брать аналоги? По словам Сергея Андреева опасность подстерегает также при уходе в предметные области на массовых направлениях, потому что параллельных текстов становится сильно меньше, чем в бытовой и разговорной тематике. Сочетание ухода в предметную область и не самого массового направления перевода приводит к слабым результатам. Скажем, IT. Казалось бы, какие сложности могут возникнуть у машинного перевода с текстом на тему информационных технологий? В самом деле - никаких, если мы занимаемся русско-английским переводом. Зато они тут же возникнут на русско-французской ниве! Статистическая база в этом направлении чрезвычайно скудная и лакуны возникают на каждом шагу.
Выход в рамках СМ для подобных ситуаций найден лишь паллиативный: работая с языками / темами низкого покрытия в качестве посредника используется английский язык. То есть сперва делается перевод с русского на английский, а затем уже с английского на, скажем, румынский, или тайский. В результате получается очень заметное снижение качества перевода.
Самое печальное, что проблема с плотностью покрытия в рамках СМ никак не решается принципиально. Единственный выход: нанять сотни тысяч переводчиков и заставить их заполнять лакуны по всем направлениям с низким статистическим покрытием. Как вы понимаете, никто это делать не сможет и не будет.
Помимо сложностей с низкой плотностью переводов по направлениям, выпадающим из узкого мейнстрима, у СМ еще множество мелких изъянов. Например, статистическая модель совершенно убого справляется с переводами имен собственных. Многие помнят о переводе Ющенко, как Януковича, а России как Канады. Отрицание (частичка «не») - это очень сложное препятствие. Частичку «не» можно правильно позиционировать в результате лингвистического анализа текста, а СМ таковым не занимается. В результате предложения, содержащие отрицание, часто переводятся движками на статистической модели с точностью до наоборот.
Как бы там ни было, ABBYY изначально отказалась от Rule Based Translation Model и замахнулась на систему компьютерного перевода нового поколения. Надо сказать, что придумывать особо ничего не требовалось. Универсальный язык понятий существует в структурной лингвистике в виде давней и несбыточной мечты еще со времен Людвига Витгенштейна. Даже Наум Хомский в своих ранних трудах лишь углублял существующую утопию.
Проект Compreno исходил из трех основополагающих посылок:
- использование качественного и бескомпромиссного синтаксического анализа.
- создание универсальной когнитивной модели языка, возможность которой определяется аксиомой о том, что люди, хоть и живут в разных условиях и говорят на разных языках, однако в массе своей мыслят одинаково. Формы выражения мысли разные, а вот понятийный аппарат совпадает.
- автоматизированное корпусное дообучение - лингвистические описания верифицируются и дополняются на основании статистической обработки корпусных данных.
Исходя из этих посылок была сформулирована идея Универсальной Семантической Иерархии (УСИ), способной описывать явления от общего к частному. На составление этой иерархии у ABBYY и ушло 15 лет. Получилось то, что вы уже знаете: только на сегодняшний день 70 тысяч понятий в универсальной части когнитивной модели, более 80 тысяч - в русской, более 90 - в английской.
Алгоритм машинного перевода, основанного на УСИ, выглядит следующим образом:
- Лексический анализ текста (выделение слов, знаков препинания, цифр и прочих текстовых единиц);
- Морфологический анализ (определение грамматических характеристик лексем);
- Синтаксический анализ (установление структуры предложения);
- Семантический анализ (выявление выражаемого значения в системе языка);
- Синтез из универсальной семантической структуры предложения на выходном языке.
В результате подбор слов для перевода осуществляется не напрямую из первого языка, а из понятийного набора, который, условно говоря, «висит» на той же ветке универсального семантического дерева, но только уже со стороны второго языка.
Поскольку модель УСИ сквозная, нижестоящие элементы системы по иерархии наследуют признаки вышестоящих элементов. Это простое, казалось бы, обстоятельство позволяет добиваться беспрецедентной точности машинного перевода, поскольку каждое слово из переводимого предложения описывается максимальным набором понятийных эквивалентов, причем не только видового, но и родовых качеств на всех уровнях смысловой иерархии.
В УСИ предусмотрены взаимосвязи между элементами структуры, относящимися к разным классам, и эти связи также структурированы и формализированы, что позволяет выполнять многоуровневый понятийный анализ текста, также повышающий качество перевода.
В процессе создания УСИ разработчикам открылись неожиданные грани использования системы: помимо машинного перевода язык УСИ можно использовать в интеллектуальных смысловых поисках и, возможно, автоматическом распознавании речи на новом качественном уровне, который достигается за счет глубокой интеграции и взаимопроникновения синтаксиса и семантики в модели универсальной семантической иерархии.
На альтернативных направлениях возникают, конечно, и свои сложности. Скажем, сегодня самым узким местом для глобального применения семантико-синтаксического анализа в массовых поисковых системах выступают очень высокие требования к компьютерным мощностям, необходимым для индексации информационных массивов на понятийном уровне. Требования эти несоизмеримо выше, чем при существующих формах традиционной индексации. Впрочем, уже сегодня методика семантико-синтаксического анализа может эффективно применяться (и применяется ABBYY - видел полностью функциональный прототип поискового движка собственными глазами) для более целенаправленного и узкого поиска в закрытых корпоративных системах.