Так что наука история, видимо, будет нуждаться в «свертке». Автор просит прощения за вольное употребление термина функционального анализа, но ему не приходит в голову лучшего термина для более простой, укладывающейся в голове конкретного человека картины масштабного исторического явления, которая бы была сходна с явлением в целом. Именно такая свертка и поможет реализовать потенциал информационных технологий в приложении к описанию исторического процесса.
Интерактив
Андрей Терехов (РУССОФТ) о русском аутсорсинге
Андрей Терехов, профессор, завкафедрой системного программирования СПбГУ, идеолог и член правления НП «РУССОФТ», а также основатель крупной аутсорсинговой компании «Ланит-Терком», без прикрас рассуждает о российском аутсорсинге и преимуществах наших специалистов.
- Что такое сейчас «аутсорсинг по-русски»?
- Во-первых, сейчас аутсорсинг сильно изменился по сравнению с тем, каким он был двадцать и даже десять лет назад. Сейчас совершенно другой аутсорсинг. Это раньше можно было сказать: «У меня есть двадцать программистов на C и десять на Java». Сейчас предложите это — никто не возьмет. Надо иметь экспертизу в какой-либо узкой области: банковской, финансовой, операционных систем реального времени, реинжиниринга, веб-систем — Web 2.0, каких-то информационных систем, поиска.
Вот в соответствии с этим веянием мы только что провели довольно крутую реорганизацию нашего предприятия. У нас было четыре департамента, вместо этого стало десять центров компетенции и один общий департамент развития. То есть мы пытаемся сделать «заточенную» группу людей во главе с хорошо поставленным лидером, чтобы они занимались одной и только одной задачей — и больше ничем. Мы надеемся, что это нам поможет выжить в трудные времена. Это наша реакция на изменения рынка.
Сейчас аутсорсинг сильно изменился: требуются не люди, не просто «головы», а solution. Предприятия думают в своих терминах, и мы должны подстраиваться под них. Мы должны предлагать решения в их сфере бизнес-интересов. Вот это сейчас главная новость. И те, кто это хорошо осознает, меняют свои предприятия, как-то реорганизуются и выживают. Те, кто по-прежнему бегает и предлагает сорок программистов — те сдыхают.
- Каковы зарубежные мифы о русском аутсорсинге, и есть ли такие?
- Полно. Что Россия не умеет считать деньги, что русские не могут управлять, что у русских плохая посещаемость и производственная дисциплина, планы не соблюдаются... И вы знаете, к сожалению, очень много случаев, когда эти мифы сами же русские и поддерживают. Очень много компаний типа «мы всё могем, дайте деньги — завтра всё будет». Руками машут... в общем, к сожалению, один такой козёл может целую отрасль сбить с заказов. Ведь люди злые. В американских газетах (я в Америке раз двадцать был) вся Россия — только мафия, сплошные перестрелки. Ведь они не напишут, что у нас такой-то математик решил такую-то проблему. Такого я никогда не видел — что вот, грубо говоря, математики Ленинградского университета сделали предприятие, живут, получают приличные деньги, у них совершенно нормальная система обучения...
- О Перельмане все-таки написали.
- И то потому, что он отказался от миллиона долларов. Вот про «сумасшедшего» можно написать, а про нормальных людей никто никогда не пишет.
- И все-таки, каковы наши преимущества как аутсорсеров, по вашему мнению?
- Ровно тот же ответ, который я давал десять и пятнадцать лет назад: более высокий уровень образования.
- Даже сейчас? Или все, грубо говоря, держится за счет ваших «вливаний»?
- К сожалению, русское образование очень неоднородно. Но и в Америке Miami University — вовсе не Беркли. Я и там и там бывал, могу сравнить. Просто в Америке тридцать-сорок действительно очень хороших университетов, а у нас, может быть, пять-десять... ну может быть, десять-пятнадцать действительно хороших университетов. Тем не менее в лучших образцах — Москва, Санкт-Петербург, Новосибирск — у нас образование действительно хорошее. Хотя исследования сейчас все хуже и хуже, финансирование науки все хуже и хуже — производная-то отрицательная, то есть все падает. Но оно всё ещё очень хорошее.
- А что же Новосибирск? На уровень НГУ жалуются последние несколько лет. Возможно, по сравнению с былым уровнем университета...
- В Новосибирске очень мощный университет, и там есть Академгородок. Скажем так — в ИСИ им. академика Ершова я бывал пять-шесть раз в год, сейчас я там бываю два раза в год. Там действительно стало хуже. Но и везде стало хуже, а там по-прежнему мощный математический центр.
Итак, наши преимущества — в сильной математической школе, в довольно высоком уровне образования и в нашем умении решать такие задачи, которые другие не решают.
- А коммуникативные способности стали лучше?
- Абсолютно. Молодые говорят по-английски намного лучше. И никто не стесняется.
- А социокультурный фактор? Многие жалуются, что русский специалист — плохой специалист, потому что он не может работать в команде. Или это очередной миф?
- Да ну! Вот это даже не миф, это просто фигня. Наоборот, это американцы придумали понятие job security, у нас даже такого никто не знает. В Америке один сотрудник другому, своему соседу, ничего не скажет и пальцем о палец не ударит, чтобы ему помочь. Вот это — job security. Дескать, я тебя сейчас научу, а ты займёшь мое место. Я обалдел в первый раз — невозможно ни с кем поговорить, никто тебе не поможет. Только если бывшего русского найдешь — он поможет.
Аналитик Михаил Елашкин о конфликте Oracle и Google
"Компания Oracle начала патентную войну с Google. Поисковый гигант обвиняется в незаконном использовании технологий, права на которые Oracle приобрела вместе с Sun. Своей точкой зрения на этот конфликт поделился один из ведущих российских аналитиков, директор компании Elashkin Research Михаил Елашкин.
- Каков ваш взгляд на ситуацию с этим патентным иском?
- В современном мире патенты давно переросли те функции, которыми они были наделены при создании, и стали, скорее, оружием в борьбе компаний. Именно с этой точки зрения и следует рассматривать этот конфликт.
- Каковы его причины?
- На первом плане, очевидно, желание Oracle удержать контроль над стандартами технологии, ради которой в значительной степени и был куплен Sun — Java. До Google перехватить контроль над Java пытались Microsoft и — в более джентльменской форме — IBM. Sun последние годы был не в той форме, чтобы ссориться с могучим Google, а вот Oracle это вполне по плечу. И тут возникает второй уровень — личность Лари Элиссона и его отношение к тому, кто должен быть на вершине.
Всем известна его «нелюбовь» к Биллу Гейтсу. Наивно думать, что эта нелюбовь строится на личных отношениях — только власть и деньги. Сейчас Гейтс вышел из игры, и Microsoft перестает быть главным раздражителем на рынке. А вот Google, безусловно, стремится стать единственным богом. Вот Брину и компании и поставили флажки. Показали, что на рынке есть зубастые кроме них.
- Каков ваш прогноз развития ситуации?
Чем кончится эта история? И для Oracle, и для Google Java и Android — не основные продукты, обеспечивающие прибыль. В соответствии с правилами корпоративно-патентных войн, Google выкатит Oracle встречный иск о нарушении патентов, и через лет пять работы сотен очень дорогих юристов компании мягко договорятся о сумме компенсации.
- Oracle по-хозяйски обходит владения Sun и просто метит территорию?
- В общем, да. Она купила некоторые активы Sun, которыми те не могли распорядиться наилучшим образом — не хватало денег, харизмы, влияния... а Oracle добавляет их себе в обойму и стреляет очередями.
- А чем, собственно, Google угрожает Oracle? Разве Android и Dalvik так опасны?
- Это ключевой вопрос для Oracle: модель корпорации всегда была — данные первичны, и Oracle обеспечивает управление ими через свои СУБД.
- Но причем здесь Google?
- Google выходит на эту же территорию с другой стороны — через свои сервисы. Хочет, чтобы все данные были у них, на их серверах. Зачем тогда Oracle?
- Получается, Dalvik здесь ни при чём, и вопрос более глобальный?
- Конечно.
- Патенты — лишь повод?
- На первом уровне нужно отстоять стандарты — иначе зачем было покупать Sun? На втором — стандарты — это оружие, чтобы придержать Google.
- Есть ещё один крупный игрок, которому мешает Google. Какова вероятность картельного сговора между Oracle и Microsoft?
- Когда компании владеют значительной долей рынка или являются монополистами, то государство особенно тщательно контролирует, чтобы они не заключили картельное соглашение. Именно поэтому сговор между MS и Oracle, а шила в мешке не утаишь, смертельно опасен самим этим компаниям. Максимум, что могло быть — осторожное прощупывание типа «как бы вы отнеслись к гипотетической ситуации если бы...»
ReaDitorial
Техномир – новая мутация цивилизации
Наш мир — техномир. Сам ли он стал таким или его кто-то создал — уже даже неважно, но те, кто понял, как это использовать, правят планетой. В техномире власть и контроль над странами и народами осуществляет тот, кто создает технологию.
Хотите контролировать какую-то массу людей? Дайте им компьютеры, интернет, и тому подобное, и они уже не будут ползать по лесам и злоумышлять против вас, а будут тихо мирно сидеть в своих домишках и чатиться в сети или играть в игры. Удобно? Более чем.
Когда наша цивилизация встала на этот путь? Когда боги техномира поняли, как сделать нас рабами?
Сначала люди создавали то, что им было необходимо. Придумывали разные вещи, чтобы облегчить труд, повысить урожай. С ростом цивилизации и разделением труда появилась необходимость в развитой промышленности. Возникла потребность в быстром производстве еды, одежды, оружия, предметов быта. Все правильно, это естественный процесс. Но вот мы приходим к тому, что промышленность стала работать настолько эффективно, что стал появляться излишек. Система была организована так, что могла только расти, она не могла остановиться. Это грозило бы глобальным экономическим кризисом. Но любая самоорганизующаяся система обладает неким псевдоразумом, и, как и все в этом мире, желанием жить. Система начала выживать, всеми силами впихивая переизбыток товаров, людям. Тогда была изобретена реклама, а людей научили думать, что им нужны ненужные товары и услуги.
Да, поначалу появляется что-то новое, в силу того, что в нем возникла необходимость. Интернет, компьютер, мобильники. Но в цивилизации потребления все устроено так, что это гипертрофированно увеличивается, превращаясь во всепоглощающее нечто. Оно начинает паразитировать.
Но мы уже не цивилизация потребления. Ею был Запад в начале двадцатого века, а Россия и страны с коммунистическим отклонением, переболели этим в конце, когда вдруг стало можно, и блистающий капитализм вломился в двери.
Все это было. Сейчас же мы новая мутация. Мы техномир. Это когда бесконечное потребление переизбытков разрушает тело, а технология забирает разум. Это новый виток потребления — качественный виток. Теперь нас не просто научили думать, что нам нужны новые штаны или жвачка, теперь для нас придумывают устройства, и учат нас, что теперь это нам крайне необходимо. Нас медленно садят на наркотик технологий, превращая в бесконечно потребляющих этот наркотик рабов, которые без него просто уже не могут жить.
Компьютеры, для которых мы чуть ли не каждый год должны что-то покупать. Новый процессор, больше памяти, более мощная видеокарта. Сотовые телефоны, с более большим экраном, с лучшей камерой. И тачскрин! Как мы раньше жили без тачскрина?! Без этого же невозможно пользоваться телефоном... Ну по крайней мере, новыми функциями, каким обзавелись современные телефоны, точно не получится.
Втюхивать шмотки или газировку уже не так эффективно. Человек купил шмотку и насытился, а устройства хочется покупать снова и снова, ведь они все более лучшие и все более функциональнее. Техномир открывает новые горизонты. Как классно придумать такую вещь, раз вкусив которую, человек не сможет от нее отказаться, потому что из этих вещей теперь состоит весь его мир. И еще сделать так, что эту вещь надо постоянно обновлять и дополнять, иначе ею нельзя будет пользоваться. А если эта вещь будет еще и владеть его сознанием, отвлекая от явно лишних для гражданина вещей, то и вовсе замечательно.
Хорошему гражданину не надо думать. От него требуется только ходить на работу, заработанные деньги тратить на вещи и устройства, для поддержания гипертрофированной экономики, а досуг проводить в бесконечных развлечениях. Потому что бесконечные развлечения отвлекают от бытья и проблем государства. Да, гражданин должен быть счастлив, он не должен знать, что он раб.
Средства для достижения этого дает техномир.
Как узнать, о чем говорят люди? Как подслушать? Поставить каждому жучок в дом? Они же взбунтуются. Куда элегантнее, придумать устройство и сказать: теперь вы можете общаться друг с другом где угодно. Они сами расхватают у вас это устройство, да еще и денег дадут.
А как заставить быть послушными? Как забрать их разум? Дать красивый яркий мир, в который они будут погружаться, бесконечно в нем резвясь и общаясь. Дать им социальные сети, и подобные интернет-штучки.
Социальная сеть — ультрасовременное и удобное средство учета, регистрации и слежения за населением. А также неплохой инструмент, позволяющий держать широкие массы людей в состоянии радостного растения, которому ничего не надо, кроме как выложить новые фотки, да откомментить сотню другую френдов.
Прекрасный инструмент. Забавно, что в России им пользуется не правительство нашей страны, а Британское королевство.
Для нас придумали устройства, много устройств, и мы теперь живем только для того, чтобы покупать их. Весь наш мир стоит из устройств. Это жизнь техномира, но насколько она правильная? Слепая система вновь разрастается. Какой будет следующая мутация?
Идентификация, абстрагирование, смысл
Интернет — это большая свалка информации. Впрочем, не без попыток отсортировать и упорядочить. Но даже самые успешные сортироворочные машины на простейшие запросы вываливают на вас миллион ссылок (что, по видимому, должно считаться символом успешности сортировки, как если бы вы попали в библиотеку, а вам сказали: «да, у нас есть миллион книжек на эту тему, поищите там...»). Что ж, приходится полагаться на собственные умения и досортировывать то, что уже предложено. Вполне естественно, что обычно мы ограничиваемся сортировкой десятка, максимум, сотни ссылок, если ничего не находим — поиск можно считать провалившимся. Конечно, сортировочные машины проделывают огромную работу: по расчетам, на данный момент, в Интернете существует около 1 триллиона (10 в 16 степени) уникальных страниц, запросы на общие слова обычно дают около сотни миллионов страниц (10 в 8 степени), на менее общие мы уже получаем десятки миллионов, и так далее. Но ведь, в реальной жизни, поиск должен давать от десятка-сотни до одной ссылки. Например, на запрос «чемпион мира по футболу 2010 года» существует ровно один ответ, на запрос «кошки», наверное, все же ожидается ответ с сайтами и страницами, посвященным только им, а не все ссылки, где они так или иначе упоминаются. Поэтому неудивительно, что современные поисковики пытаются угадать то, что вам нужно, предложить лучшую фильтрацию, полагаются на человеческую досортировку, логично полагая, что уж люди лучше разберутся в информационном хламе.
А ведь вначале о подобных проблемах никто и не думал. Первые компьютеры были весьма неудобны в использовании (относительно современных, конечно), поэтому информация накапливалась очень медленно. Но, к счастью или сожалению, прогресс не стоял на месте. Появился текстовый интерфейс, операционные системы, высокоуровневые языки программирования, форматы данных, графический интерфейс, Интернет, наконец. Каждое из последующих нововведений (не считая прогресса аппаратного обеспечения) облегчало ввод и обработку информации, что вело к росту ее объемов и затрудняло поиск. С появлением Интернета ситуация еще больше усугубилась: покуда компьютеры не были связаны в единую сеть не каждый находил удовольствие в выплескивании своих мыслей и эмоций на жесткий диск, но появление тысяч и даже миллионов благодарных (а пусть даже и неблагодарных) читателей, стало спусковым крючком для экспоненциального роста информации.
Можно ли решить проблему больших объемов информации? Кое-кто полагает, что решение в коллаборации и разного рода социальных сетях, а также Семантическом Вебе (который, хотя и акцентируется на интеллектуальных агентах и приложениях, но тоже подразумевает своего рода социальную сеть). Однако существует, по крайней мере, две проблемы. (1) Информация, когда создается и публикуется, уже должна быть упорядочена. Возникает вопрос, есть ли гарантия, что сторонние люди упорядочат ее лучше, чем ее создатели? (2) Порой коллаборация вместо упорядочивания информации создает еще больший объем информации, которую в свою очередь, тоже надо упорядочивать. (3) Часто упорядочивание требует эксперта, что порой просто невозможно. Другие перспективные направления включают (но не ограничены только этими): виртуальная реальность, дополненная реальность, 3-мерный интерфейс, распознавание образов и языка. Некоторые из них еще недостаточно развиты, другие же весьма эффектны эстетически, но не так полезны практически. Раз так, то давайте попробуем взглянуть на проблему с другой стороны: а можно ли вообще понять, что хотя бы теоретически могло бы решить эту проблему? Для начала можно посмотреть на революции прошлого и попробовать понять, почему то или иное изобретение оказалось прорывом.
* Текстовый (консольный) интерфейс. Возник, т.к. человеку было необходимо общаться с компьютером на понятном языке. Для подобного общения были неоходимы два условия: возможность идентифицировать ту или иную компьютерную сущность (например, диск или операцию копирования) и возможность абстрагирования (т.е. выражения множества действий или объектов при помощи одного идентификатора). Как побочный эффект: возможность переиспользования уже имеющихся идентификаторов. Долгое время проводились попытки использовать естественный язык для этих же целей, но они провалились не только из-за того, что анализ полного набора грамматических конструкций затруднен (хотя анализ упрощенного подмножества вполне реален), но также из-за того, что для оперирования компьютерными сущностями лучше подходит специальный язык. Ведь, любая область человеческой деятельности рано или поздно приходит либо к своему жаргону (арго), либо к специфическому абстрактному языку (как в математике), которые лучше абстрагируют объекты и действия этой области.
* Высокоуровневые языки программирования, программные интерфейсы, форматы данных. По сути, ситуация такая же как и с текстовым интерфейсом, но с большими возможностями (которые заключается в наборе дополнительных абстракций, помогающих компоновать гораздо более сложные решения). Форматы данных, по сути, являются абстрактным языком (что неявно в двоичном виде, но явно в текстовом) для упорядочивания и ограничения информации.
* Операционная система. Среда, помогающая программному обеспечению и пользователю использовать аппаратное обеспечение. По сути же, предоставляет слой абстракции, который скрывает низкоуровневые сущности аппаратного обеспечения, а также позволяет программному обеспечению выстраивать свой слой абстракции, предоставляя набор сущностей, понятных пользователю.
* Файловая система. Предоставляет атомарный элемент хранения информации (файл) и иерархию каталогов, для упорядочивания файлов. Содержимое файла, теоретически, должно абстрагироваться в его имя и атрибуты (хотя их набор ограничен). Списки файлов, опять же теоретически, должны абстрагироваться (отображаться) в имя каталога. На практике же, принципы абстрагирования часто нарушаются, так имена файлов превращаются в бессмысленный набор символов, а каталог выбирается произвольным образом. Более того, информация о каталоге (которая теоретически должна классифицировать файл) теряется при копировании файла. Содержимое файлов часто спрятано обслуживающим приложением, поэтому информация внутри файла не может переиспользоваться (если это не предусмотрено в соответствующем приложении).
* Приложения. Являются слоем абстракции между операционной системой и пользователем. Предоставляют детерминированный набор действий на предопределенные реакции пользователя. Кодируют первоначальный смысл (то, как систему видят пользователи) в виде абстракций (сначала архитекторами, а потом и разработчиками), чтобы в итоге декодировать абстракции в смысл, понятный пользователем (естественно, во многих случаях, уже хоть немного, но искаженный, т.к. смысл проходит через несколько преобразований).
* Графический интерфейс. Его преимущества связаны не только с тем, что человек лучше воспринимают информацию визуально (человек быстрее обрабатывает пространственные абстракции, чем логические или языковые, к тому же само абстрагирование возможно является порождением именно визуального восприятия информации). Не менее важно и то, что он явно предоставляет и ограничивает информацию (т.е. вы видите все команды сразу, а не вспоминаете их, а их возможные значения ограничены в списке и т.п.) и связывает ее (одному элементу соответствуют другие элементы информации или действия, например, связь между объектом и действиями, предоставляемыми в меню). Однако, при большом количестве элементов мы опять возвращаемся к необходимости использования поддержки естественного языка (в виде руководств и т.п.). К тому же, что часть элементов приходится скрывать, упорядочивая их в иерархии (меню, деревья, вложенные окна и т.п.), при этом мы ограничиваем контекст, что хорошо для понимания отдельной области, но при этом же, многие уровни вложенности так хорошо скрывают возможности приложения, что ими редко, кто пользуется, а иногда и с трудом находит. Наконец, еще одна проблема заключается в том, что элементы графического интерфейса и данные связаны неявно (для пользователя), что не позволяет переиспользовать подобный интерфейс (т.е. ссылаться на элементы GUI). При всех преимуществах, графический интерфейс всегда поддерживается натуральным языком: в корне проблемы лежит тот факт, что визуальные элементы программы не всегда интуитивно понятны, в то время как естественному языку люди обучаются в течении десятилетий. Собственно говоря, иконки ничем не отличаются от букв (которые тоже являются иконками), но при необходимости компоновки сложных действий - это проще будет сделать при помощи естественного языка (в виде инструкции), либо при помощи абстрактного языка скриптов, а не переиспользуя графический интерфейс. В целом, хотя графический интерфейс и очень эффективен, но он не может представить любую информацию (например, звук), поэтому универсальным может быть только символьный интерфейс.
* Интернет. Его достоинства заключаются в неразрывном сплетении двух факторов: объединение компьютеров в глобальную сеть и объединение информации внутри гипертекста (который представляет собой контейнер, объединяющий текст и другие медии). Оба эти фактора по раздельности не могли совершить революцию: представьте себе Интернет, в котором нет гипертекста, а есть один ftp протокол, или же, наоборот, существует прогрессивный формат, позволяющий переходить из текста в текст, но в рамках вашего жесткого диска. Естественно, что одно вытекало из другого и появление глобальной сети послужило спусковым крючком для появления всего набора Интернет технологий.
* Гипертекст, Веб, Веб 2.0, доменная система. В свою очередь, представляет собой симбиоз трех факторов: связывания ресурсов (различных репрезентаций информации), форматирования данных и разного рода динамика: клиентская (ДжаваСкрипт, плагины) и серверная (формы, элементы графического интерфейса) ресурсов. Впоследствии, серьезное внимание было уделено форматированию и динамическим возможностя, поэтому были упущены недостатки связывания. А именно, гипертекстовое связывание позволяет реализовать ссылку только один-к-одному, и наибольший смысл имеет только тогда, когда мы ссылаемся на уникальный ресурс (или оригинал) или же ссылаемся на часть общего целого (как, например, один сайт). Если же мы ссылаемся на произвольный ресурс произвольного сайта (например, новость на определенном новостном ресурсе, хотя она продублирована на множестве других), то такая ссылка становится ограниченной и субъективной. Веб 2.0 представляет собой развитие динамической составляющей ресурсов, добавляя больше возможностей графического интерфейса со стороны клиента. Доменная система является аналогом «файловой системы» Интернета, где домен и его компоненты должны (теоретически) идентифицировать провайдера информации. Практически же, домены в виде идентификаторов часто неправильно (намеренно или нет) используются (как и имена файлов), что поощряет коррупцию вокруг доменных имен.
* Персональные страницы, электронная почта, чаты, мгновенный обмен сообщениями, блоги, микроблоги, социальные сети, комментирование, коллаборейшн сайты. Интернет стал спусковым крючком для роста накопленной информации. В пре-Интернет эпоху никому и не приходило в голову создавать документ с описанием себя любимого (кроме резюме) и распространять его каким-либо способом (здесь мы тоже видим сплетение двух неразрывных факторов: публикование персональной информации и ее распространение). Вначале, модным словом стало «персональная страница», с появлением блогов необходимость в персональных страницах постепенно отпадает, так как блоги предоставляют почти те же возможности, при меньших затратах на дизайн и поддержку, к тому же сочетая в себе возможности обмена сообщениями, но с возможностью сохранения и всемирной доступности (микроблоги являются еще более упрощенным развитием той же линии). В дополнении к этому многие сайты сейчас предоставляют системы комментирования своих ресурсов, что для некоторых постоянных посетителей является эдакой разновидностью микроблога (часто комментарии постоянных посетителей могут уклоняться от темы ресурса и становиться микроблогом). Тоже самое касается и социальных сетей. Коллаборейшн сайты, в отличие от социальных систем обмена субъективной информацией, предназначены для обмена объективной информации, в идеале, роль личности должна быть сведена к нулю. При всех недостатках, Википедия стала де-факто стандартом для справки о том или ином предмете.
* Порталы, поисковые системы. Первоначально именно порталы представлялись решением, которое позволит упорядочить информацию в Интернете. Но они обладали и определенными недостатками: (а) любая иерархия знаний частично субъективна, поэтому не всегда очевидно какой путь иерархии выбрать, чтобы найти нужный предмет, (б) любая иерархия вместе с упорядочиванием, посредством разбиения на ветви, также и скрывает информацию в этих ветвях, (в) использовалось ручное обновление каталога, хотя при этом многие порталы предоставляли эту возможность любому, что роднило их с коллаборейшн сайтами. На порталах был даже поиск по содержимому портала, но появление поисковых систем нанесло серьезный удар по их позициям, так как их поисковая строка была точкой входа (кстати, подобно консоли операционной системы) для любой информации в Интернете, причем постоянно обновляемой. Разумеется, как и любое творение человека, поисковые системы имеют и свои недостатки. Главный из которых, является, одновременно их достоинством: это представление всего массива данных Интернета в виде большой «плоской» базы данных. Точно также можно представлять весь наш мир, все континенты, города, людей, животных в виде «плоской» базы данных атомов. Конечно же, такое представление частично абсурдно (т.к. имеет значение в какие структуры эти атомы собираются). И создатели поисковых систем прекрасно это понимают, предоставляя дополнительные средства, как то: релевантность/ранжирование слов/запросов, коллаборейшн средства для повышения релевантности поиска, и т.п. Поисковая система достигает максимума продуктивности только в случае, когда слово или словосочетание полностью соответствует смыслу, скрывающемуся за ним.
* XML, Семантический Веб. Идея связывания всего и представления в одном универсальном формате лежала еще в основе HTML, а если копнуть еще глубже, то и в SGML (если уж копать дальше и дальше — идея-то прорабатывалась еще философами за много столетий до того как). XML подошел к проблеме ближе, так как, по крайней мере, был достигнут консенсус по поводу универсального формата. Однако, не хватало смысла. Семантический Веб добавил немного смысла, и стал потенциальным кандидатом на новую революцию, но он обладает и определенными недостатками. Главное — это то, что он ориентирован на обработку «интеллектуальными агентами», а не простыми пользователями. И обработку, в основном, данных, причем, данных упорядоченных. К тому же, формат тройки «субъект-предикат-объект» заставляет сомневаться в целесообразности абстрагирования всего при его помощи. Никто не подвергает сомнению факт, что всё можно втиснуть в подобный формат, но будет ли являтся это целесообразным? Этот принцип аналогичен конструкциям естественного языка, где подобные тройки выступают как символ дуальности пространства-времени и выражение факта, что любое действие происходит между двумя предметами. Но, в естественном языке формат тройки не является обязательным, к тому же часто расширяется обстоятельствами. Разумеется, что и дополнения, и обстоятельства можно представить тройками тоже, но это может быть целесообразным только, когда субъект, предикат и объект — это роли, а не смысл. Например, в таком случае в роли предиката может выступать как глагол-действие, так и глагол-отношение, а в роли объекта как существительное (объект), так и прилагательное (которое редко бывает объектом, а обычно выступает атрибутом объекта). Любимый пример в Семантическом Вебе: «небо голубое», где субъектом выступает «небо», предикатом «иметь цвет», а объектом «голубое». Как мы видим, здесь не совершается никакого действия по смыслу, а выражается только отношение (или же атрибутивность). Данный пример показывает, что изначальный смысл дуальности пространства и времени (например, в «я иду»), представляется в абстрактной форме, где вся предикат и объект являются ролями. И, конечно, очевидный недостаток в обязательности тернарного представления, хотя большинство данных организовано в Н-арном виде, в общем случае (особенно это очевидно в мире компьютеров, где данные могут быть связаны множеством произвольных ссылок, но это истинно и для естественного языка). Онтологии Семантического Веба вводят новый уровень сложности, но не являются ли они логическим продолжением XML схем, на которые мечтали перевести целые индустрии несколько лет тому назад (и на которые все так и не перешли)? В целом, мы видим картину, что с Семантическим Вебом могут работать (по крайней мере, на данный момент), в основном, эксперты, что очень сужает возможности коллаборации на его основе.
Итак, работа с компьютером представляет собой работу с абстракциями, которые выражаются в абстрактных, графических и естественных языках, форматах, протоколах, представлениях. Которые, в свою очередь, представляют собой набор идентификаторов, связанных между собой правилами и отношениями (в частности системой разделителей, которые выражаются либо в определенном символе, представляют собой пустой идентификатор, выражающие обычно отношение границы или связывания). Перед появлением Интернета все революции заключались в построении все более и более высоких уровней абстракции над аппаратным обеспечением и машинным кодом, высшей формой чего явился графический интерфейс (который, теоретически, должен быть ближе всего к пользователю). Интернет революция дала нам связность информации между компьютерами и связность информации внутри гипертекста. Все остальные нововведения являются либо следствиями этих причин (появление социальных сетей, как еще одна возможность общения в Интернете), либо недостатками изначальных стандартов (как, например, динамический аспект гипертекста), либо же средствами преодоления возникших проблем (как поисковые системы и Семантический Веб). В целом же, мы видим, что каждый шаг касался трех основных аспектов: идентификация, абстракция и смысл (связность).
* Идентификация
Проблема идентификации идеально решается в программировании. Что неудивительно — ведь там это необходимое условие самого процесса (т.к. всё должно быть идентифицировано, чтобы использовать его в дальнейшем). Для всего остального мира, проблема идентификации как стояла, так и стоит, как никогда остро (впрочем, проблема существует даже в программировании на месте его стыка с миром не-программирования, например, идентификации предметов, не включенных в программу напрямую). Текстовый интерфейс усугубил проблему идентификации тысячей аббревиатур, которые необходимо запомнить (или найти). Графический интерфейс облегчил проблему тем, что показывает идентификаторы явно, однако проблема его заключается в том, что эти идентификаторы не доступны для переиспользования (например, чтобы сослаться на какой-либо элемент и изменить его значение/состояние). Файловая система вводит еще один уровень сложности идентифицирования, т.к. необходимо запоминание имен файлов и путей. Доменная система заставляет запоминать имена доменов и URL-ы. В целом, конечно, любое запоминание полезно для тренировки памяти, но на выходе мы также видим свалку из миллионов идентификаторов. И ладно, когда чужие идентификаторы нам ничего не говорят о содержимом, так даже те идентификаторы, которые мы используем для собственных файлов, со временем тоже могут потерять смысл.
* Абстракция
Проблема абстракции более-менее решена в программировании. Что неудивительно — ведь там это достаточное условие самого процесса, а именно, программирование постоянно оперирует с абстракциями, которые соответствуют другим абстракциям или предметам реального мира. Существует, конечно, и небольшая проблема, а именно: пройдя через несколько этапов абстрагирования (например, в цепочке «пользователь-дизайнер-разработчик-пользователь») на выходе мы имеем абстракции, которым не всегда можно поставить в соответствие исходные абстракции. Отброшенная информация либо подразумевается (дизайнером, разработчиком, и т.п.), либо просто игнорируется. Для мира вне программирования проблема выглядит по-другому, т.к. здесь абстрагирование отсутствует вообще. Почему? Главным образом, потому что не существует формального алгоритма абстрагирования. Впрочем, абстрагирование частично доступно через идентификацию (ведь идентификатору соответствует содержимое, т.е. идентификатор, по сути, и является абстракцией информации, особенно это очевидно, если в роли идентификатора выступает текст на естественном языке), что неудивительно, так как идентификация — это как бы «идеальное» абстрагирование, когда похожесть источника и результата абстрагирования является полной.