Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта. Благодаря им мы улучшаем сайт!
Принять и закрыть

Читать, слущать книги онлайн бесплатно!

Электронная Литература.

Бесплатная онлайн библиотека.

Читать: Цифровой журнал «Компьютерра» № 85 - Коллектив Авторов на бесплатной онлайн библиотеке Э-Лит


Помоги проекту - поделись книгой:

За четыреста с лишним лет, отделяющих нас от изобретения телескопа, техника астрономических наблюдений достигла невероятных высот в чувствительности и чёткости изображений. Однако о полном наблюдательном контроле пространства и времени пока можно лишь мечтать.

Первый телескоп Галилея (Фото Museo Galileo)

Первый телескоп, сделанный Галилеем, представлял собою весьма незамысловатую конструкцию: труба, две линзы, простенький штатив. Согласно научной легенде, на его изготовление у великого итальянца ушёл едва ли не один день. Современный телескоп выглядит иначе. Это конструкция, которая весит десятки тонн, напичкана сложнейшей электроникой, обслуживается штатом квалифицированных инженеров и техников, создаётся годами и обходится в весьма чувствительные суммы как в разработке, так и в эксплуатации. Естественно, сравнивать возможности такой махины с возможностями галилеевских «дудок» просто смешно.

Но есть параметр, по которому большинство современных супертелескопов безнадёжно уступает своему далёкому предку: это поле зрения. За невероятное качество картинки приходится расплачиваться «узостью взгляда». Флагманы астрономии, подобные телескопам VLT и «Кек», на одном снимке показывают клочок неба поперечником в несколько угловых минут — в десятки раз меньше, чем у микротелескопов, подобных галилеевскому. Это означает, что Галилею для осмотра всего неба гипотетически нужно было взглянуть в телескоп около двух тысяч раз — гипотетически, поскольку реально Галилей, конечно, такой задачи перед собой не ставил (да и не видно с одной точки Земли всего неба). На телескопе VLT для этого пришлось бы провести уже несколько миллионов наблюдений — гораздо более гипотетически, поскольку на подобном телескопе эта задача нерешаема в принципе.

Казалось бы, в чём проблема? Зачем печалиться о том, что на телескопе нельзя выполнить какое-то действие, если он и без того не стоит без дела? Проблема в том, что такие небольшие поля зрения подходят только для изучения уже известных объектов. Открыть при помощи большого современного телескопа что-то совсем новое весьма затруднительно. Это отражается на востребованности результатов. Если посмотреть статистику астрономических статей за последние годы, результат окажется несколько неожиданным.

С гигантским отрывом в списке самых нужных инструментов лидирует космический телескоп WMAP. Его результаты были использованы почти в двадцати тысячах научных статей! Это, в общем, неудивительно. При помощи WMAP были определены важные параметры космологической модели Вселенной, нужные почти в любом исследовании, так или иначе выходящем за рамки ближайших окрестностей нашей Галактики. Второе же место занимают не наземные телескопы-гиганты, и даже не «Хаббл». Оно принадлежит вполне скромному по современным меркам 2,5-метровому телескопу обсерватории Апаче-Пойнт в штате Нью-Мексико. Его отличительная черта — поле зрения поперечником больше градуса, что позволило выполнять на этом телескопе не разовые целенаправленные наблюдения конкретных объектов, а провести один из самых масштабных обзоров в истории астрономии — Sloan Digital Sky Survey (SDSS). То есть просто построить детальную карту примерно трети неба. Отсюда и востребованность. Наблюдения одной звезды, одной туманности или одной галактики, даже выполненные с величайшими подробностями, интересны лишь небольшому кругу исследователей, занятых изучением именно таких звёзд, туманностей и галактик. А карта нужна всем. Попутно, поскольку вы не ищете чего-то определённого, а просто разглядываете небо, вас ожидают разные неожиданные находки, типа Великой стены Слоуна или звёздных потоков, пронизывающих гало нашей Галактики.

2,5-метровый телескоп обсерватории Апаче-Пойнт (Фото Fermilab Visual Media Services)

Вывод очевиден: наиболее массовый интерес у астрономического сообщества вызывают инструменты, которые «смотрят» не на крохотные площадки, а на значительные участки небосвода. Но и у них есть свои недостатки. Основная фаза того же SDSS заняла добрый десяток лет, и за это время осмотрена лишь треть неба. На остальных двух третях, например, иные цивилизации могли в это время на головах ходить — и мы бы этого не заметили. Поэтому очевидным следующим шагом должен стать телескоп, который бы следил за всем небом всегда. Точнее, таких телескопов должно быть как минимум два — в Северном и Южном полушариях.

И такие проекты есть! В Северном полушарии, на гавайском острове Халеакала уже работает телескоп Pan-STARRS1 (PS1) с небольшим 1,8-метровым зеркалом, но с громадной матрицей (точнее, мозаикой матриц) общим объёмом 1,4 гигапиксела и с трёхградусным полем зрения. Телескоп работает очень просто: наведение, тридцатисекундная экспозиция, выгрузка снимка на компьютер, переход к следующей площадке. За удачную ночь наблюдений обозревается примерно 6000 кв. градусов, а всё доступное с Гавайских островов небо фотографируется за неделю. Главная задача телескопа — не построение карты (хотя и она тоже будет строиться), а поиск на небе изменений, новых астероидов, комет, переменных звёзд, вспышек новых и сверхновых, а также различных «транзиентов», то есть быстро начинающихся и быстро заканчивающихся явлений, которые раньше проходили мимо нашего внимания, потому что мы не умели в нужное время посмотреть в нужное место. Всего в перспективе телескопов Pan-STARRS будет четыре, чтобы сравнением снимков можно было удалять артефакты.

Телескоп Pan-STARRS1 (Фото Роба Ратковски, PS1SC)

Но это, так сказать, цветочки. Ягодки — телескоп LSST (Large Synoptic Survey Telescope), который установят в Чили, чтобы «обслуживать» Южное полушарие. Это будет телескоп с гигантским зеркалом (8,4 метра) и столь же гигантской матрицей (3,2 гигапиксела) при поле зрения поперечником 3,5°. Его главной задачей будет десятилетний мониторинг половины неба, на протяжении которого каждый участочек площадью в 10 квадратных градусов сфотографируют около тысячи раз. Тут уж даже слабым транзиентам не удастся избежать обнаружения, внесения в списки и детального изучения (при помощи «обычных» телескопов).

Казалось бы, мечты о постоянном мониторинге неба наконец сбываются. Но их осуществление, как водится, рождает новые проблемы. Главной трудностью оказывается вдруг не получение информации, а её обработка. Ещё лет десять-пятнадцать назад типичный звёздный или ещё какой-нибудь каталог можно было скачать на свой компьютер в виде ASCII-файла и работать с ним любым привычным способом — хоть написав программу для анализа текста на Фортране. С данными SDSS ситуация уже принципиально иная: для доступа к каталогу необходимо написать SQL-запрос и работать уже не с полным каталогом, а с выборкой. Я, честно говоря, даже не знаю, допустимо ли обратиться к базе данных с запросом типа «select *», но даже если это и допустимо, то вряд ли практично: объём данных измеряется десятками терабайт. Так выяснилось, что для успешной работы с новыми данными теперь мало знать теоретическую астрофизику и Фортран, а нужно ещё учить SQL.

И дальше всё будет только хуже. Терабайты SDSS покажутся трёхдюймовой дискетой по сравнению с итогами работы LSST, окончательный объём данных которого, как ожидается, составит сотню петабайт. К этой информации уж точно будет не подступиться без специальной подготовки. А ведь LSST будет лишь провозвестником новой эры: имеются планы создания подобных же инструментов в других диапазонах, например радио. Вполне возможно, что в середине века петабайт станет не рекордной, а рутинной мерой для астрономической информации (не только наблюдательной, но и теоретической).

В общем, работа наблюдателя заметно эволюционирует. Первые наблюдатели сами выбирали объекты для наблюдений и сами наблюдали их. Теперь всё чаще наблюдатель лишь выбирает объект, а наблюдения для него проводит та или иная обсерватория. Следующий шаг — обсерватория пронаблюдает вообще всё, а наблюдателю останется лишь найти в сотнях петабайт нужную информацию. В результате работа астронома-наблюдателя станет окончательно не похожей на занятие, начало которому положил Галилей. Впрочем, и для успешной работы с каталогами найдётся достойный исторический прототип: именно кропотливый анализ чужих наблюдательных данных привёл Кеплера к открытию законов планетных движений.

К оглавлению

Голубятня-Онлайн

Голубятня: FineReader 11.0

Сергей Голубицкий

Опубликовано 05 сентября 2011 года

Вышла новая — одиннадцатая — версия Файнридера, о котором впервые я написал в Голубятне под номером 35 — «Acid Test: FineReader 5.0» — РОВНО 11 лет назад — 5 сентября 2000 года!

Удивительное совпадение, не правда ли? А с другой стороны — вот так вот и проходит наша жизнь: от релиза Файнридера к релизу ☺

Поскольку древнюю ту Голубятню сегодня днем с огнем не сыскать даже в архивах на сайте Компьютерры (так долго архивы не живут), а главное — результаты того «кислотного теста» я задумал сопоставить с новейшим релизом 11, приведу текст раритетного текста целиком, тем более, что поначалу Голубятни были крохотные:

ACID TEST (FineReader 5.0)

По коридорам редакции в перерывах между путешествиями бродит увешенная бесчисленными технопобрякушками (Palm Pilot, Nokia 7110, Twincept и т.п.) личность — говорят, это главный редактор журнала Козловский. Именно он, прочитав предыдущую «Голубятню», заявил, что я всех достал своими эмоциями: мол, взахлеб советую программы и при этом не подкрепляю чувства доказательствами. Это — старческий поклеп, и сегодня я готов доказать свою правоту.

На свет появился FineReader пятой версии. Появился как истинный диверсант, оставив в полном неведении всезнающих жуков на Горбушке. Финальный релиз Windows Millennium, который поступит в продажу только в конце сентября, лежал на прилавках уже в июне. Ровно неделю назад я поинтересовался о наличии FineReader 5.0, и на меня посмотрели как на ламернутого дурачка: «Мальчик, такого нет в природе!»

Нет, дядька, он в природе есть! Детали презентации программы и красочную коробку пятого «Файнридера», выдающую дизайн мирового класса, уже описал Денис Викторов в «ИнфоБизнесе». Козловский ничего написать не успел, потому что опять куда-то отчалил. Я же подверг новый релиз «аббийного» (от ABBYY — создателя программы) флагмана настоящему кислотному тесту, чем и готов поделиться.

Программы OCR [1] — веселые программы. Всякий апгрейд сопровождается невиданным хайпом: из победоносного релиза мы узнаем, что задействованы революционные технологии, полностью переписан код, радикально изменено ядро распознавания, скорость распознавания увеличилась в N-ное число раз. Это уже было и раньше в случае с четвертой версией FineReader, то же самое я слышал в связи с CuneiForm 2000. Про пятую версию FineReader тоже сказано, что «точность распознавания улучшена в 1,5–2 раза по сравнению с версией 4.0».

Насколько это так, мы сейчас посмотрим. Почему речь зашла о ? Дело в том, что совершенно бесполезно тестировать современные программы распознавания знаков на свеженьких текстах, отпечатанных типографским способом либо на лазерном принтере. Результат будет заведомо безупречен. Поэтому, если вам приходится иметь дело только с такими документами, то создавать электронный архив можно с любой программой OCR — разницы вы не почувствуете. Другое дело — документы экстремального характера…кислотном тесте (acid test [2])

14 лет назад из-под тонких пальчиков профессиональной машинистки выскочили 219 страничек моей диссертации. Как водится, первый экземпляр перекочевал к научному руководителю, второй — на кафедру, третий — в Ленинскую библиотеку в архивный отдел, а вот четвертый я зажал на память. Все эти годы я периодически возвращался к этим желтым и жухлым страничкам и всякий раз убеждался, что они — лучшее, что я создал в этой жизни. Вполне естественно, что желание перевести свою диссертацию в электронный вид не покидало меня ни на одно мгновение. Я набрасывался на всякий новый пакет OCR, но вот что из этого получалось, я вам сейчас продемонстрирую.

Перед вами типичный образец оригинального текста:

По большому счету, ничего тут героического нет: ну бледненько все, ну буквы неравномерно отбились — эка невидаль! Машинистка у меня была профессиональная — брала по восемьдесят копеечек за страницу, поэтому опечаток и замазок — самая малость. Не тут-то было! Этот «исходник» оказался не по зубам всем OCR без исключения.

То, как распознал этот отрывок FineReader предыдущей версии (4.64 Professional), достойно музея Гугенхайма:

Я насчитал только пять правильно распознанных слов (из двадцати девяти). Сами понимаете, «оцифровывание» моей диссертации пришлось отложить до лучших времен — проще все по новой перепечатать.

Приблизительно таким же был результат у CuneiForm 96 и CuneiForm 97, и CuneiForm 98… В какой-то момент я окончательно решил, что — не судьба. Как вдруг на свет появился CuneiForm 2000. Прорыв налицо:

Почувствуй, как говорится, разницу! Не беда, что «вещи с самом совой» и гарантия в четыре слова — «р их га антий». Тут уже можно было работать. И я принялся не спеша, неделя за неделей, разгребать авгиевы конюшни ультрасовременных технологий.

Но, как оказалось, я переоценил свое терпение. Потому что через месяц мне вся эта процедура обрыдла выше крыши. И я опять остался сидеть у самого синего моря в ожидании золотой рыбки.

В минувшее воскресенье я подставил свою диссертацию под FineReader 5.0. В успех не верил. Вот что получилось:

Нужны ли какие-нибудь комментарии? Нужны ли мои традиционные «эмоции взахлеб»? Думаю — нет. Факты, господа, одни только факты. Говорят, «аббисты-файнридерцы» переписали код программы с нуля. Если это так, то перед нами лишнее доказательство того, что русский человек не может ничего построить без того, чтобы сперва не развалить!





Помнится, дорогие аббийцы на меня за тот текст тогда обиделись, даже прислали письмо в редакцию с предложением провести независимое тестирование, давая понять, что мои результаты по четвертой версии — следствие мною же криво выставленных настроек. Я оправдывался: писал, что никаких настроек вообще не настраивал, а просто запускал процесс распознания текста по умолчанию, что говорится, из коробки. Детство отечественной айти-журналистики, чего уж там ☺

_________________________

За 11 лет много воды утекло: канула в Лету добрая «Кунейка» (CuneiForm) — единственный достойных конкурент Abbyy (не считать же конкурентом жуткий американский IRIS). Файнридер, однако, в нарушение всех законов и канонов бизнеса, оказавшись в гордом монопольном одиночестве, не то что не испортился-зазнался-остановился-в-развитии-деградировал, как чаще всего и бывает в бесконкурентном пространстве, а продолжил реально набирать обороты, превратившись в абсолютный мировой стандарт (с мировым же именем) и достигнув акурат маяковского состояния: «Мы говорим OCR — подразумеваем Файнридер, и наоборот».

Но даже не это самое главное. Мало того, что FR стал стандартом, так он еще и сохранил молодость технологического порыва, совершенствуя движок OCR, а не только рюшки-ряшки пользовательского интерфейса!

Именно эту уникальную способность FineReader к самосовершенствованию я и хочу сегодня продемонстрировать читателям. Я взял ту же самую историческую страничку своей диссертации и скормил ее одиннадцатой версии программы. Смотрите, что получилось:


Здесь не нужны комментарии. Это просто фантастика. Смотрите, что при этом творит Файнридер:


Программа констатирует ущербность качества исходного изображения, однако вместо претензий к пользователю (ну-ка быстро исправил мне разрешение! добавил DPI!), знакомых по предыдущим версиям, спокойно и самостоятельно за кадром доводит картинку до нужной кондиции. Такой, которая позволяет провести безупречное распознание текста.

Как водится, в новом одиннадцатом релизе множество мелких фич и примочек, с которыми читатель при желании самостоятельно ознакомится на сайте Abbyy. Меня интересовали лишь ключевые моменты, которые бы оправдали апгрейд даже самого консервативного пользователя. Помимо помянутого улучшения движка OCR в FineReader 11.0 я обнаружил еще одну функцию, заставившую меня даже хлопнуть в ладоши:


Почему подавляющее большинство офисных программ сегодня делает вид, что на рынке не существует двух абсолютно приоритетных для пользователя формата — EPUB и FB2 — ускользает от моего понимания. Ортодоксальная косность — другого объяснения не подберешь. Чего стоит отсутствие хоть какого-то нормального вьюера для EPUB на Маке, в котором этот формат является де-факто стандартом для чтения в iTunes.

Abbyy FineReader 11.0 и здесь оказался первым, внедрив прямую конвертацию сканированного и распознанного текста в самые популярные читальные форматы.

В общем, браво ABBYY! И так держать!

К оглавлению

Голубятня: Ящик из бука для book'a

Сергей Голубицкий

Опубликовано 10 сентября 2011 года

Вчера провел день на 24ой Московской международной книжной выставке-ярмарке. Провел с пользой, печалью, ностальгией и горькими раздумьями. Всем этим спешу поделиться с читателями.

Впервые я попал на Московскую международную книжную выставку, если не изменяет память, в 1979 году. Потом ходил еще раза четыре-пять и всякий раз отстаивал четырех-пяти часовую очередь. За счастье. И не потому что был студентом, которому любое море по колено, а потому что мы были привычными: стоять и подолгу приходилось за всем стоящим — от колбасы (не оттого ли стал вегетарианцем уже в середине 80х?) до фестивальных кинофильмов. За самым-самым лучшим стоять не приходилось: сколько не стой — все равно не достоишься, потому как в открытый доступ самое-самое никогда не попадало: изумительная пища в закрытых распределителях, великое кино на закрытых просмотрах, уникальные книги по закрытым подпискам и т.д. В любом случае в очередях стояли бодро и жизнерадостно, с уверенностью глядя в будущее (видимо, предвкушая завоевание, обретение, прочтение, праздник чрева или глаз).

На первой книжной выставке все посетители пытались что-то выклянчить: ничего не продавалось под страхом смерти, а дарить экспонаты участникам также категорически запрещалось — в крайнем случае в последний день выставки. Вот мы и ходили, терлись на полюбившихся стендах, присматривали СВОЮ книгу, всячески демонстрируя работникам стенда внутреннюю с этой книгой, почти интимную связь. Я таким вот макаром снес (как яйцо) для себя Энциклопедию Джаза на румынском объединенном стенде. У меня до сих пор есть эта книжка с трогательной надписью, выведенной грациозной рукой очень красивой румынки из издательства Minerva: «Подарок румынской стенда» (именно так — «румынской»). Когда шмонали на выходе, я гордо протянул охраняле книгу, готовый лечь костьми за подарок, но не отречься и не уступить. Отрекаться, правда, не пришлось: видимо охраняле спустили директиву на всякую шелупонь-хрень вроде книжек сэвовцев ближнего круга не размениваться. Другое дело — дальний СЭВ (Югославия, Венгрия) и настоящие капиталисты (от Франции до Канады) — книги с этих стендов удерживали на территории выставки похлеще заградотряда.

Сегодня все уже не так: и книги, и нравы, и — главное! — вся парадигма культурного феномена. На каждом стенде открыт толчок — покупай, не хочу. Книги есть какие угодно и о чем угодно. Все, собственно, и ходят на Московскую международную, чтобы отовариться по более приличным, чем в магазинах, ценам.

Я смотрел на изобилие самого ценного в моей жизни объекта материальной культуры и ... грустил! По множеству поводов. Во-первых, я совершенно однозначно осознал, что окончательно и бесповоротно превратился в чукчу из анекдота. Того, который давно уже не читатель, а писатель. Не то чтобы я растранжирил желание читать. Просто уже на эту роскошь не остается времени. Читаю только прикладной материал с единственной целью — чтобы написать самому.

Во-вторых, мне потрясли и окончательно добили цены: 480 — 500 — 700 — 900 рублей за томик. Пусть красиво изданный, пусть раритетный и вожделенный, пусть в Европе аналог стоит в три-пять раз дороже. ЭТИ ЦЕНЫ АБСУРДНЫ! И неизбежно приведут к кончине всего рынка бумажной книгопродукции в самые ближайшие годы. Через 10 лет бумажные книги превратятся в раритетный эксклюзив для изысканных -филов и -манов.

О том, что дни бумажной книги сочтены, можно было догадаться не только по внутренней бухгалтерии самого ценообразования (безумные цены очевидно отражают качественное сокращение тиражей и судорожную попытку по максимуму втиснуть в эти цены кусающуюся себестоимость), но и по инородным элементам, там-сям оплетающим стенды традиционных книгоиздателей. Вот огромный по сравнению с окружением традиционной ориентации павилион ЛитРеса. Вот айМобилко с шикарными аймаками на прилавках, на которых демонстрируется схема-убийца бумажной индустрии, отлившаяся в лозунг: «Любая книга, любой фильм, любая аудиокнига и любой музыкальный альбом за 17 рублей!»

Как такому можно противостоять?! Нет, я конечно знаю как: получать любую книгу, любой фильм, любую музыку и т.д. в том же онлайн, но только совершенно бесплатно! Но эту альтернативу знаем мы — жители по эту сторону дихотомии виртуальность/риаллайф. А как противостоять аймобилкам бумажным книгоиздателям с их 600-рублевыми ценниками?! У меня лично нет ни малейшего сомнения: противостоять невозможно, можно только сыграть в ящик из того самого бука, который обыгрывается в слогане 24ой Московской международной выставки (бук — типа, дерево, а book — книга: спасибо, а то мы не догадывались).

Можно ли как-то спасти бумажную книгу? Теоретически можно: опустить цены в пределы 50-200 рублей максимум. Как это сделать на практике — я лично понятия не имею, хотя и догадываюсь, что наверняка можно, если постараться. Надеюсь только, что когда книжники-бумажники ощутят полноценное жжение в пятой точке от клюва жаренного пернатого, они наверняка напрягутся и напоследок что-нибудь придумают.

Под занавес добавлю в отчет личных мотивов. Собственно, обо всех описанных минорных переживаниях я заранее догадывался, и пришел в общем-то ради того, чтобы поддержать дорогого своего издателя — «Бестселлер». Как мне сказали, осталось около пары сотен еще нераспроданных экземпляров моего двухтомника «Как зовут вашего бога?». По случаю выставки цену на оба тома снизили до символических 150 рублей, а я для усиления привлекательности пару десятков экземпляров еще и подписал, сопроводив к тому же очень теплым и — поверьте! — памятным посланием для читателя ☺ До закрытия выставки осталось два дня — загляните не поленитесь на стенд издательства «Бестселлер» А-104. Если уж не за моей книгой, то ради блистательных мультимедийных путеводителей, на которых последние года четыре специализируется мой издатель. Один из их продуктов — шесть мультимедийных прогулок по пригородам Санкт-Петербурга (Гатчина, Кронштадт, Ораниенбаум, Павловск, Петергоф, Царское село) — записан на двухгигабайтную microSD-карточку (!!!) и стоит, если не изменяет память, 270 рублей (чуть ли не по цене самой карточки!). На мой взгляд — шикарнейший подарок кому угодно — от возлюбленной до родителей. Ну и еще один достойнейший гвоздик в ту самую буковую коробочку для book’a ☺





К оглавлению



Поделиться книгой:

На главную
Назад