Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта. Благодаря им мы улучшаем сайт!
Принять и закрыть

Читать, слущать книги онлайн бесплатно!

Электронная Литература.

Бесплатная онлайн библиотека.

Читать: Компьютерра PDA N166 (31.03.2012-06.04.2012) - N730 Компьютерра на бесплатной онлайн библиотеке Э-Лит


Помоги проекту - поделись книгой:

Писатель: Я писатель!

Читатель: А по-моему, ты говно!

(Писатель стоит несколько минут, потрясённый этой новой идеей, и падает замертво. Его выносят.) 

Даниил Хармс

Культур-повидлианствовать сегодня будем в пандан софтверному аппендиксу. В смысле, что не традиционный не пришей-к-красной-армии-рукав, а одно вытекает из другого, да и связано напрямую.

Разговор пойдет о разработке наших ученых-соотечественников, бороздящих ниву на стыке самых перспективных отраслей знания: структурно-прикладной лингвистики и компьютерных технологий. 

Если с компьютерами вопросов, обычно, не возникает, то роль лингвиста почему-то в общественном сознании откровенно не дотягивает до заслуженного места. В лучшем случае, обывателю приходит в голову: переводчик какой-то! Если на пике славы, то - Гоблин. Больше ничего. Неужели придется дожидаться эпохи «Stargate» (помните еще культовый фильм Роланда Эммериха?), чтобы понять, что лингвист - это главный пророк нашей цивилизации (астролог, Дельфийский оракул и компьютерный томограф в одном флаконе!)?

Эк меня понесло! Короче говоря, один из разработчиков, Дмитрий Силницкий, зная о моих слабостях в сфере интерпретации смыслов и дата-майнинга, прислал на тестирование демо-версию совершенно уникального движка, который выполняет сравнительный анализ текстов по авторскому стилю и жанру.  

При этом движок понятия не имеет о существовании автора имярек, да и вообще не догадывается о смысле слов и денотатах в принципе. Основа движка -  графематический анализ, оперирующий лишь цепочками языковых символов -  знаками, буквами и словоформами!

Для хотя бы приблизительного объяснения этого монстра позволю небольшую цитату из теоретического сопровождения разработок (текст Игоря Ножова из РГГУ): 

«Основная цель графематического блока получить выборку полных словоформ из массива текстов базы данных.  Графематический анализ работает с внешним представлением текста и использует таблицу стоп-слов. В этой таблице хранятся цифры, спецсимволы и частотные слова языка, нерелевантные для поиска по текстам.

Графематический анализ выполняет три функции:

1. отсечение стоп-слов в тексте;

2. разбиение данных на три потока;

3. индексация каждого потока.

Единицей графематического анализа является цепочка символов, выделенная с двух сторон пробелами. Выделенная цепочка символов подвергается последовательной обработке эвристическими правилами: отсечь знаки пунктуации, проверить присутствие гласных внутри цепочки, чередование верхнего и нижнего регистров и т.д. В зависимости от результатов обработки полученная цепочка символов направляется в один из трех потоков данных:

- цифровые и символьные комплексы (‘кг’, ‘ст.’, ’12.01.99’);

- аббревиатуры - названия государств, организаций, предприятий (‘СССР’, ‘ЮНЕСКО’, ‘ДорСтройСервис’);

- полные словоформы»

В результате столь необычного и внешне совершенно схоластического анализа мы получаем более, чем осмысленные результаты. Именно созерцание практических результатов произвело на меня неизгладимое впечатление.

Я получил демо-версии аналитического движка для двух баз данных. Первая - англоязычная - проводила  стилистический и жанровый анализ относительно хоть и скромной, но вполне репрезентативного массива данных, насчитывающего 2995 авторов и 6266 произведений. Вторая - русскоязычная - чисто номинальная - лишь 700 книг авторов, выражающих мысли на великом и могучем. 

Естественно я начал тестирование с себя любимого: ввел в анализатор текст книги «Как зовут вашего бога». На выходе получил такой результат:

Как видите графематический анализатор опознал мой стиль почти с абсолютной точностью - коэффициент корреляции 95,84 %! Далее идет Вильгельм Адам (кто это?) и много всяких незнакомых товарищей - вплоть до Ильфа и Петрова (62,70 %) и Михаила Веллера (42,66%).

Проверим теперь анализатор на коротких текстах - ввожу «Дело русских медведей», то есть одну из последних Голубятен:

Забавно, не правда ли? Корреляция с самим собой пропала, что не удивительно: на 5 тысячах знаков никакой глубины ожидать не приходится. Зато всплыли чужие ассоциации. Так мой сегодняшний стиль демонстрирует самый высокий коэффициент стилистической и жанровой корреляции с Михаилом Веллером (55,76 %). Далее следует Вячеслав Алексеев (это кто?), Хорхе Луис Борхес (я старался!), Шарль Бодлер (откуда анализатор знает про моего самого любимого поэта?!) и т.д. Даже обожаемый Аутагава Рюноскэ  присутствует в первой десятке корреляции!

Тысяча чертей: но ведь это же не в бровь, а в самый глаз! 

Как и полагается, честному смекалкину, советского замеса, я тут же захотелось всунуть лом между приводной цепью и шестернями анализатора, поэтому скормил ему голубятню образца 2004 года («Лингвистический анализ одного отстойника: призраки ФИДО в XXI веке»)! 

Опять нет прямой корреляции с автором, но подтвердился Веллер на первом месте. И Рюноскэ. Зато исчез Бодлер (старею?).

Признаюсь, результат сразил меня наповал. Понимаете, в чем дело: я же очень хорошо знаю креативные импульсы, наполняющие мои тексты. Меняется рациональное осмысление письма, его техника, приемы, стилистические фигуры и уловки, но стилистическую основу изменить нельзя - она сидит глубоко в подсознании! И там у меня - кладезь морализма, детского идеализма, романтизма, замешанного на трагичном восприятии жизни. Рюноскэ и Бодлер - очень точное описание моих чувств, преломленных через создаваемые тексты. Плюс -  l’art naif на уровне семантики, синтаксиса, подбора метафор. 

Все эти довольно своеобразные жанровые и стилистические особенности моих текстов, отделенных друг от друга 9 годами, графематический анализатор уловил поразительным образом! Не зная ни имен, ни культурологических контекстов автора! Не говоря уже о консистентности стиля и жанра во времени (9 лет дистанции все-таки!). Потрясающе!

Ради чистоты эксперимента подверг жанрово-стилистическому анализу текст Михаила Веллера («Легенды Арбата»):

Текст большой, поэтому анализатор безупречно определяет первым в списке самого автора! Забавно, что Сергей Михайлович Голубицкий числится в корреляционном списке Веллера под номером 11 (44,26 %)! Вот она - диалектика взаимовлияния :)

Теперь - Юрий Бондарев («Берег»):

И тот же результат - первым в списке корреляций - сам автор  (78,48 %), далее следуют Александр Абрамов, Василий Аксенов, Стругацкие, Акунин. 

Дмитрий Силницкий со товарищи трезво отдают себе отчет о непомерной работе, которая предстоит до того, чтобы придать концепту сколько-нибудь практический (не говоря о товарном!) вид. Самое, однако, главное, что уже сейчас четко вырисовываются как минимум несколько аспектов применения этой разработки: во-первых, на основе графематического анализатора можно создать платформу для продвижения неизвестных авторов и разработать систему книжных рекомендаций; во-вторых, можно построить интеллектуальный журнал типа ZITE, который будет задействовать совершенно иные критерии для кастомизации потребительского контента (жанрово-стилистические - и это мне кажется будет посильнее Фауста Гете на фоне современного чисто тематического - «топики» и «лайки» - подхода); в-третьих, можно будет разработать самые разнообразные системы для тестирования и типизирования личности. 

И это - лишь на поверхности. Лингвистические методы анализа действительности столь обширны и универсальны, что навскидку даже затрудняюсь обозначить хоть приблизительно глобальные сферы применения. Психологическая (и психиатрическая) терапия? Извольте! Дата-майнинг стратегического назначения? Не вопрос! Банальная информационная разведка? You bet! Полиграф? Да вот он - уже тут! Ну и так далее.

Короче говоря, я радуюсь, что так много жизни пульсирует вокруг и не все еще потеряно!

Обзор электронной книги PocketBook Touch

Автор: Олег Нечай

Опубликовано 05 апреля 2012 года

В самом начале календарной весны, 1 марта 2012 года, хорошо известная всем любителям чтения украинская компания PocketBook представила свою первую "читалку" с сенсорным ёмкостным экраном, построенным на основе "электронных чернил" нового поколения E Ink Pearl. Дисплей с поддержкой жестов мультитач обещает удобное управление, а "бумага" Pearl - высокую контрастность и быстрое обновление экрана. В довершение ко всему PocketBook Touch оснащён модулем Wi-Fi, при помощи которого ридер может подключаться к интернету. Звучит заманчиво, но насколько хорошо все эти возможности реализованы? Давайте разберёмся.

PocketBook Touch (он же - PocketBook 622) продаётся в небольшой картонной коробке с изображением устройства и его основными характеристиками. Комплектация вполне обычная для "электронных книг": кабель USB, краткая инструкция по эксплуатации (полный вариант хранится в памяти самой книжки) и гарантийный талон. Рекомендованная производителем цена - 6990 рублей.

Устройство полностью выполнено из пластмассы, в доставшемся нам варианте - белой с лицевой стороны и чёрной с тыльной, при этом в продаже есть модификации в полностью чёрных корпусах.

Ближе к низу аппарат немного утолщается, благодаря чему "читалка" удобно лежит в руке. Кроме того, на заднюю панель нанесено мягкое на ощупь покрытие, препятствующее случайному выскальзыванию аппарата из объятий владельца.

Краткие технические характеристики PocketBook Touch:

• Экран: 6-дюймовый монохромный сенсорный ёмкостной E Ink Pearl с поддержкой мультитач, разрешение 800 х 600 точек, 166 точек на дюйм

• Процессор: 800 МГц

• Оперативная память: 120 Мбайт

• Постоянная память: 2 Гбайта встроенной флэш-памяти (пользователю доступно до 1,5 Гбайта) с возможностью расширения флэш-картами microSD/SDHC объёмом до 32 Гбайт

• Операционная система: Linux

• Разъёмы: micro-USB 2.0 и 3,5-мм выход на наушники

• Модуль беспроводной связи Wi-Fi IEEE 802.11b/g/n

• Поддерживаемые форматы книг: PDF, EPUB (в т.ч. защищённые DRM), FB2, TXT, DJVU, RTF, HTML, CHM, DOC, TCR, FB2. ZIP, PRC, DOCX

• Поддерживаемые форматы изображений: JPEG, BMP, PNG, TIFF

• Воспроизводимые аудиоформаты: MP3

• Аккумулятор: встроенный ионно-литиевый полимерный 3,7 В, 1100 мА*ч

• Габаритные размеры: 175 х 114,5 х 9,5 мм

• Масса: 210 г

Экран традиционно для ридеров на E Ink закрыт стеклом с антибликовым покрытием - в отличие от планшетов на жидких кристаллах, здесь это принципиально важно, поскольку изображение с таких дисплеев читается в отражённом свете. Под экраном установлены четыре аппаратные кнопки: "Домой", "Назад", "Вперёд" и "Меню".

Над кнопками расположен зелёный светодиодный индикатор, загорающийся при вводе команды и светящийся до тех пор, пока эта команда не будет исполнена. Очень удобно, например, если вы открываете "тяжёлый" PDF или загружаете какое-то приложение, на что требуется время. Кроме того, светодиод светится при подключении к интернету через модуль Wi-Fi. При желании эту индикацию можно выключить, и это приятно.

На нижней грани "читалки" обнаруживаются стандартный 3,5-мм выход на наушники, порт micro-USB для подключения устройства к компьютеру и зарядки аккумулятора, утопленная в корпус клавиша сброса Reset, слот для флэш-карт microSD/SDHC и кнопка включения. Всё замечательно, разве что выходу на наушники снизу совсем не место - это просто неудобно.

К качеству сборки никаких претензий: ничего не скрипит и не прогибается, разъёмы не болтаются, все кнопки нажимаются чётко. По размерам Touch сравнима с другими ридерами с шестидюймовыми экранами, но слегка тяжелее их. В частности, Amazon Kindle весит 170 г против 210 г у Touch. Впрочем, это заметно только при непосредственном сравнении и не особенно сказывается на удобстве использования.

Качество экрана PocketBook Touch можно оценить даже на выключенном устройстве: поскольку в "электронной бумаге" электричество расходуется только на обновление изображения, на дисплей неработающего ридера можно выводить произвольные картинки. В нашем случае - это краткая информация о "читалке" или рекламная заставка. При желании, эту функцию можно тоже отключить.

Увы, но сенсорный слой сводит на нет визуальные преимущества Pearl над "электронными чернилами" Viziplex предыдущего поколения: изображение достаточно контрастное для длительного комфортного чтения, но без сенсорного экрана Pearl впечатляет значительно больше. Сравните несенсорный экран Sony Reader на E Ink первого поколения и дисплей PocketBook Touch: "сонька" явно контрастнее, а фон однозначно белее.

Кстати, именно из-за неизбежного снижения яркости в Amazon Kindle Touch не стали устанавливать ёмкостной экран, а использовали инфракрасные датчики по краям дисплея, никак не отражающиеся на качестве изображения. Однако, как вы можете убедиться по фото, ситуация вовсе не безнадёжная, и в реальной эксплуатации эта особенность совершенно незаметна.

К тому же прочие достоинства Pearl проявляются в PocketBook Touch в полной мере: страницы "листаются" и прорисовываются быстро, аккумулятор служит долго. А уж об удобстве управления при помощи жестов, привычном для любого владельца смартфона, можно даже не говорить.

Помимо "листания" страниц, нажатия на иконки и навигации по меню, сенсорный экран можно использовать для масштабирования шрифтов и изображения: для увеличения достаточно "раздвинуть" двумя пальцами картинку, для уменьшения - "сдвинуть". Эту возможность особенно оценят те, кто часто читает файлы в форматах PDF и DJVU, сохранённые как изображения: обычно целая страница книги и, в особенности, журнала отображается неразборчиво и её приходится увеличивать.

Как и все ридеры под маркой PocketBook, Touch может похвастаться завидной всеядностью: пятнадцать самых разных книжных форматов без конвертации - об этом владельцы "породистых" Sony Reader и Amazon Kindle могут только мечтать. Опять же, нет никаких проблем с загрузкой файлов: "книжка" распознаётся операционными системами ПК как внешний накопитель.

Со своей основной функцией электронная книга Touch справляется прекрасно, и в этом качестве её вполне можно рекомендовать любителям чтения. А вот многочисленные "бонусы", которыми стало модно снабжать любые ридеры, придётся считать именно бесплатными бонусами, которым, как дарёному коню, в зубы не смотрят.



Поделиться книгой:

На главную
Назад