Идея о супер-гипертексте

В далеком 2006-м году некто Роман Иванов (kukutz) со товарищи еще работали активно над замечательным вики-движком под названием wackowiki. И, как говорится, «я там был, мед-пиво пил». В том числе упоминалась такая бредовая идея о супер-гипертексте (текст той моей заметки копирую здесь — а ну как wackowiki.com окончательно сдохнет?).

И можно об этом и не вспоминать, но вот на днях наткнулся на Хабре на заметку о плагине Hyperwords. Очень похоже, да… Воистину «Идея бродит по Европе, идея гипертекста». 🙂 Хотя реализация совсем другая.

Но я бы выделил в той заметке еще 2 идеи, которые по-прежнему не вполне реализованы: «смысловую навигацию», т. е. семантический веб, котором сейчас много разговоров, и «динамический гипертекст» — «гипертекстовая разметка будет тогда динамической, она будет меняться в зависимости от „жизни“ Сети (появились или пропали новые ресурсы на какую-то тему — появились или пропали ссылки в тексте)».

Текст с wackowiki.com (2006-06-07 13:56:08):
Идея Супер Гипер Текста

Как вам такая бредовая идея (может быть и «велоcипед», зато с моторчиком 🙂 —
В обычном ГиперТексте:

  • Ссылками являются НЕКОТОРЫЕ слова/словосочетания на странице сайта
  • Гиперссылки создаются АВТОРОМ

В СуперГиперТексте:

  • Ссылками являются ВСЕ слова/словосочетания на странице (за исключением служебных — предлоги, междометия и т. п.). Фантазируя дальше: все изображения и даже элементы изображений (распознавание образов?).
  • Гиперссылки формируются АВТОМАТИЧЕСКИ: адресом ссылки с какого-либо слова/словосочетания становится страница, наиболее релевантная этому слову/словосочетанию.

Страницы можно брать из базы какой-либо поисковой системы (к примеру, Яndex’а) [1].
Лучше давать возможность пользователю выбора target-страницы из списка 3—5 наиболее релевантных страниц. Еще лучше, чтобы это были не просто названия страниц, а «контекст» (скажем, фрагмент текста до и после искомого слова/словосочетания). Совсем хорошо — автоматическое аннотирование текста страницы [2].

Технически, чтобы ускорить доступ к target-страницам, можно сделать так, чтобы сервер отдавал страницу пользователю и сразу готовил бы кэш из набора релевантных страниц для всех значимых слов страницы. Но это, вероятно, увеличит загрузку сервера невероятно 🙂 …
Тут можно предложить, скажем, оценивать «вероятность» возможного запроса по словам, имеющимся на странице (через частотность по словарю? популярность по статистике запросов?), и делать кэш только для наиболее вероятных запросов.

Этот механизм супер-гиперссылок имеет, imho, сходство с одной из базовых идеей Wiki: автоматически генерируемые ссылки.
В качестве «игрушечного» варианта, модели СуперГиперТекстовойСети, можно построить гиперWiki на этих правилах (т. е. ограничиться супергиперссылками внутри Wiki).

Прошу прощения за столь неструктурированный бред…

[1] По-моему, есть такой плагин к IE — выделяешь слово, в меню по правой кнопке мыши появляется пункт типа «искать слово в Google„. Да, вот и в „Опере номер семь“ тоже есть такое.
„Идея бродит по Европе, идея гипертекста“ (с) Krl Mrx

[2] Тоже пробегала как-то утилита для аннотирования (смыслового „сжатия“) текстов. Может и по алгоритмам что-то было…
ВадимБарсуков

YuriMakarov Я видел похожую вещь. Есть такой броузер — NetCaptor. Точнее это оболочка для IE. В нем была такая компонент, название подзабыл, но что-то вроде FlySwat. Это как я понял отдельный продукт, который поставлялся в комплекте с рекламными целями. У меня эта штука работала только с броузером, но как я понял, она может встраиваться и в другие приложения, например текстовые процессоры.

  • /Ку Ме: Да, да. Такая идея, как аналог сервиса ORFO уже мелькала.

Работала она так. При открытии страницы, через небольшое время, часть слов и фраз на странице подсвечивалась. При нажатии на них (или правой кнопкой мышы, не помню) вываливалось меню с несколькими пунктами типа — Описание (Description), Обучение, Документация, Купить… Точный набор пунктов не помню, вариантов было много, в зависимости от типа объекта. Например для предметов, книг или программных продуктов появлялась ссылка на какой нибудь инетмагазин (Купить), для компаний — ссылка их годовые отчеты и биржевые котировки и т. д. Каждый пункт меню работал как гиперсылка на какой-то (разные) сайт, где была соотв. информация. Очень удобно.

Как это работало. Программа представляла нечто вроде плагина. При открытии страницы (документа …) она лезла в инет в какие-то базы данных (возможно свои, не разбирался). Получала списки известных ей фраз и ссылок… По клику формировала гиперссылку и отправляла на нее. Т. е. чисто внешнее автономное средство. Работает для любых сайтов и просто текстов. Не грузит сервера и т. д.

Проблемы Понимает она только слова, которые понимает. Понимает только английский. Если делать нечто подобное для русского языка сразу возникнут проблемы с падежами и склонениями.

YuriMakarov Нечто похожее можно сделать ничего не меняя на сайте, просто добавив JavaScript к странице, который по клику (или еще как) преобразовывал бы слова или фразы в запрос к поисковику.

  • /Ку Ме: Да, да. Такая идея, как аналог сервиса ORFO уже мелькала.

AlekseyKulakov Понятно что это можно сделать. не понятно зачем это нужно…
Материалы по теме: http://spectator.ru/issues/319

— /Roman Ivanov

ВадимБарсуков: За материалы — спасибо. Зачем нужно — чуть ниже, а пока…
Ещё немного гипер-бреда…

  • В классическом гипертексте мы (в роли Автора гипертекста) пытаемся „вручную“ построить связи („ассоциации“) между некими смысловыми фрагментами текста и на их „интерференции“ построить для себя и для Читателя новый смысл (знание, эмоциональную оценку, информацию для дальнейшей деятельности в реале).
  • Из-за неумения автоматически выделять смысловые фрагменты быстро, малозатратно и однозначно, нам приходится довольствоваться их приблизительным эквивалентом — словами/словосочетаниями. Если б умели хорошо работать с „кусками смысла“, то в приведенной мною выше модели нужно было бы заменить эрзац „слова/словосочетания“ на полноценные „смысловые фрагменты“. И стало бы совсем хорошо: от перепрыгивания по словам перешли бы к „свободному ассоциированию“ — от смысла к смыслу (почти классический психоанализ с его „методом свободных ассоциаций“ как техникой проявления неосознаваемого психического материала).
  • Супергипертекст(-медиа) [ 🙂 ещё точнее было бы назвать это „тотальным гипертекстом“] не устраняет, а позволяет дополнить авторские связи (ассоциации), дополнить логику автора гипертекста. Это дает нам, читателям гипертекста, возможность произвольно связывать, ассоциировать между собой предоставленные им (автором) смысловые фрагменты и на их пересечении порождать новые идеи.

Обычно ведь гипертекстовую разметку производит Автор текста. Он не знает (и не может знать достоверно, только „догадывается“, предполагает), есть ли в Сети информация, ассоциированная по смыслу с фрагментами его собственного текста, какая она и насколько связана с его текстом. А вот searchengine „знает“ это. Уже сейчас есть даже реальный прототип численной (количественной) оценки качества этой смысловой связи — „загадочный“ коэффициент Page Rank поисковых систем.
В Yandex’е, например, с использованием этого коэффициента определяются CY (индекс цитирования), а также „похожие страницы“, на которые в результатах поиска выдается ссылка „Показать похожие страницы“. Ну, а здесь мы пытаемся получить „соотносящиеся по смыслу“ куски текста и связать их между собой гиперссылками.

  • Т. о. с появлением развитых поисковых систем и достаточно мощных клиентов (браузеров) у нас практически есть всё, чтобы проводить автоматическую гипертекстовую разметку. Конечно, может существенно измениться форма представления текста. Придется подумать над способами визуализации фрагментов с различной смысловой нагрузкой и степенью связности (изменение цвета текста? шрифт? фон? пиктограммы?). Можно, например, просто установить некоторое пороговое значение „коэффициента связности“, при превышении которого фрагмент текста становится ссылкой в привычном нам сейчас виде (или помечается как „значимый“, имеющий много смысла).

Надо отметить также, что гипертекстовая разметка будет тогда динамической, она будет меняться в зависимости от „жизни“ Сети (появились или пропали новые ресурсы на какую-то тему — появились или пропали ссылки в тексте).

Зачем это нужно? А зачем нужен вообще гипертекст?

  • Что до практической значимости, то кто в начале 90-х мог в деталях предвидеть нынешнюю „гипертекстовую революцию“ и холодильники, заказывающие продукты для ужина через Интернет?

В чем-то этот „тотальный гипертекст“ близок к концепции „поисковых агентов„: постоянный поиск информации на заданную тематику. В том же Яндексе есть подобный сервис — „подписка на запросы“. А здесь сам текст „сообщает“ читателю о наличии дополнительной информации по теме и „подсказывает“ путь к ней.

  • Собственно, для построения гипер-wiki есть уже компоненты: имеется ведь „поиск по базе“, только нужно будет производить, так сказать, „упреждающие запросы“ (см. выше). Такая wiki будет не просто угадывать ссылку из своего „пространства имён“ (как етто есть по-руски — Name Space — я ничего не переврал?), но и „угодливо“ предлагать тексты из своего „пространства смысла“.