\"Идеальный\" настольный поиск: версия light
На модерации
Отложенный
Главная сложность, с которой столкнутся разработчики предложенной в прошлый раз Системы поиска и обработки информации, - многим ее пользователям придется расстаться с привычным для них стилем работы с информацией. Что ж – вот способ извлечь из самой проблемы способ ее решения. Ниже представлен менее рискованный (и, надеюсь, менее затратный) для разработчиков вариант: light-версия Системы. Включая в себя не более 20% предложенных ранее функций, версия light, как ни странно, предоставляет пользователю не менее 80% полезного эффекта. И дает ключ к «ненасильственному» внедрению нового стиля работы с информацией.
Версия light – это текстовый процессор (ТП) с функциями, часть из которых предлагалось использовать в full-версии Системы. Вот краткий алгоритм работы текстового процессора.
Шаг первый
ТП самостоятельно индексирует на компьютере пользователя текстовые файлы популярных форматов (*.doc, *.htm, *.pdf, *.txt, *.chm и т.д.) – либо использует индекс Google Desktop или «Персональный поиск Яндекса» (договорившись с их разработчиками). Также программа индексирует базы данных наиболее популярных RSS-ридеров, почтовых клиентов, программ для каталогизации информации и т.д. (если ТП станет популярным, разработчики прочих сторонних программ сами начнут писать для него конвертеры).
Индексация – ключевой момент работы программы, позволяющий пользователю сохранить большинство своих привычек. Нашему ТП, в сущности, все равно, ищет ли пользователь в Google и Yandex – или в Quintura и Nigma; сортирует ли файлы по папкам – или сваливает их в кучу; использует ли в своих проектах десятки и сотни файлов с фактическим материалом – или пяток-десяток свежесохраненных html-страниц. Также пользователь сможет не расставаться с любимым RSS-ридером и другими привычными программами. Он просто добавит в свой арсенал легкий в освоении, удобный и быстрый инструмент для финишной обработки информации.
Шаг второй
Работа ТП начинается традиционно – с привычной команды «Открыть (Open)». Только в данном случае открывается (точнее – «подкачивается» в текстовый процессор) не один, а сразу множество файлов, имеющих отношение к информационному проекту. Вам не придется искать эти файлы на жестком диске – программа найдет их сама. От вас только потребуется задать несколько ключевых слов, которые, на ваш взгляд, определяют тему. Но задать их нужно не одной строкой через запятую – а в виде дерева.
Например, вы задаете две «родительских» ключевых фразы: «автоматизация управления» и «автоматизация производства». А затем к первой фразе добавляете «дочерние» ключевые слова: «документооборот», «ERP», «CRM», «BI», а ко второй фразе: «автоматические линии», «станки с ЧПУ», «обрабатывающие центры», «роботы» (ТП учтет морфологию). Нажимаете «ОК» – и ТП «подкачивает» в соответствующие ветки дерева запросов файлы, содержащие заданные ключевые слова.
Нечто похожее видят пользователи тех же Google Desktop или «Персонального поиска Яндекс» – в ответ на запрос эти настольные поисковые системы практически мгновенно выдают ленту результатов. Только в данном случае мы получаем не ленту, а дерево результатов.
Важное замечание: момент подкачки файлов в программу – ключевой для изменения на бессознательном уровне стиля работы с информацией. Поэтому он должен приносить максимум удовольствия, быть быстрым и красивым (например, сопровождаться звуком легкого стрекотания машинки для пересчитывания денег и изящным разворачиванием дерева результатов), а также избавленным от «глюков» и «зависаний».
Шаг третий
Дерево результатов последовательно разворачивается в трех вертикальных окнах программы: сайдбаре, окне редактирования и окне источников.
В данном случае в сайдбаре мы увидим две ключевых фразы, привязанных к «корню» – заголовку всего проекта. Это, как вы помните, фразы: «автоматизация управления» и «автоматизация производства». «Развернув» их точно так же, как мы разворачиваем папки в Проводнике Windows, мы увидим соответствующие каждой фразе дочерние ключевые слова. Далее, при «развертывании» дочернего ключевого слова, мы увидим заголовки файлов (или новостных RSS-сообщений), «подкаченных» в данную ветку в силу того, что в их текстах содержится соответствующие ключевые слова.
Поставив курсор на любой заголовок, мы увидим во втором окне программы – т.е. окне редактирования – текст соответствующего файла (RSS-сообщения, электронного письма и т.п.).
На панели управления ТП, кроме традиционных кнопок форматирования и редактирования текста, присутствует специальная кнопка-маркер. Если выделить с ее помощью любой текстовый фрагмент (например, абзац или предложение, содержащие важную цифру, факт, цитату известного политика или бизнесмена и т.п.), то в окне редактирования останется только выделенный маркером фрагмент. Зато полный текст сообщения появится в третьем окне – окне источников.Обработав маркером несколько файлов и переставив курсор на «дочернее» или «родительское» ключевое слово либо в «корень» проекта, мы увидим в окне редактирования ленту с промаркированными фактами, каждый из которых будет лежать на собственной серой подложке (все остальные, необработанные тексты будут скрыты в ленте до тех пор, пока мы и в них не выделим нужные нам факты – либо пока не переставим курсор на заголовок конкретного необработанного текста.
Такой порядок работы, надеюсь, снизит риск зависаний программы из-за нехватки ресурсов – и в то же время практически не уменьшит функциональность программы).
Мы можем с помощью мыши либо горячих клавиш «CTRL + Стрелка вниз/вверх/вправо/влево» на лету менять структуру и последовательность элементов дерева сайдбара. Мы также можем перетаскивать факты относительно друг друга в окне редактирования, просто подцепив их мышкой за подложку.
Вернусь к начатому описанию третьего окна. Итак, когда во втором окне курсор находится в пределах подложки того или иного факта, в третьем окне мы видим полный текст исходного сообщения, в котором давеча выделили данный факт кнопкой-маркером. При более вдумчивом чтении исходного текста в третьем окне можем выделить этой же кнопкой и другие факты – и они появятся во втором окне, каждый на своей серой подложке. Все промаркированные факты в третьем окне лежат на желтой подложке. На панели управления ТП присутствует кнопка-ластик, позволяющая снять выделения с фактов (если они будут сняты все – исходный текст отправится в корзину, расположенную в сайдбаре, из которой его, впрочем, можно в любой момент достать обратно).
На панели управления ТП присутствует кнопка перехода в полуавтоматический режим выделения фактов. Если ее нажать, во всех текстах автоматически будут выделены и помещены на серые подложки абзацы, в которых присутствуют заданные пользователем ключевые слова (сами по себе ключевые слова и в полуавтоматическом, и в ручном режиме всегда подсвечиваются). Пользователь прочитывает эти абзацы и оценивает, интересуют ли его присутствующие в них факты (если нет – снимает выделения). Маленькая, но важная хитрость: если в одном абзаце присутствуют в виде перечисления несколько ключевых слов из разных веток – заголовки таких сообщений-источников подсвечиваются в сайдбаре красным цветом. Понятно, что красные заголовки будут продублированы в двух и более ветках сайдбара. Пользователь может проверить эти заголовки в первую очередь – и оставить там, где им самое место.
Первые три шага были описаны так длинно, чтобы оставить поменьше вопросов разработчикам. А теперь – описание для пользователей.
Подгружаете в ТП тексты по теме, которую вам нужно проработать. – Читаете тексты и выделяете нужные вам факты. – На лету перетасовываете факты в том порядке, который наилучшим образом отражают тему. – Пишете оригинальную статью (аналитический отчет) используя в качестве «кальки» логическую схему, узлами которой являются отобранные и отсортированные вами факты.
Не буду вам навязывать свое мнение. Оцените сами, насколько та же задача решается дольше и сложнее в традиционном текстовом редакторе.
В первых трех шагах описана первая версия ТП. Если выяснится, что пользователь примет главные «фишки» программы – возможность автоматически подкачивать подсобные материалы, а также работать не с линейными текстами, а с деревом фактом – можно будет усложнить алгоритм ТП.
Во второй версии программа не только упростит финишную обработку информации, но и позволит реализовать задачу, которая ставилась в предыдущей статье: «читать, не читая» -- т.е. использовать информацию, изучая ее на минимально необходимом и достаточном уровне.
Вместо резюме
Во второй версии ТП можно будет реализовать «смысловые», «объектные» слои и функцию назначения ключевым словам синонимов – все это я подробно описал в предыдущей публикации. Если в распоряжении разработчика окажутся собственные наработки в области семантического анализа текстов – их также можно использовать на этапе «подкачки» текстов. Тогда работа будет строиться следующим образом: пользователь определяет тему исследования одним ключевым словом и набором синонимов к нему, а программа автоматически выстраивает дерево дочерних понятий, связанных с родительским ключевым словом и играющих в текстах некую важную роль. Затем пользователь вручную удаляет лишние ветки и добавляет нужные.
Когда пользователи войдут во вкус экономии времени при работе с текстовой информацией – вот тогда им и можно будет предложить версию full. Напомню, сверхзадача ее разработки – создание эффективного конвейера поиска и обработки информации на основе максимального сокращения рутинных операций и использования действий пользователя на последующих этапах.
Общий вывод: если ваша разработка требует слишком резкого изменения привычек пользователей – создайте промежуточную программу. Главное – правильно определить функциональное звено, с которого реально начнется эволюция привычек.
Комментарии