Search Wikia: даже не удаленная угроза для Google

На модерации Отложенный Search Wikia, поисковый движок с открытым исходным кодом от соучредителя Wikipedia Джимми Вэйлса (Jimmi Wales), запущен сегодня в стадии альфа-тестирования. Широко раздутая история, часто изображаемая как героическая борьба Давида с Голиафом, по сути это просто появление очередного поискового сервиса, который, если всё пойдет хорошо, может превратиться во что-то полезное.

Сейчас же Search Wikia по существу бесполезен как поисковик. Что делает его интересным, так это некоторые идеи и подходы, которые использует сервис. Я не буду «добивать» результаты поиска, которые сама Search Wikia признает жалкими. Лучше я обращусь к некоторым проблемным вопросам в сегодняшнем положении веб-поиска, которые Search Wikia пытается решить.

«Мы не готовим убийцу Google»

Это цитата от основателя Search Wikia Джимми Вэйлса в Q&A(Вопросах-и-Ответах) с его участием где-то около года тому назад. В Вопросах и Ответах, Дэнни (Danny Sullivan) расспрашивал Джимми о его мотивации к созданию нового поисковика. Вэйлс выделил несколько основных моментов, которые и вошли в «Принципы организации» Search Wikia (о большей части из них речь пойдет ниже).

По мнению Вэйлса, одна из проблем состоит в том, что поисковики это своеобразные черные ящики – вы вводите несколько ключевых слов, поисковая система выполняет свою работу и выдает результаты без всякого объяснения. Загвоздка в том, что вы не представляете, что именно сейчас произошло и почему, может быть, не удался ваш поиск.

«Для некоторых типов поиска поисковики очень хороши» , - говорит Вэйлс. - Но я до сих пор вижу серьезные неисправности, при которых поисковые системы не предоставляют релевантной выдачи. Мысля более глобально, я считаю, что мы, мировое сообщество, должны иметь большую прозрачность в поиске. Какие действуют алгоритмы? Каковы причины того, что один сайт оказывается выше другого?»

В статье в New York Times Вэйлс говорит: «Я считаю, что это нездоровая ситуация, когда контроль над информацией, предназначенной для всех жителей земли, осуществляется таким малым количеством игроков, за закрытыми дверьми. У нас действительно нет возможности понять этот процесс и как-то повлиять на него».

Это ведет к следующей проблеме - низкому уровню вовлеченности сообщества. В этом году мы наблюдали взрыв популярности социальных сетей, кроме того, нельзя не отметить попытки многих поисковых систем «соединить» людей различными способами. Но эти попытки, по мнению, Вэйлса, не столь результативны, как хотелось бы.

Как решает эти проблемы Serach Wikia? Давайте более близко познакомимся с четырьмя «организационными принципами», четко обозначенными на главной странице Search Wikia Labs.

Четыре организационных принципа, на которых должно основываться будущее интернет-поиска:
1. Прозрачность – открытость того, как функционируют системы и алгоритмы. В формах открытого исходного кода и открытого контента + API.
2. Сообщество – каждый способен оказать какое-то влияние (как индивидуальное, так и организованное), фокус на социальной составляющей.
3. Качество – значительно улучшить релевантность и точность результатов поиска и опыта поиска.
4. Конфиденциальность – должна быть защищена, не хранить и не передавать никакой опознавательной информации.

Давайте рассмотрим, как Search Wikia реализует каждый из четырех принципов в отдельности.

Прозрачность: Создание демократии, или вручение лисе ключей от курятника?

Search Wikia – поисковая система с открытым исходным кодом, что означает, что пользователи могут модифицировать и адаптировать программное обеспечение, результаты поиска и другой контент, скомпилированный поисковым движком.

В мире программного обеспечения появление открытого исходного кода пробудило в некоторых чуть ли не религиозный фанатизм. Идея о том, что исходный код программного обеспечения должен находиться в свободном доступе для просмотра, изменения, адаптации и обмена друг с другом, является обоснованной, что подтверждено успехом операционной системы Linux. Но открытое программное обеспечение не заменило программного обеспечения с закрытым кодом. Microsoft до сих пор является основным поставщиком операционных систем, несмотря на многочисленные предложения со стороны сообщества «открытого» Linux.

И пока открытый исходный код может хорошо работать с чем-то вроде операционных систем, где программное обеспечение должно выполнять четко обозначенные функции с уже известными заранее результатами, то результаты поиска по определению в высшей степени субъективны, с несколькими стандартными техниками и методами в дополнение к базовому сравнению, сортировке и другим относительным функциям, являющимся только основными блоками поискового механизма. И в итоге, идеальный результат для одного пользователя может оказаться просто мусором для другого.

Более того, поисковые системы являются такими сложными «объектами», что держу пари, никто в Google, Yahoo или другом крупном поисковике не знает ВСЕГО о работе поискового механизма. Компьютерный код высокотехничен, и хотя программист может понять работу кода, прочитав его, код все же должен быть запущен и протестирован всеми взаимосвязанными элементами, чтобы точно знать, как он работает. У меня есть серьезные сомнения, что добровольцы смогут внести «улучшения» в код поискового механизма без нежелательных последствий. Эти усовершенствования покажутся хорошо обоснованными тому, кто пишет код, но недопустимыми с точки зрения программистского сообщества и тем более со стороны пользователей.

Намного проще с текстом: сообщество Wikipedia проводит хорошую работу по мониторингу и исправлению неправильных входов в их энциклопедию, но как может сообщество программистов выполнять такую же работу, учитывая высокую субъективность и сугубую техничность природы кода поисковой системы?

А пользователи? Действительно ли мы нуждаемся в этой прозрачности? Десять лет тому назад я заглядывал под капот моей машины, чтобы поковыряться в двигателе и что-нибудь усовершенствовать. Сегодня же, когда почти всё в моей машине компьютеризировано, у меня нет возможности вносить свои изменения. Но с учетом поддержания бесперебойной работы моей машины, я абсолютно счастлив при таком положении вещей и ничуть не скучаю по дням «прозрачности двигателя».

Фактически, несмотря на то, что я изучал теорию вычислительных машин и систем в вузе, у меня возникли трудности в попытке расшифровать «уровень релевантности», который появляется рядом с каждым результатом поиска в Search Wikia. Щелкните по этой ссылке и увидите, как поисковый движок Nutch, используемый в Search Wikia, рассчитывал релевантность этого результата.
«Прозрачность» - да, но также полная непонятность для тех, кто не является программистом, знакомым с Nutch.

А как насчет спамеров? Я знаю несколько поисковых маркетологов, которые бы были очень рады узнать, как именно работают поисковые алгоритмы. Я готов поспорить, что они менее чем за 24 часа нашли бы способ обыграть систему в свою пользу.

На самом деле прошло даже меньше 24 часов после запуска Search Wikia, а спамеры уже открыли для себя этот русурс: проверьте страницу «Недавние изменения wiki», чтобы увидеть, что добавляют предприимчивые члены сообщества в Search Wikia.

Сообщество: Но у нас уже есть сообщество!

Все основные поисковые системы, как и Ask.com, в последние годы запустили несколько социальных функций. Причем Yahoo, очевидно, является наиболее агрессивно продвигает сервисы, ориентированные на сообщества, например, такие как Answers, My Web и другие. Google и Microsoft тоже проявляют инициативу в этом направлении.

Более того, большинство поисковиков предоставляют технически-продвинутым пользователям возможность использовать и создавать различные виджеты, API и другие расширения функционала поисковика. Эти инициативы создают и сообщество, и, в определенной мере, прозрачность для тех, кто хочет и может ими пользоваться. Конечно, никто не уделяет такую роль сообществам как Search Wikia, но еще не ясно, является ли сообщество само по себе полезным для поисковиков. Все сервисы «социального поиска», представленные с начала существования веба, либо провалились, либо не перетянули на себя достаточное внимание. Но это не значит, что сообщество не полезно, только из-за того, что оно может не стать приманкой для пользователей на Search Wikia или же не станет способом улучшения поиска.

Вы можете принять участие в (не программистском) сообществе Search Wikia несколькими способами. Вы можете отправлять отчеты об ошибках, предлагать сайты для внесения в «белый список» или же создавать мини-странички (подобная Wikipedia запись, подводящая итог теме).

Search Wikia еще и социальная сеть из разряда тех, при регистрации в которых вы вносите о себе определенную информацию, которая затем выдается в результатах поиска, если вас искали.

Когда вы регистрируетесь в Search Wikia, можете указывать и свое реальное имя, и ник. Немного причудливо, потому что около поля реального имени есть примечание: «Реальное имя вводится по желанию, если вы решите предоставить его, то оно будет использовано для вашей работы с сайтом. Это поле должно быть заполнено для работы с Search Wikia». Итак, ваше реальное имя вы вводите по желанию, но вы обязаны ввести его, если хотите использовать сервис. Логично.

Огромная проблема сайтов, основанных на сообществах, - политизация: определенная группа пользователей начинает доминировать и оказывает влияние на остальных, менее «мощных» пользователей. Мы видели это в проекте Open Directory (Открытый Каталог), совсем недавно в Digg и даже в самой Wikipedia. Что начинается, как благородный эксперимент, обычно оборачивается трагедией.

Качество: Найдет ли по транскрипции?

По-моему, улучшение качества – наиболее похвальная цель Search Wikia – и одна из тех, до которых еще идти и идти. Уверен, что в наши дни качество поиска большинства поисковых сервисов находится в хорошем состоянии, но мы всё еще далеки от совершенства, и каждый (даже из крупных поисковиков) признает это. Но качество – это такая неопределенная концепция, видная при этом невооруженным глазом, что ее можно считать чуть ли не бессмысленной. Посмотрите на этот принцип с другой стороны: разве кто-нибудь будет создавать поисковую систему низкого качества? Сегодня качество – цена признания, а не отличительная черта. Если у вас нет хороших результатов поиска, то считайте, что вы мертвец, поэтому это, возможно, было ошибкой со стороны Search Wikia открываться с такими ужасными результатами поиска.

Преимущество поиска Wikia в том, что тысячи пользователей Wikipedia могут помочь повысить его качество и заполнить пробелы. Но нужно, чтобы это произошло быстро, чтобы вытянуть сервис. Wikipedia выжила и в конечном счете процветает, потому что в свое время заполнила нишу неудовлетворенной потребности (большая часть online-энциклопедий была платной до появления Wikipedia). В отличие от Wikipedia, Search Wikia находится в нише уже достаточно заполненной, и еще не ясно, что ждет пользователей-добровольцев в итоге.

Конфиденциальность: Не спрашивают, не говори

Поисковая конфиденциальность стала очень важным вопросом за прошедший год, после того, как большая часть крупных поисковиков представила новые, более жесткие регламенты конфиденциальности данных, которые они обрабатывают и сохраняют. Search Wikia заявляет, что пойдет дальше остальных в защите секретности данных, но тогда возникает недоразумений.

Хоть четвертый принцип и заявляет, что данные «должны быть защищены и не должны передаваться или храниться», у Search Wikia вообще нет регламента политики конфиденциальности. Если вы авторизуетесь, то увидите табличку «Privacy» («Конфиденциальность»), кликнете по ней и попадёте на страницу очевидного контроля над вашими настройками секретности. Я говорю «очевидного», потому что практически все настройки связаны с доступом других пользователей к той информации, которую вы вводили о себе при регистрации. Но нет никаких настроек о секретности ваших поисковых запросов, истории посещения сайтов и т.д.

Также настораживает битая ссылка «Terms of Service» («Правила сервиса»), находящаяся внизу каждой страницы, которая при этом просто переводит вас в начало просматриваемой страницы.

В обеспечении конфиденциальности как главном принципе я ожидал увидеть больше раскрытия, прозрачности и убеждения. Однако придется смириться с тем, что обязательства по поводу секретности данных со стороны Search Wikia, скорее всего, уже выполнены.

Выводы

Если вы ищете достойный альтернативный поисковик, то забудьте о Search Wikia на данном этапе – его результаты напомнят вам AltaVista года этак 94-го. Однако если вы придерживаетесь принципов, заявленных у Search Wikia, и готовы к крайне амбициозному эксперименту, просто зарегистрируйтесь и дайте Search Wikia шанс. Будьте готовы потратить уйму времени, чтобы научиться работать с системой и управляться с пользователями, не согласными с вами или не любящими вашу работу. Если же Search Wikia смогут вытянуть и он будет следовать заявленным им же принципам, то мы получим вполне полезный альтернативный поисковый сервис. Только не задерживайте дыхание на это время, думаю, это произойдет не скоро.