Главная (Newsland) sergooze Квантовая математика поможет в поиске слов в текстах

06.04.2009 04:00

Квантовая математика поможет в поиске слов в текстах

Испанские ученые создали новый алгоритм поиска в тексте ключевых слов, основанный на использовании теории случайных матриц, сообщает New Scientist. Работа ученых опубликована в журнале Physical Review E.

Самый простой метод поиска ключевых слов в тексте заключается в следующем. Чтобы определить, является ли слово ключевым, изучается частота его повторения в тексте. Затем частота того же слова определяется для некоторого базового текста, привязанного к изучаемому из некоторых сторонних соображений. Если частота в исходном тексте оказывается выше, чем в базовом, то слово признается ключевым.

В рамках нового исследования ученые предложили считать не только частоту вхождения слов, но их группировку. Ученые полагают, что более важные слова обычно группируются автором вместе, в тех частях текста, где он пытается донести основную мысль. При этом менее значимые слова оказываются более равномерно распределены в тексте.

Для описания данной идеи исследователи использовали так называемую теорию случайных матриц - раздел теории вероятности и статистики, занимающийся изучением случайных величин, которые принимают матричные значения. Оказалось, что многие математические методы данной теории представляется возможным применять к изучению текстов.

В качестве тестирования своего метода ученые предприняли попытку обнаружить ключевые слова в нескольких известных текстах на разных языках: английском, немецком, испанском, итальянском и латыни. Опыт оказался достаточно успешным. Например, в труде Эйнштейна, посвященном общей и специальной теориям относительности, в первую десятку ключевых слов новый метод поместил "поле" (field) и "гравитационный" (gravitational). В "Трех мушкетерах" Александра Дюма первую строчку оккупировала "миледи", а Атос оказался важнее д'Артаньяна. Полный список изучавшихся текстов доступен здесь.

Кроме этого исследователи провели тестирование нового метода в текстах, предварительно удалив из них пробелы. Результаты, по словам исследователей, указывают на то, что новый метод может применяться для изучения абстрактных массивов данных.

Создатели нового метода позиционируют его в качестве будущего метода для интернет-поиска. Специалисты в данной области, однако, пока настроены скептически. Они полагают, что, прежде чем можно будет говорить о практическом применении нового метода, необходимо провести сравнительное тестирование с существующими методами поиска.

Источник: http://lenta.ru/news/2009/04/06/quantum/

0 2 1485

Смотрите также

Миледи с Атосом порадовали. Заходит пользователь на сайт поисковой системы и набирает \"миледи атос\", и новый алгоритм ему тут же - \"Три мушкетёра\". А если вводит \"дартаньян\", то \"20 лет спустя\".

0 Экспертное мнение

Оперативные новости

Вчера На астероиде Бенну найдены сахар, резина и пыль от взрывов сверхновых Вчера В Нижнем Новгороде арестован первый зам мэра Сергей Егоров по подозрению в коррупции Вчера Дело о квартире Ларисы Долиной дошло до высших инстанций: как власти комментируют этот скандал Вчера Эксперимент KATRIN: результаты не подтвердили существование стерильного нейтрино Вчера В Волгограде подросток убил пожилую соседку и поджег ее дом из-за замечаний Вчера Сийярто раскрыл сумму, которую Украина запросила у НАТО на содержание своих вооружённых сил

Голосование

А как вы считаете, спасет ли помощь Евросоюза Украину?

Нет, Украина исчезнет как государство в ближайшее время

Вмешательство ЕС ведет только к затягиванию конфликта

Украина потеряет часть территорий

Проголосовал 1 человек

Популярные каналы

Все о кино 46994 участника

Политика 35270 участников

Ньюсленд и его обитатели 130 подписчиков

Музыкальная битва 27846 участников

Back in the USSR 22082 участника

ПАРТИЯ "ВОЗРОЖДЕНИЕ ВЕЛИКОЙ РОССИИ ". 13867 участников

Клуб интеллектуалов 12387 участников

Политика - объективный и полноценный взгляд 11669 участников

А.Гершаник: эксперименты живьем 11628 участников

Интересные новости 11600 участников

Все каналы

Меню

Newsland.com – место, где обсуждают новости.

Социальный новостной агрегатор №1 в Рунете: самое важное о событиях в России и в мире. Newsland.com - это современная дискуссионная платформа для обмена информацией и мнениями.

В режиме 24/7 Newsland.com информирует о самом важном и интересном: политика, экономика, финансы, общество, социально значимые темы. Пользователь Newsland.com не только получает полную новостную картину, но и имеет возможность донести до аудитории собственную точку зрения. Наши пользователи сами формируют информационную повестку дня – публикуют новости, пишут статьи и комментарии.

Сайт ориентирован на взрослую аудиторию с активной жизненной позицией (35+).

При любом использовании материалов сайта пользователь обязан указать источник в виде гиперссылки на сайт newsland.com.

Новости, аналитика, прогнозы и другие материалы, представленные на данном сайте, не являются офертой или рекомендацией к покупке или продаже каких-либо активов.

Ответственность за содержание любых рекламных материалов, размещенных на портале, несет рекламодатель.

Квантовая математика поможет в поиске слов в текстах

Смотрите также

Виктория Родочинская станет лицом "Единой России"

«Живут по своим обычаям»: Миронов требует остановить миграционный беспредел и защищать граждан

Комментарии

Оперативные новости

Голосование

Популярные каналы