Полнотекстовые базы данных и средства формирования запросов в них - Book-Science - Научная энциклопедия
Профиль
Рейтинги
Новые
Категории
  • Новости
  • Статьи
  • Работы
  • Исследования
  • Заметки
  • Комменты

Полнотекстовые базы данных и средства формирования запросов в них, страница 2

Разместил: Admin, 11 April 2011

В этом случае:

Запросу SI AND S2 будут соответствовать множество документов, являющихся результатом логического умножения множеств документов, содержащих слова SI и S2, т.е.:

SI AND S2 соответствует {D2, D3, D7, D8}x{DI, D7, D9} = D7

Запросу S3 OR S5 будет соответствовать множество документов, являющееся результатом операции логического сложения множеств документов, содержащих слова S3 и S5, т.е.:

S2 OR S5 соответствует {Dl, D7, D9} + {D2, D5, D7, D9} == {Dl, D2, D5, D7, D9}

Запросу S3 NOT S6 будет, соответствовать множество документов, содержащих слово S3, но не содержащих слово S6, т.е.:

S3 NOT S6 соответствует {Dl, D2, D3, D4, D5, D6, D8, D9} - {D4} = {Dl, D2, D3, D5, D6, D7, D8, D9}

Режимы применения логических функций могут быть различными. Например, В ИПС Агама в запросе, состоящей из фразы “налоги на малое предприятие” уже подразумевается, что слова запроса соединены оператором “И”. Оператор “ИЛИ” указывается явно и имеет больший приоритет, чем “И”.

В ИПС Евфрат все операторы указываются в явном виде, а функция NOT обозначена словом “КРОМЕ”.

Некоторые средства формирования запроса допускают вложенные запросы и позволяют структурировать их, задавая порядок выполнения. Обычно с этой целью применяют круглые скобки. Логические операторы, заключенные в скобки, имеют приоритет при обработке. Например, для вышеописанного случая, запрос:

S2 AND S4 OR (S6 OR (S3 NOT S5)) будет выполняться в следующем порядке:

S3 NOT S5 = {DI,D2,D3,D4,D5,D6,D8,D9}-{D2,D5,D7,D9}= ={DI,D3,D4,D6,D8}

S60R(S3NOTS5)={D4}+{DI,D3,D4,D6,D8}={DI,D3,D4,D6,D8}

S2 AND S4={DI,D7,D8}*{D5,D6,D7,D8,D9}={D7,D8}

{D7,D8} + {DI,D3,D4,D6,D8} = {DI,D3,D4,D6,D7,D8}

При формировании запросов в полнотекстовых базах данных желательно учитывать не только логическую взаимосвязь терминов, но и другие аспекты естественного языка. С этой целью используют различные средства. Например, усечение терминов, нормализацию терминов, операторы контекстного поиска, запрос по образцу.

: 3.0/5 (1787 )

Похожие статьи
1: 
Мебель для сидячей работы
Основная статья - Мебель. Мебель для сидячей работы - тип мебели (по назначению), основным предназначением которого является обеспечение возможности выполнения каких-либо профессиональных рабочих функций ее пользователя с наибольшей функциональностью...
2: 
Лексика с точки зрения её активного и пассивного словарного запаса
Словарный состав языка находится в постоянном движении. Постоянно появляются новые слова, исчезают устаревшие слова, у слов могут возникать новые значения и утрачиваться старые. Закрепление в языке новых слов и значений и уход из языка устаревших сло...
3: 
Слово как единица лексической системы
В лексикологии слова изучаются как единицы номинации, т.к. слово служит для называния предметов и явлений. Слово является не только номинативной единицей, но и когнитивной (познавательной), т.к. выделяет и формирует соответствующие понятия. Слово - д...
4: 
Программное обеспечение
Программное обеспечение является неотъемлемой частью компьютерной вычислительной системы (ВС). Программное обеспечение (ПО) выполняет основные функции управления всеми аппаратными средствами ВС в процессе обработки информации. ПО разделяют на систем....
5: 
Документооборот учреждений. Порядок работы с исходящими и внутренними документами
Движение документов с момента их получения (создания) и до момента завершения их исполнения (отправки или сдачи в дело) образует документооборот организации. Документооборот учреждения предполагает взаимосвязанное и взаимосогласованное движение докум...
Пользователей онлайн: 28
Все права защищены. При копировании материалов ссылка на Book-Science обязательна. (c) Book-Science, 2010-2016