Оперируют со слабоструктурированной информацией, ориентированной на свободный формат документа или текста на его естественном языке. За такими системами закрепился термин информационно-поисковые системы (ИПС).
Основной функцией любой ИПС является информационное обеспечение потребителей на основе выдачи ответов на их запросы, что обеспечивает информационный поиск, под которым понимается совокупность логических и технических операций, имеющих конечной целью нахождение документов или текстов, сведений о них, данных, релевантных информационному запросу потребителя.
Релевантность представляет собой соответствие содержания документа информационному запросу в том виде, в котором он был сформулирован, а полученные документы носят название релевантных.
Информационный поиск в системе производится на основе запроса, выражающего информационную потребность человека, а соответствие содержания документа информационной потребности называется пертинентностью, а полученные документы носят название пертинентных.
Современные информационно-поисковые системы опираются на различные модели представления документов или текстов, такие как:
– Модели, ориентированные на формат документа. Связаны прежде всего со стандартным общим языком разметки документов, который позволяет организовывать информацию, содержащуюся в документах, и представлять ее в некотором стандартном виде.
– Дескрипторные модели. Каждому документу соответствует дескриптор или описатель, который имеет жесткую структуру и описывает документ в соответствии с теми характеристиками, которые требуются для работы с документами. Обработка информации ведется исключительно по дескриптору документа, а не по его содержанию.
– Тезаурусные модели. Основаны на принципе организации словарей, описывающих языковые выражения и взаимодействия между ними. Под тезаурусом понимается иерархическая словарь понятий и отношений между ними, что позволяет представлять исходный текст документа в виде системы этих понятий.
В качестве понятий в тезаурусе встречаются именные и глагольные группы, существительные, прилагательные и отдельные глаголы.