Типы и виды ИПЯ. В основу классификации ИПЯ положены три признака: способ задания лексических единиц, способ кодирования (сочетания) лексических единиц и способ учета парадигматических отношений. Принимается во внимание и возможность автоматизированного поиска.
По способу задания лексических единиц выделяют контролируемые (лексика задается заранее с помощью словарей и таблиц) и неконтролируемые (лексика строится на основе выбора неограниченного множества терминов естественного языка из индексируемых сообщений) ИПЯ.
По координации лексических единиц ИПЯ делятся на некоординируемые и координируемые. Некоординируемые ИПЯ – языки, не допускающие координации своих лексических единиц ни в процессе индексирования, ни в процессе поиска. Координируемые ИПЯ (предкоординируемые и посткоординируемые) – языки, в которых лексические единицы координируются между собой или в процессе индексирования, или в процессе поиска.
С учетом и без учета парадигматических отношений ИПЯ бывают иерархические, фасетные и неиерархические.
Языки неиерархической структуры являются продуктом эмпирического подхода к построению ИПЯ, который предполагает создание языка на основе индексирования реальных текстов. К специальным неиерархическим ИПЯ с учетом сильных и слабых парадигматических отношений относится дескрипторный язык.
Дескрипторный язык – искусственный язык посткоординатного типа, построенный на базе формализованной лексики естественного языка. Каждый конкретный ИПЯ отражает систему понятий предметной области знания в виде структурированной совокупности терминов.
Дескрипторный язык составляет основу технологии полнотекстового поиска, которая является неотъемлемой составляющей систем управления документами, технологии групповой работы над документами, технологии поиска в сетях интернет/интранет, например такой известной распределенной системы как World Wide Web (WWW).
Материалы на данной страницы взяты из открытых источников либо размещены пользователем в соответствии с договором-офертой сайта. Вы можете сообщить о нарушении.