Введен в действие

Приказом Ростехрегулирования

от 31 октября 2007 г. N 287-ст

 

МЕЖГОСУДАРСТВЕННЫЙ СТАНДАРТ

 

СИСТЕМА СТАНДАРТОВ ПО ИНФОРМАЦИИ,

БИБЛИОТЕЧНОМУ И ИЗДАТЕЛЬСКОМУ ДЕЛУ

 

ТЕЗАУРУС ИНФОРМАЦИОННО-ПОИСКОВЫЙ МНОГОЯЗЫЧНЫЙ

 

СОСТАВ, СТРУКТУРА И ОСНОВНЫЕ ТРЕБОВАНИЯ К ПОСТРОЕНИЮ

 

System of standards on information, librarianship

and publishing. Multilingual thesaurus for information

retrieval. Composition, structure and basic requirements

for development

 

ГОСТ 7.24-2007

 

Группа Т62

 

Предисловие

 

Цели, основные принципы и основной порядок проведения работ по межгосударственной стандартизации установлены ГОСТ 1.0-92 "Межгосударственная система стандартизации. Основные положения" и ГОСТ 1.2-97 "Межгосударственная система стандартизации. Стандарты межгосударственные, правила и рекомендации по межгосударственной стандартизации. Порядок разработки, принятия, применения, обновления и отмены".

 

Сведения о стандарте

 

1. Разработан Всероссийским институтом научной и технической информации Российской академии наук.

2. Внесен Федеральным агентством по техническому регулированию и метрологии.

3. Принят Межгосударственным советом по стандартизации, метрологии и сертификации (Протокол N 31 от 8 июня 2007 г.).

За принятие проголосовали:

 

┌────────────────────┬────────────────────┬───────────────────────────────┐

│Краткое наименование│   Код страны по        Сокращенное наименование  

     страны по      │МК (ИСО 3166) 004-97│      национального органа    

│МК (ИСО 3166) 004-97│                            по стандартизации     

├────────────────────┼────────────────────┼───────────────────────────────┤

│Азербайджан                  AZ         Азстандарт                    

│Армения                      AM         Армстандарт                   

│Беларусь                     BY         │Госстандарт Республики Беларусь│

│Грузия                       GE         Грузстандарт                  

│Кыргызстан                   KG         Кыргызстандарт                

│Молдова                      MD         │Молдова-Стандарт              

│Российская Федерация│         RU         │Федеральное агентство по      

                                        │техническому регулированию    

                                        │и метрологии                  

│Таджикистан                  TJ         Таджикстандарт                

│Туркменистан                 TM         Главгосслужба                 

                                        │"Туркменстандартлары"          

│Узбекистан                   UZ         │Агентство "Узстандарт"        

│Казахстан                    KZ         │Госстандарт Республики        

                                        │Казахстан                     

└────────────────────┴────────────────────┴───────────────────────────────┘

 

4. Настоящий стандарт разработан с учетом основных нормативных положений международного стандарта ИСО 5964:1985 "Документация. Руководство по построению и разработке многоязычных тезаурусов" (ISO 5964:1985 "Guidelines for the establishment and development of multilingual thesauri", IDT).

5. Приказом Федерального агентства по техническому регулированию и метрологии от 31 октября 2007 г. N 287-ст межгосударственный стандарт ГОСТ 7.24-2001 введен в действие в качестве национального стандарта Российской Федерации с 1 июля 2008 г.

6. Взамен ГОСТ 7.24-90.

 

1. Область применения

 

Настоящий стандарт распространяется на многоязычные информационно-поисковые тезаурусы (далее - МИПТ) и устанавливает состав, структуру и основные требования к построению МИПТ, применяемых в информационно-поисковых системах.

 

2. Нормативные ссылки

 

В настоящем стандарте использованы ссылки на следующие межгосударственные стандарты:

ГОСТ 7.25-2001. Система стандартов по информации, библиотечному и издательскому делу. Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления

ГОСТ 7.74-96. Система стандартов по информации, библиотечному и издательскому делу. Информационно-поисковые языки. Термины и определения.

Примечание. При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов по указателю "Национальные стандарты", составленному по состоянию на 1 января текущего года, и по соответствующим информационным указателям, опубликованным в текущем году. Если ссылочный стандарт заменен (изменен), то при пользовании настоящим стандартом следует руководствоваться заменяющим (измененным) стандартом. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, применяется в части, не затрагивающей эту ссылку.

 

3. Термины и определения

 

В настоящем стандарте применены термины по ГОСТ 7.74, а также следующие термины с соответствующими определениями:

3.1. Многоязычный информационно-поисковый тезаурус: информационно-поисковый тезаурус, содержащий лексические единицы, взятые из нескольких естественных языков и представляющий эквивалентные по смыслу понятия на каждом из этих языков.

Примечание. Предназначен для обработки документов (запросов) и информационного поиска с целью обмена информацией на различных естественных языках.

 

3.2. Одноязычный информационно-поисковый тезаурус: информационно-поисковый тезаурус, содержащий лексические единицы, взятые из одного естественного языка.

3.3. Язык-компонент МИПТ: язык, на основе которого разработана какая-либо из одноязычных версий.

3.4. Дескриптор МИПТ: основная лексическая единица МИПТ, представляющая собой совокупность эквивалентных дескрипторов одноязычных версий, связанных средствами для указания эквивалентности.

 

4. Состав и структура тезауруса

 

4.1. Обязательными составными частями МИПТ являются:

- вводная часть;

- алфавитные лексико-семантические указатели, включающие средства для указания эквивалентности дескрипторов одноязычных версий (см. 4.4). Допускается в состав тезауруса вводить систематические, пермутационные, иерархические и другие указатели и списки специальных категорий лексических единиц, а также приложения, содержащие дополнительные сведения о разработке и использовании МИПТ.

4.2. Вводная часть включает титульный лист и введение, составленные согласно ГОСТ 7.25 и изложенные на одном или нескольких языках-компонентах.

На титульном листе следует указывать все языки-компоненты. Рекомендуется наименование тезауруса на титульном листе формулировать на одном языке, а дополнительно к основному титульному листу включать во вводную часть титульные листы на всех языках-компонентах. Введение должно содержать краткое описание методических принципов установления эквивалентности дескрипторов одноязычных версий, а также указание на то, что тезаурус разработан в соответствии с настоящим стандартом. Рекомендуется в состав вводной части включать полный или сокращенный перевод введения на всех языках-компонентах.

4.3. Алфавитный лексико-семантический указатель в каждой из одноязычных версий содержит перечень тезаурусных статей, расположенных в алфавитном порядке заглавных лексических единиц на соответствующем языке-компоненте. Состав и структура тезаурусных статей в лексико-семантических указателях одноязычных версий - по ГОСТ 7.25.

4.4. Средства для указания эквивалентности дескрипторов одноязычных версий реализуются введением в тезаурусную статью кода эквивалентности дескрипторов (идентификационного кода) и (или) эквивалентных дескрипторов на языках-компонентах.

При использовании идентификационных кодов в дополнение к алфавитному лексико-семантическому указателю МИПТ составляют указатель идентификационных кодов, в котором каждому коду приписывают соответствующие дескрипторы одноязычных версий.

4.5. Систематические, иерархические и пермутационные указатели строятся по ГОСТ 7.25 на языках-компонентах и содержат средства для указания эквивалентности дескрипторов одноязычных версий. Примеры использования средств для указания эквивалентности дескрипторов приведены в Приложении А.

4.6. Состав и структура одноязычных версий должны соответствовать следующим требованиям:

- в каждой одноязычной версии должны содержаться все дескрипторы, необходимые для представления онтологии предметной области с целью поиска и обмена информацией между системами, использующими различные языки;

- классы условной эквивалентности лексических единиц одноязычных версий должны соответствовать друг другу по объему выражаемых понятий;

- соответствующие друг другу дескрипторы отдельных одноязычных версий должны иметь по возможности максимально совпадающие парадигматические отношения.

Одноязычные версии допускается дополнять дескрипторами, не являющимися необходимыми для межъязыкового обмена и отсутствующими в других одноязычных версиях; при этом указывают иерархическую подчиненность их какому-либо дескриптору МИПТ.

Одноязычные версии могут включать парадигматические отношения, отсутствующие в других одноязычных версиях, если они на данном языке-компоненте уточняют понятия, выраженные дескриптором МИПТ, и не противоречат его пониманию в других языках-компонентах.

 

5. Основные требования к построению многоязычных

информационно-поисковых тезаурусов

 

5.1. Содержание работ по формированию одноязычных версий определяют наличием или отсутствием одноязычных тезаурусов по данной тематике на языках-компонентах.

5.1.1. При отсутствии одноязычных тезаурусов по данной тематике на языках-компонентах, как правило, сначала создают одну одноязычную версию и на ее основе строят остальные.

Возможна также совместная разработка одновременно всех или нескольких одноязычных версий при взаимном согласовании состава дескрипторов и их парадигматических связей.

5.1.2. При наличии тезауруса по данной тематике на одном из языков-компонентов, как правило, его берут за основу разрабатываемого МИПТ. Другие одноязычные версии формируют подбором эквивалентов дескрипторов этого тезауруса на языках-компонентах. При этом возможны различные степени семантического соответствия эквивалентов дескрипторов на различных языках.

5.1.3. При наличии нескольких исходных тезаурусов по данной тематике на языках-компонентах разработка МИПТ ведется подбором эквивалентных дескрипторов в данных тезаурусах (см. 5.2.1 и 5.2.2). Дескрипторы, не имеющие эквивалентов в отдельных одноязычных версиях, переводят на соответствующие языки и включают в одноязычные версии, в которых этот дескриптор первоначально отсутствовал. При этом следует вносить в исходные тезаурусы изменения, необходимые для согласования одноязычных версий.

5.1.4. Рекомендуется одну из одноязычных версий выбирать в качестве базовой и устанавливать эквивалентность дескрипторов других одноязычных версий по отношению к дескрипторам базовой версии.

5.2. При установлении эквивалентности дескрипторов различных одноязычных версий необходимо различать на разных языках-компонентах следующие степени эквивалентности терминов:

- полная;

- неполная;

- частичная;

- отсутствие эквивалентного термина.

5.2.1. При наличии в языках-компонентах полностью эквивалентных терминов их считают представителями одного дескриптора МИПТ.

5.2.2. При отсутствии в языках-компонентах полных эквивалентов для выражения одного и того же понятия в качестве дескриптора МИПТ в одноязычных версиях используют неполные и частичные эквиваленты.

Неполными эквивалентами являются термины, для которых объемы выражаемых ими понятий пересекаются.

Частичными эквивалентами являются термины, для которых объем понятия, выражаемого одним эквивалентом, входит в объем понятия, выражаемого другим эквивалентом.

5.2.2.1. Если различие в объеме понятий между неполными или частичными эквивалентами несущественно для данного МИПТ, то их можно использовать для представления дескриптора МИПТ в разных одноязычных версиях, например:

ru: АННОТАЦИЯ

fr: RSUM

5.2.2.2. Если различие в объеме понятий между неполными или частичными эквивалентами существенно, то при представлении дескриптора МИПТ в одноязычных версиях значение используемого термина уточняют одним из следующих способов:

- добавлением релятора (см. 5.2.2.3);

- добавлением примечания (см. 5.2.2.4);

- включением термина в уточняющее словосочетание с определяющими словами (см. 5.2.2.5);

- введением условно эквивалентных аскрипторов в тезаурусную статью дескриптора одноязычной версии (см. 5.2.2.6);

- использованием комбинации двух или более терминов (см. 5.2.2.7).

5.2.2.3. Добавление релятора, который является частью дескриптора, применяют в тех случаях, когда для более полного соответствия содержанию дескриптора необходимо ограничивать объем понятия, выражаемого термином, например:

    англ.                      русск.

    TREE                       ДЕРЕВО (РАСТЕНИЕ)

    WOOD (MATERIAL)            ДЕРЕВО (МАТЕРИАЛ)

    WOOD (LANDSCAPE)           ЛЕС (ЛАНДШАФТ)

5.2.2.4. Добавление примечания, которое не является частью дескриптора, используют в случаях уточнения объема понятия, выраженного соответствующими дескрипторами на разных языках-компонентах, например:

    франц.                     русск.

    AFFILIATION                МЕСТО РАБОТЫ (как элемент библиографического

                               описания, обозначающий место работы автора

                               публикации)

5.2.2.5. Включение термина в уточняющее словосочетание применяют в тех случаях, когда требуется ограничивать объем понятия и данное словосочетание устойчиво употребляется в документах, например:

    англ.                      русск.

    CRANE (MACHINE)            ПОДЪЕМНЫЙ КРАН

5.2.2.6. Введение условно эквивалентных аскрипторов в тезаурусную статью дескриптора одноязычной версии применяют в тех случаях, когда они необходимы для однозначного представления понятия в данной версии, например:

    англ.                      русск.

    GRAPH                      ГРАФИК

    UF diagram chart

5.2.2.7. Если исходный дескриптор обозначает понятие, не выраженное в виде единого термина на другом языке-компоненте, то допускается использовать в одноязычной версии в качестве эквивалента комбинацию двух и более дескрипторов одноязычной версии, например:

    франц.                               русск.

    CARTE PERFORE + SELECTION          ПЕРФОКАРТА РУЧНОГО

    MANUELLE                             ОБРАЩЕНИЯ

    REFERER ANALYTIQUE + LABORATION    РЕФЕРИРОВАНИЕ

5.2.3. При отсутствии лексического эквивалента в одном из языков-компонентов допускаются решения, приведенные в 5.2.3.1 - 5.2.3.5.

5.2.3.1. Создание нового термина переводом или калькированием иноязычного дескриптора, например:

    англ.               франц.               русск.

    FIVE-YEAR PLAN      PLAN QUINQUENNAL     ПЯТИЛЕТНИЙ ПЛАН

5.2.3.2. Использование в качестве эквивалента словосочетания, например:

    англ.                      русск.

    CORER                      МАШИНА ДЛЯ УДАЛЕНИЯ СЕРДЦЕВИНЫ ПЛОДА

5.2.3.3. Заимствование иноязычного термина, например:

    англ.                      русск.

    FILE                       ФАЙЛ

5.2.3.4. Использование в качестве эквивалента термина с близким значением, например:

    франц.                     русск.

    OUTILS LINGUISTIQUES       ЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ

    англ.                      русск.

    TEENAGER                   ПОДРОСТОК

5.2.3.5. Использование в качестве эквивалента термина, более широкого по значению и не входящего в лексический состав данной тематической области, например в МИПТ по библиотечному делу:

    франц.                     русск.

    ANIMATEUR                  ОРГАНИЗАТОР КУЛЬТМАССОВОЙ РАБОТЫ

5.3. По окончании разработки МИПТ представляют для регистрации в национальный и/или международный центр ведения информационно-поисковых языков. МИПТ представляют в составе всех его одноязычных версий.

Каждая одноязычная версия МИПТ может быть представлена как одноязычный тезаурус с иноязычными эквивалентами.

Национальные и международные центры ведения информационно-поисковых языков предоставляют заинтересованным лицам сведения о зарегистрированных МИПТ на условиях, определяемых разработчиком.

Форма представления одноязычных версий - по ГОСТ 7.25 и 4.4.

5.4. Процесс ведения МИПТ сводят к ведению его одноязычных версий и к обеспечению их согласованности. Изменения вносят одновременно во все одноязычные версии после их согласования на уровне языков-компонентов.

Рекомендуется не реже чем через пять лет обновлять сведения о МИПТ, зарегистрированных по 5.3.

 

 

 

 

 

Приложение А

(справочное)

 

ПРИМЕРЫ ИСПОЛЬЗОВАНИЯ СРЕДСТВ УКАЗАНИЯ ЭКВИВАЛЕНТНОСТИ

ДЕСКРИПТОРОВ В ОДНОЯЗЫЧНЫХ ВЕРСИЯХ

 

Примеры

    1. Использование цифровых идентификационных кодов, не зависящих

от языка:

    STAA               - дескриптор на польском языке

    086210              - идентификационный код

    а    CHARAKTERYSTYKA

         INDEKS

         MODUL

         STAY

         WSKAZNIK (LICZBA)

 

    2. Использование эквивалентов дескрипторов на другом языке:

    КОНСТАНТА           - дескриптор на русском языке

    STAA              - дескриптор на польском языке

    с    Постоянная

    а    КОЭФФИЦИЕНТ

         МОДУЛЬ

         ПОКАЗАТЕЛЬ

         ХАРАКТЕРИСТИКА

 

    3. Использование эквивалентов дескрипторов на других языках

и идентификационных кодов:

         БЕНЗИНЫ        - дескриптор на русском языке

    fre: ESSENCE MOTEUR - дескриптор на французском языке

    eng: GASOLINE       - дескриптор на английском языке

    pol: BENZYNA        - дескриптор на польском языке

    011420              - идентификационный код

    в    НЕФТЕПРОДУКТЫ СВЕТЛЫЕ

         ТОПЛИВО ЖИДКОЕ

         ТОПЛИВО КАРБЮРАТОРНОЕ

    н    БЕНЗИНЫ АВИАЦИОННЫЕ

         БЕНЗИНЫ АВТОМОБИЛЬНЫЕ

         БЕНЗИНЫ АЛКИЛИРОВАННЫЕ

 

    4. Использование совместного расположения статей на двух языках:

         русский язык             немецкий язык

      АМАЛЬГАМА СЕРЕБРА           SILBERAMALGAM

    в    МЕТАЛЛЫ                  OB METALLE

    н    КУПРОАРКВЕРИТ            UB CUPROARQUERIT

 

 

 


 
© Информационно-справочная онлайн система "Технорма.RU" , 2010.
Бесплатный круглосуточный доступ к любым документам системы.

При полном или частичном использовании любой информации активная гиперссылка на Tehnorma.RU обязательна.


Внимание! Все документы, размещенные на этом сайте, не являются их официальным изданием.
 
Яндекс цитирования