Соглашение о моделировании в проекте Стандартопедия

From Стандартопедия
Jump to navigation Jump to search

Проект Стандартопедия реализуется в три этапа:

  1. создание тезауруса предметных областей;
  2. формирование графа знаний на данных тезауруса;
  3. разработка онтологии машиночитаемого права.

500

Сейчас ведётся работа над тезаурусом, в ближайшее время будет начато формирование графа знаний. Разработка онтологии начнется немного позже.

Здесь вы можете ознакомиться с терминологией проекта, используемой при разработке тезауруса и графа знаний, и с правилами ведения тезауруса.

Этот документ будет уточняться и пополняться.

Терминология

Тезаурус

Тезаурус Стандартопедии - система терминов и норм из различных областей права и стандартизации, их определений и текстов, категорий терминов и норм, соединённых между собой ссылками. Тезаурус Стандартопедии реализован на принципах вики с использованием программного обеспечения MediaWiki, на котором работает Википедия, проект Wikimedia Foundation.

Термин - устойчивое обозначение какой-либо абстрактной или ментальной сущности на естественном языке, имя сущности. Например: Закон. Терминами не являются имена конкретных физических сущностей (например, имена людей, названия организаций). Термины могут собираться в специальных разделах нормативных актов, либо быть распределены по тексту нормативных актов. Кроме того, термины могут содержаться в словарях, справочниках, научных работах, учебниках или методических материалах, либо предлагаться экспертами.

Концепт - идентификация абстрактной или ментальной сущности на естественном языке, не являющаяся термином, то есть представленная кратким описанием, номером или только своим полным текстом. Например: норма, полнотекстовое описание, выделенная по какому-то признаку коллекции терминов и норм. В тезаурусе к концептам относятся нормативные акты и составляющие их отдельные нормы, области регулирования, категории, классификаторы и справочники.

Категория - совокупность терминов и концептов, обладающих общими характеристиками. Категория также является одним из видов концептов.

Подкатегория - совокупность терминов и концептов, обладающих общими характеристиками, которые выделяют их из более широкой категории (надкатегории). Говорят также, что подкатегория входит в надкатегорию.

Определение - описание сущности на естественном языке, позволяющее составить представление об этой сущности, достаточное для выделения её в текстах или в деятельности.

Ссылка - связь, ведущая от фрагмента текста одной вики-страницы к другой вики странице, создаваемая средствами MediaWiki.

Ревизия страницы - версия вики-страницы, сохраняемая MediaWiki в истории изменений страницы.

Норма - концепт, соответствующий правилу поведения, обязательному для неопределенного круга лиц, рассчитанному на неоднократное применение, направленному на урегулирование общественных отношений либо на изменение или прекращение существующих правоотношений.

Нормативный акт - концепт, соответствующий официальному документу, изданному в установленном порядке международной организацией, органом государственной власти, органом местного самоуправления или должностным лицом, и содержащий правовые нормы. Например: Федеральный закон от 21.11.2011 г. № 323-ФЗ. Для работы в Стандартопедии в число нормативных актов могут быть включены стандарты, принимаемые негосударственными организациями.

Редакция нормы или нормативного акта - вариант текста нормы или нормативного акта, предназначенный для прохождения официального этапа жизненного цикла (действующие версии, сформированные проекты, проекты, находящиеся на стадии одобрения, предложения и т.п.). Подготовка редакции нормы или нормативного акта включает подготовку ряда последовательных версий.

Версия нормы или нормативного акта - вариант текста нормы или нормативного акта, появляющийся в процессе разработки определённой редакции нормы или нормативного акта.

Граф знаний

Граф знаний Стандартопедии - семантическая сеть, построенная на данных тезауруса, содержащая сущности (соответствующие терминам и нормам, их категориям) и формальные связи между ними. Граф знаний Стандартопедии реализован с использованием программного обеспечения Wikibase, на котором работает Wikidata, проект Wikimedia Foundation

Сущность - идентифицируемые сущности (абстрактные понятия, нормы или материальные объекты), являющиеся узлами (вершинами) графа знаний. Сущности реализованы как Items в модели данных Wikibase.

Понятие, объект - сущность, представляющая термин или концепт.

Отношение - связь между сущностями, являющаяся ребром графа знаний.

Тип отношения - способ указать, что означат отношение между сущностями, семантику соответствующего отношения. Типы отношений реализованы как Properties в модели данных Wikibase.

Утверждение - совокупность отношений сущности с иными сущностями и данными, формально выражающая определение понятия, его свойства и связи. Утверждениям соответствуют Statements в модели данных Wikibase.

Формула - группа утверждений в графе знаний, часть графа, представляющая формальное описание структуры понятия или нормы.

Логическая связка - класс (множество) типов отношений в графе знаний, использующихся для описания сущностей и составления формул путём конструирования логических выражений (например, соответствующих логическим операциям, описаниям областей определения и областей значений, кардинальностй и т.п.).

Специализация (P26) - тип отношений в графе знаний, связывающих частное с общим. Говорят: 'медицинское обследование' специализирует 'медицинское вмешательство' . Говорят также: является подмножеством.

Генерализация (P57) - тип отношений, связывающих общее с частным, то есть обратный к типу отношений специализация. Например: 'врач' генерализирует 'хирург' .

Типизация - тип отношений в графе знаний, связывающих абстрактную сущность (класс, множество) и представляющие эту сущность (являющиеся его элементами) экземпляры - материальные объекты или (в некоторых случаях) иные абстрактные сущности. Например: 'врач' типизирует человека 'Никола́й Ива́нович Пирогов' .

Экземплификация, инстанцирование (P31) - обратный к типизации тип отношений в графе знаний, связывающих элемент множества (экземпляр класса) с множеством (классом). Например: вирус 'SARS-CoV-2' экземплифицирует семейство 'короновирусы' (это пример того, как экземпляром класса может считаться объект, не являющийся единичным материальным объектом). Говорят также: является примером.

Является частью (P35) - тип отношений состава в графе знаний, связывающих часть сущности с целым, включающим эту часть. Например: 'Статья 36' является частью 'Федерального закона от 21.11.2011 г. № 323-ФЗ'

Является целым для (P25) - тип отношений состава в графе знаний, связывающих сущность с её частью, обратный к типу отношений является частью.

Список, включает элемент списка (P29) - тип отношений, позволяющий связать данную сущность с упорядоченным или неупорядоченным списком иных сущностей, отношение которых к данной сущности указывается отдельным квалификатором.

Онтология

Онтология Стандартопедии - онтология (классы, свойства, правила), отражающая формальную концептуализацию предметной области проекта.

Класс -

Свойство -

Ограничение -

Правило -

Индивид -

Соглашение о ведении тезауруса

Категории

Все термины и концепты тезауруса должны быть отнесены к определённым категориям. Структура категорий в целом и её верхние элементы описаны в настоящем разделе. Принципы образования категорий нижнего уровня и правила отнесения терминов и концептов к категориям описаны в соответствующих разделах Соглашения. Категории тезауруса реализуются средствами категорий вики.

Категории тезауруса образуют упорядоченную решётку (lattice). В решётке категорий одна категория может быть подкатегорией нескольких вышележащих категорий, но эта структура не может зациклиться - никакая категория не может оказаться подкатегорией самой себя.

Структура решётки категорий Стандартопедии отображена на диаграмме ниже. Вершиной структуры категорий является Category:Тезаурус.

На диаграмме указана одна конкретная <Область регулирования> - Здравоохранение. В угловых скобках <...> на диаграмме и ниже в тексте указывается, что должно быть размещено в соответствующей части названия, заголовка, имени.

500

Термины и концепты

1. Источниками терминов и концептов тезауруса могут быть как нормативные акты, так и иные источники (словари, справочники, научные работы, учебники или методические материалы, отдельные предложения экспертов). Определения терминов и концептов могут быть сосредоточены в специальных разделах нормативных актов, но могут и быть распределены по тексту акта.

Термины и концепты в тезаурусе представлены отдельными вики-страницами.

Некоторые концепты тезауруса могут быть представлены страницами с формируемым вручную содержанием, а некоторые - автоматически формируемыми страницами категорий вики. Подробнее создание страниц и категорий для разных видов концептов объясняется ниже.

Термины тезауруса всегда представлены страницами с формируемым вручную содержанием - определениями терминов, за исключением страниц, предназначенных для различения многозначных терминов и терминов с несколькими определениями.

Название страницы термина или концепта (в соответствующих случаях - название категории) должно содержать сам термин или концепт.

  • Для терминов необходимо указывать его в названии в единственном числе.
  • Для концептов, представляющих собой коллекции - необходимо указывать название во множественном числе. В остальных случаях - название в единственном числе.

В некоторых случаях полное название концепта может превысить максимальную допустимую длину строки. В этом случае рекомендуется разумно сокращать название, стараясь сохранить возможность его однозначной идентификации. Полное название концепта должно при этом содержаться на странице концепта.

2. Для каждого термина в обязательном порядке должен быть указан источник (как категория) по следующему шаблону:

  • Для терминов, являющихся элементами списков классификаторов или справочников - категория с именем классификатора: <noinclude>>[[Category:Термины <Классификатора-справочника>]]</noinclude>
  • Для прочих терминов - источник термина по следующему шаблону:
    • либо <noinclude>[[Category:Термины <Нормативного акта>]]</noinclude>
    • либо <noinclude>[[Category:Термины <Иного источника>]]</noinclude>
      • для терминов из иных источников рекомендуется также указание непосредственно на соответствующую <noinclude>[[Category:<Область регулирования>]]</noinclude>, если только сам иной источник не относится к одной и только одной области регулирования.
    • допустимо заводить для указания источника категорию с названием <noinclude>[[Category:Предложение <Эксперт>]]</noinclude>.

Обратите внимание на обязательное использование тэгов <noinclude>...</noinclude>! Они необходимы для предотвращения зацикливания упорядоченной решётки категорий при использовании трансклюзии.

3. Если один и тот же термин термин существует с идентичными определениями в разных нормативных актах, допустимо указание нескольких категорий [[Category:Термины <Нормативного акта>]].

4. Если один и тот же термин существует с разными значениями или просто разными определениями в разных нормативных актах, или даже в разных областях регулирования, или же если для работы с нормативным актом предложены разные определения одного и того же термина, необходимо, в дополнение к описанным выше действиям при внесении термина в тезаурус, выполнить следующее:

  • Название страницы термина составляется из самого термина и указания в скобках источника или авторства по модели.
  • Страницы термина должна содержать ссылку на категорию в виде: [[Category:<Термин>]] (без указания на источник или авторство!).
  • Страница категории [[Category:<Термин>]] должна в свою очередь включать указание на надкатегорию:
    • Если все значения и все определения термина относятся к одной области регулирования - на надкатегорию [[Category:Термины в <Области регулирования>]]
    • Если какие-то значения или определения термина относятся к разным области регулирования - на надкатегорию [[Category:Термины]]

Области регулирования

1. Области регулирования, моделированием которых занимаются в проекте Стандартопедия, представлены автоматически формирующимися вики-страницами категорий. Название категории (название страницы) указывается в единственном числе.

Страница категории может содержать определение соответствующего понятия. Источник используемого определения не может быть указан как категория данной страницы, для избежания циклов в решётке категорий! Источник может быть указан на странице категории как ссылка вида: [[:Category:Термины <нормативного акта>]]

2. Страница категории, представляющей область регулирования, обязательно должна содержать указание на надкатегорию в виде: [[Category:Области регулирования]]

3. Создание новой области регулирования сопровождается созданием набора подкатегорий:

  • [[Category:Термины в <Области регулирования>]]
  • [[Category:Нормативные акты в <Области регулирования>]]
  • [[Category:Нормы в <Области регулирования>]]
  • [[Category:Классификаторы и справочники в <Области регулирования>]]

4. Страницы этих подкатегорий обязательно должны содержать указание на надкатегорию в виде: [[Category:<Область регулирования>]]

5. Для этих подкатегорий обязательно также указание на следующие надкатегории:

  • Для [[Category:Термины в <Области регулирования>]]
    • на надкатегорию [[Category:Термины]]
  • Для [[Category:Нормативные акты в <Области регулирования>]]
    • на надкатегорию [[Category:Нормативные акты и иные источники]]
  • Для [[Category:Нормы в <Области регулирования>]]
    • на надкатегорию [[Category:Нормы]]
  • Для [[Category:Классификаторы и справочники в <Области регулирования>]]
    • на надкатегорию [[Category:Классификаторы и справочники]]

Нормативные акты

1. Нормативные акты, моделированием которых занимаются в проекте Стандартопедия, представлены автоматически формирующимися вики-страницами категорий.

Отдельные категории заводятся для определённых редакций нормативных актов (действующие версии, сформированные проекты, проекты, находящиеся на стадии одобрения, предложения и т.п.). В названии категории (страницы) должно содержаться имя акта и описание редакции: "в действующей редакции от <дата>", или "в редакции внесённого законопроекта от <дата>" или "подготовка поправок к действующей редакции", или "предложение от <имя> <дата>".

В итоге указание категории на относящихся в ней страницах должно выглядит как: [[Category:<Имя акта><описание редакции>]]. Далее так сформированная категория будет указываться просто как [[Category:<Нормативный акт>]]

В некоторых случаях полное официальное название нормативного акта с подробным описанием конкретной редакции может превысить максимальную допустимую длину строки. В этом случае рекомендуется разумно сокращать название, стараясь сохранить указание на тип акта, его заголовок, статус и дату принятия.

Пример:
Решение Совета Евразийской экономической комиссии от 12.02.2016 N 46 "О Правилах регистрации и экспертизы безопасности, качества и эффективности медицинских изделий"
может быть сокращено до
Правила регистрации и экспертизы безопасности, качества и эффективности медицинских изделий в редакции Решения Совета ЕЭК №46 от 12.02.2016

Название должно быть сокращено до такой степени, чтобы его можно было использовать как в названии самой категории нормативного акта, так и в названиях его подкатегорий, перечисленных в пункте 5 ниже.

2. Каждая страница нормативного акта (страница категории) должна при возможности содержать ссылку на соответствующую официальную редакцию нормативного акта (официальную публикацию, размещение в какой-либо системе поддержки нормативной работы).

Если работа над редакцией нормативного акта ведётся в Стандартопедии, то текст редакции может быть сформирован на странице акта из версий страниц отдельных пунктов путём трансклюзии. Трансклюзия переносит на страницу редакции нормативного акта тексты его пунктов, но работа с текстами пунктов на странице самого акта невозможна.

Пример:
Страница действующей редакции ФЗ "Об основах охраны здоровья граждан в Российской Федерации" включает тексты статьи 36-2 путём трансклюзии страницы этих пунктов, перечисленных к категории норм этого закона.

Упорядочивание ссылок на страницы терминов и норм со страницы категории происходит по алфавиту, поэтому желательно соблюдать описанный ниже формат именования страниц норм (номер статьи нормативного акта, номер пункта статьи, без точек).

3. При наличии в Стандартопедии моделей нескольких редакций одного нормативного акта заводится также категория для формирования списка редакций, название которой не содержит указания на редакцию: [[Category:<Нормативный акт>]]. Указание на эту категорию должно быть размещено на всех страницах редакций нормативного акта. Иных подкатегорий или страниц эта категория содержать не должна.

4. Страница категории, представляющей редакцию нормативного акта, обязательно должна содержать указание на надкатегорию [[Category:Нормативные акты в <Области регулирования>]]

5. Начало моделирования или разработки новой редакции нормативного акта сопровождается созданием одной или нескольких из набора подкатегорий (в зависимости от содержания нормативного акта):

  • [[Category:Термины <Нормативного акта>]]
  • [[Category:Нормы <Нормативного акта>]]
  • [[Category:Классификаторы и справочники <Нормативного акта>]]

6. Страницы этих подкатегорий обязательно должны содержать указание на надкатегорию в виде: [[Category:<Нормативный акт>]]

7. Для этих подкатегорий обязательно также указание на следующие надкатегории:

  • Для [[Category:Термины <Нормативного акта>]]
    • на надкатегорию [[Category:Термины в <Области регулирования>]]
  • Для [[Category:Нормы <Нормативного акта>]]
    • на надкатегорию [[Category:Нормы в <Области регулирования>]]
  • Для [[Category:Классификаторы и справочники <Нормативного акта>]]
    • на надкатегорию [[Category:Классификаторы и справочники в <Области регулирования>]]

Нормы

1. Моделирование норм осуществляется на уровне отдельных частей или пунктов статей нормативных актов, реже - на уровне отдельных статей. Отдельный концепт (вики-страница в тезаурусе, содержащая текст нормы), создаётся для каждой редакции пункта, предназначенной для включения в соответствующую редакцию нормативного акта. То есть одному пункту акта могут быть посвящены несколько страниц (страница действующей редакции, страница в редакции поправок на утверждении, страница подготавливаемых поправок, и т.п.). Страницы норм формируются вручную.

Название страницы нормы должно содержать:

  • Номер статьи нормативного акта, номер пункта статьи, без точек, в формате "Статья 36 Пункт 2 ФЗ о ..." (формат важен для обеспечения удобной сортировки норм на других страницах).
  • Название пункта или содержащей его статьи (при наличии, не обязательно)
  • Название нормативного акта
  • Указание на статус редакции - "в действующей редакции от <дата>", или "в редакции внесённого законопроекта от <дата>" или "подготовка поправок к действующей редакции", или "предложение от <имя> <дата>".

(В дальнейшем логическая структура нормы будут моделироваться в графе знаний как формулы, и в онтологии как логические высказывания.)

500

2. Новый концепт и новая страница в тезаурусе создаются в момент принятия решения о моделировании существующей нормы или о разработке новой редакции нормы.

Пример: Статья 36-2 Пункт 2 ФЗ Об основах охраны здоровья граждан в Российской Федерации действующая редакция от 24.04.2020 № 147-ФЗ
Статья 36-2 Пункт 2 ФЗ Об основах охраны здоровья граждан в Российской Федерации редакция законопроекта о телемедицине, новая редакция, разработка которой проведена на основе действующей редакции.

3. Для каждой нормы в обязательном порядке должен быть указан источник (как категория) по следующему шаблону:

  • либо <noinclude>[[Category:Нормы <Нормативного акта>]]</noinclude>
  • либо <noinclude>[[Category:Нормы <Иного источника>]]</noinclude>
    • для норм из иных источников рекомендуется также указание непосредственно на соответствующую <noinclude>[[Category:<Область регулирования>]]</noinclude>, если только сам иной источник не относится к одной и только одной области регулирования
  • допустимо заводить для указания источника категорию с названием <noinclude>[[Category:Предложение <Эксперт>]]</noinclude>.

Обратите внимание на обязательное использование тэгов <noinclude>...</noinclude>! Они необходимы для предотвращения зацикливания упорядоченной решётки категорий при использовании трансклюзии.

4. Работа над текстом определённой редакции нормы происходит на странице соответствующего концепта, версии нормы формируются последовательно как ревизии вики. История изменений доступна как история ревизий страницы концепта.

5. При создании концепта и страницы для новой редакции нормы на эту страницу может быть скопировано содержание предыдущей редакции как первая ревизия, на основе которой начата разработка новой редакции. Может быть использовано расширение Duplicator.

Сравнение версий одной редакции разрабатываемого пункта нормативного акта осуществляется тогда стандартным сопоставлением ревизий страницы, формируемых в вики.

Однако это требование не обязательно, для сопоставления любых версий исходного пункта и разрабатываемого на его основе новой редакции пункта может быть использовано сравнение произвольных ревизий разных страниц, обеспечиваемое вики.

Пример:
Cравнение действующей версии и версии в варианте закона о телемедицине как сравнение разных ревизий разрабатываемой редакции новой нормы: Special:Diff/208/209
Сравнение тех же версий как сравнение ревизий страниц двух разных редакций: https://standartopedia.ru/wiki/index.php?title=Статья_36-2_Пункт_2_ФЗ_Об_основах_охраны_здоровья_граждан_в_Российской_Федерации_редакция_законопроекта_о_телемедицине&type=revision&diff=514&oldid=208

6. Сущности графа знаний связываются со страницами концептов, каждой редакции пункта нормативного акта (действующей редакции, в редакции поправок на утверждении, подготавливаемых поправок, и т.п.) соответствует одна сущность графа знаний. Это позволяет осуществлять навигация от сущности к соответствующей ему редакции текста в тезаурусе.

Пояснение: Эволюция нормы может идти с развилками. Описанный выше подход позволяет организовать параллельную разработку разных редакций. Например, отразить одновременно работу над уточнением редакции-1 и параллельную разработку на основании редакции-1 существенно расширенной редакции-2. При этом необходимо отслеживать, что разработка новой редакции начинается с заведения нового концепта (страницы вики), и что правка вносится в правильную страницу из нескольких с похожими названиями. В то же время при появлении новых концептов и новых соответствующих им сущностей необходимо устанавливать в графе знаний специальные связи между старым сущностями и заменяющим его новым. Это создаёт дополнительные требования к дисциплине разработчиков.

Иные источники и предложения экспертов

1. Источником терминов, определений и норм могут быть не нормативные акты, а словари, справочники, научные работы, учебники или методические материалы, а также отдельные предложения экспертов. Внесение в тезаурус концептов, соответствующих таким источникам проводится аналогично внесению в него нормативных актов. Источники представляются автоматически формирующимися вики-страницами категорий. Название категории (название страницы) указывается в единственном числе. Для иных источников учёта редакций не производится.

В итоге указание категории на относящихся в ней страницах должно выглядит как: [[Category:<Иной источник>]] или [[Category:Предложение <Эксперта>]]. Далее в примерах используется только первый вариант.

2. Каждая страница источника (страница категории) должна при возможности содержать ссылку на соответствующую интернет-страницу (публикацию текста, веб-страницу книги и т.п.).

3. Страница категории, представляющей источник, обязательно должна содержать указание на надкатегории:

  • [[Category:<Область регулирования>]] Это отличает иные источники от нормативных актов, не включаемых непосредственно в такие категории. Для некоторых типов источников универсальные словари, справочники и т.п.) возможно указание на несколько разных областей регулирования.
  • [[Category:Нормативные акты и иные источники]]

4. Создание [[Category:<Иной источник>]] сопровождается созданием одной или нескольких из набора подкатегорий (в зависимости от содержания источника)::

  • [[Category:Термины <Иного источника>]]
  • [[Category:Нормы <Иного источника>]]
  • [[Category:Классификаторы и справочники <Иного источника>]]

5. Страницы этих подкатегорий обязательно должны содержать указание на надкатегорию в виде: [[Category:<Иной источник>]]

6. Для этих категорий обязательно также указание на следующие надкатегории:

  • Для [[Category:Термины <Иного источника>]]
    • на надкатегорию [[Category:Термины в <Области регулирования>]]
  • Для [[Category:Нормы <Иного источника>]]
    • на надкатегорию [[Category:Нормы в <Области регулирования>]]
  • Для [[Category:Классификаторы и справочники <Иного источника>]]
    • на надкатегорию [[Category:Классификаторы и справочники в <Области регулирования>]]

При этом для некоторых типов источников универсальные словари, справочники и т.п.) возможно указание на такие категории из нескольких разных областей регулирования.

Ссылки

В тезаурусе ссылки используются для указания связей между терминами и концептами тезауруса. Ссылки ведут от упоминаний терминов и концептов в текстах определений или норм к страницам, соответствующим упомянутым концептам или нормам. Ссылки реализуются как связи в вики.

Соглашение о графе знаний

Порядок отображения свойств на странице элемента определятся списком свойств MediaWiki:Wikibase-SortedProperties