Кузнецов С.В.

Структура и элементы технологии производства публичной базы знаний

Public knowledge base structure & production technology basics

1. Оформление / проектирование базы знаний.

1.1. Общие требования к оформлению базы знаний

1.2. Структура онлайновой базы знаний / обучающей энциклопедии

1.2.1. Тезаурус

1.2.2. Многомерные тематические классификаторы

1.2.3. Индекс "Предприятия"

1.2.4. Индекс "Персоны"

1.2.5. Индекс территорий

1.2.6. Хронологический индекс

1.2.7. Иные поисковые индексы

1.3. Варианты интерфейсов доступа

1.3.1. Диалог на естественном языке

1.3.2. Запрос на естественном языке

1.3.3. Доступ через классификаторы и реестры

1.3.4. Полнотекстовый поиск

1.3.5. Расширенный поиск

1.3.6. Пользовательский интерфейс доступа / поиска

1.3.7. Поисковый сторож

1.4. Особенности генератора отчетов базы знаний

1.4.1. Структура отчета о поиске в базе знаний

1.4.2. Стандартные (неспецифичные) элементы страницы

1.5. Карта сайта (базы знаний)

2. Язык интерфейса и текстов базы знаний

3. Соблюдение авторских прав третьих лиц

4. Отдельные авторские материалы по теме

1. Оформление / проектирование базы знаний.

1.1. Общие требования к оформлению базы знаний

  1. Соответствие промышленным стандартам, в частности,

1.2. Структура онлайновой базы знаний / обучающей энциклопедии (система навигации конкретного интернет-сайта)

1.2.1. Тезаурус (расширенный словарь опорных понятий базы знаний) в форме алфавитного реестра терминов.

Приблизительная структура публичной части отдельной тезаурусной статьи:

Закрытая технологическая часть отдельной статьи тезауруса:

1.2.2. Многомерные тематические классификаторы. Система фасетно-иерархических классификаторов, отражающих интересы целевых групп потребителей.

Классификатор имеет смысл только тогда, когда он в той или иной степени удовлетворяет целевые группы потребителей, иными словами, предоставляет им уникальные и эффективные средства навигации (решение любых проблем в 2-3 касания). Классификатор можно считать минимально удовлетворительным, если при каждом сеансе работы с базой знаний его используют более половины пользователей. Пример целевой группы:

Приблизительная структура публичной части отдельной рубрики (статьи) отдельного тематического классификатора:

Закрытая технологическая часть отдельной рубрики (статьи) тематического классификатора:

1.2.3. Индекс "Предприятия" в форме алфавитного реестра наименований конкретных компаний, упоминающихся на сайте.

Возможная структура публичной части статьи о компании:

Закрытая технологическая часть статьи о компании

1.2.4. Индекс "Персоны" в форме алфавитного реестра инициалов конкретных людей, сгруппированного по первым буквам фамилий.

Возможная структура публичной части статьи о персоне:

Закрытая технологическая часть статьи о персоне

1.2.5. Индекс территорий (континенты, страны, регионы, столицы...) - фасетно-иерархический классификатор географических мест, политического и административного-территориального деления мира и отдельных стран мира.

1.2.6. Хронологический индекс - реестр дат (опубликования автором, опубликования в базе знаний) с разбивкой по годам и по месяцам.

1.2.7. Иные поисковые индексы (товары, услуги, базы данных, сайты, методы и т.п. интересные посетителям основания деления материалов базы знаний)

1.3. Варианты интерфейсов доступа / поиска.

Любой поиск (кроме полнотекстового) в базе знаний по определению результативен за счет выдачи аналитических материалов в случае избытка информации, и автоматического выполнения логического обобщения при ее отсутствии.

1.3.1. Диалог на естественном языке.

Вопрос-ответный интерфейс доступа к базе знаний (через обозреватель Интернет, голосовую линию, wap-терминал...) использует все возможности доступа, кроме полнотекстового поиска, в частности, классификаторы и реестры базы знаний. Диалог на естественном языке не требует компьютера или иного устройства доступа в Интернет и доступен пользователям без компьютерной подготовки.

1.3.2. Запрос на естественном языке

Интерпретатор запросов на естественном языке выполняет автоматическую привязку к имеющимся метаданным (реестры и классификаторы), после чего при необходимости уточняет проблему потребителя в диалоге (вопрос-ответ), и только затем выполняется поиск.

1.3.3. Доступ через классификаторы и реестры

Меню-ориентированный пользовательский интерфейс доступа через классификаторы и реестры позволяет получать  выборки из базы данных, вводя одновременные ограничения по доступным тематическим классификаторам и реестрам.

Диалог на естественном языке, запросы на естественном языке и доступ через классификаторы (метаданные) обеспечивается системой классификаторов базы знаний. Поскольку классификаторы и реестры базы знаний поддерживаются системой полнотекстовых запросов на иностранных языках, появляется возможность предложить пользователю расширить поле поиска за счет

1.3.4. Полнотекстовый поиск

Полнотекстовый поиск использует командный язык запросов и позволяет искать в текстах практически любые текстовые фрагменты.Возможные требования к полнотекстовой поисковой систем см. в спецификации "Технологическая основа базы знаний".

1.3.5. Расширенный поиск

Полнотекстовый поиск с командным языком запросов может быть дополнен возможностью одновременного использования любых перечисленных выше классификаторов и реестров.

1.3.6. Пользовательский интерфейс доступа / поиска

Зарегистрированный потребитель через форму проектирования интерфейсов доступа может скомбинировать описанные выше интерфейсы доступа и/или добавить описание собственного варианта интерфейса (возможно с собственным алгоритмом выборки, обработки и визуализации результатов поиска).

1.3.7. Поисковый сторож

Поисковый сторож (search alert) предназначен для автоматического регулярного исполнения сохраненных заданий зарегистрированных потребителей на формирование выборки новой информации из базы знаний (через любой из перечисленных выше интерфейсов доступа / поиска) с последующей ее обработкой и визуализацией / отправкой потребителю.

1.4. Особенности генератора отчетов базы знаний

1.4.1. Структура отчета о поиске в базе знаний

Возможная структура страницы результатов поиска:

1.4.2. Стандартные (неспецифичные) элементы страницы базы знаний или страницы результатов поиска в базе знаний

В зависимости от IP-адреса посетителя базы знаний содержимое страницы можно варьировать с заданной точностью (город, столица страны или центр территории, республика, графство, область, край, земля...), используя классификаторы территорий.
  1. Панели навигации по конкретному проекту (полное оглавление, карта проекта) и другим проектам.
  2. Тема: автоматически формируемый заголовок и содержательная часть конкретной страницы, например, статьи тезауруса.
  3. Аналитика: автоматически обновляемый блок с аннотациями аналитических статей (обзоров) на языке пользователя, непосредственно связанной с темой конкретной страницы. Сюда же включаются энциклопедические статьи.
  4. Новости: автоматически обновляемый блок аннотаций захватывающих новостей на языке пользователя, непосредственно связанных с темой конкретной страницы.
  5. Положительный опыт: автоматически обновляемый блок с историями успеха и прочей нерекламной информацией о достижениях на языке пользователя, непосредственно связанных с темой конкретной страницы.
  6. Негативный опыт: автоматически обновляемый блок информации на языке пользователя с хроникой катастроф, вкл. экономических, непосредственно связанных с темой конкретной страницы.
  7. Услуги: автоматически обновляемый блок информации на языке пользователя с предложениями разрешения проблем, непосредственно связанных с темой конкретной страницы.
  8. Эксперты: автоматически обновляемый блок информации на языке пользователя с именами авторов лучших решений, публикаций и учебников, консультантов и специалистов по разрешению проблем, резюме, непосредственно связанных с темой конкретной страницы.
  9. Персоны: автоматически обновляемый на языке пользователя реестр имен лиц, упоминаемых в публикациях по теме конкретной страницы.
  10. Предприятия: автоматически обновляемый реестр предприятий, упоминаемых в информации на языке пользователя по теме конкретной страницы.
  11. Территории: автоматически обновляемый реестр географических пунктов и единиц административно-территориального деления, упоминаемых в информации на языке пользователя по теме конкретной страницы.
  12. Власть: автоматически обновляемый реестр органов власти, упоминаемых в информации на языке пользователя по теме конкретной страницы.
  13. Ресурсы: автоматически обновляемый каталог лучших ресурсов Интернет по теме конкретной страницы (базы данных, справочники, энциклопедии, порталы и специализированные сайты с информацией на языке пользователя ...) и web-сервис по поиску дополнительных подходящих открытых источников.
  14. Обучение: автоматически обновляемый блок ссылок в виде каталога публикаций на языке пользователя для самообучения, учебных мероприятий и проблемных материалов - кейсов нарастающей сложности с подробно разобранными решениями. Сюда же можно и нужно включать готовые учебные кейсы (в публичную часть базы знаний - только их начало и конец, или выводы).
  15. Издания: автоматически обновляемый блок книжных новинок на языке пользователя, непосредственно связанных с темой конкретной страницы со ссылками для их заказа через Интернет.
  16. Прочее: автоматически обновляемые блоки уместной информации (вакансии, фотографии, видеозаписи, знакомства, блоги, мероприятия, товары, контекстная реклама...) на языке пользователя, полностью соответствующих теме конкретной страницы.
  17. Классификация: автоматически обновляемый блок кодов классификаторов, полностью соответствующих теме конкретной страницы. В этом блоке также помещаются ссылки на более конкретные темы (рубрики нижнего уровня) и более общие рубрики (верхнего уровня), что позволяет вести поиск с обощением или его конкретизировать.
  18. Подписка на обновления конкретной страницы и/или близкую к теме рассылку.
  19. Ссылки на доступный вариант страницы на всех рабочих языках базы знаний (как минимум на 14 европейских языков, арабский, бенгальский, китайский, корейский, хинди и японский). Если таковых нет, приводятся ссылки на подстрочный перевод страницы с языка оригинала на все рабочие языки базы знаний.
  20. Средства защиты от копирования (как ручного, так и автоматического), просмотра и копирования HTML-кода и автоматического мониторинга изменений (кроме роботов поисковых систем).
  21. Копирайт, дата последнего обновления.

1.5. Карта сайта (базы знаний)

Карта сайта полностью включает в себя именованные ссылки на все пользовательские интерфейсы доступа и статические страницы сайта. Карта сайта готовится на всех языках базы знаний.

2. Язык интерфейса и текстов базы знаний

  1. Если не указано иное, основная документация (в частности, система навигации) первоначально готовится на русском языке. Это не исключает включение в тело статей материалов на английском и других языках потенциальных пользователей.
  2. Если удается привлечь финансирование для производства варианта базы знаний на конкретном иностранном языке или их группе или найти добровольцев - носителей конкретного иностранного языка, проводится найм и обучение персонала. По результату сертификации компетентным специалистам даются полномочия для подготовки и редактирования материалов на конкретном языке в соответствующей папке типа http://www.knowbase.ru/en/
  3. Как вариант, можно рассматривать создание зеркала базы знаний на транслите с русского языка в соответствующей папке типа http://www.knowbase.ru/translit/.
  4. Можно пытаться договориться с производителями систем подстрочного перевода о сотрудничестве при производстве корпоративных баз знаний. В таком случае появляется возможность, с одной стороны, помещать, например, в библиотеке, полные подстрочные переводы материалов, с другой стороны, заказывать официальный и/или литературный перевод.
  5. Внизу каждой страницы базы знаний вешаются ссылки на автоматический перевод страниц базы знаний с языка оригинала на язык потенциальных пользователей базы знаний (как минимум 14 европейских языков + арабский, китайский, корейский и японский).

3. Соблюдение авторских прав третьих лиц

  1. Создание представительной базы знаний только на основе авторских материалов в большинстве случаев невозможно. Например, можно и очень полезно для самообучения вместо или вместе с интересным авторским текстом помещать его реферат или конспект. Хотя, автор плохо себе представляет качество реферата с работ великих мыслителей или допустим, реферат российской конституции..
  2. Многие ценные для конкретной базы знаний публикации в Сети или в традиционных библиотеках могут быть временно или постоянно недоступны по самым разнообразным причинам: от законодательных ограничений и невозможности получить книгу из отдаленной или зарубежной библиотеке по межбиблиотечному абонементу до технических проблем серверов.
  3. Имея ввиду Хартию о сохранении цифрового наследия http://www.ifap.ru/ofdocs/digit.htm и уважая авторские права, ставится проблема легального сохранения ценных материалов в конкретной публичной базе знаний.
  4. Авторские материалы третьих лиц из открытых источников вне раздела "Библиотека" приводятся только в форме автоматически сформированных аннотаций, авторских рефератов, конспектов или фрагментов текста из листингов поисковых машин и баз данных Интернет.
  5. Любая аннотация, реферат, конспект или фрагмент текста вне раздела "Библиотека" сопровождается ссылкой на место первичного (авторского) размещения материалов, по возможности удовлетворяющей стандартам цитирования web-ресурсов..
  6. Полные тексты авторских материалов третьих лиц из открытых источников приемлемого качества, полностью удовлетворяющие стандартам цитирования, сохраняются (резервируются) в общедоступном разделе "Библиотека" на соответствующем домене третьего уровня, например, http://library.5186364.ru. Предпочтительный формат резервирования - Portable Document Format (PDF) компании Adobe. Инструмент резервирования - любая программа конвертирования файлов или потока печати в нередактируемый формат, например, Cute PDF Writer (http://www.cutepdf.com/Products/CutePDF/writer.asp).
  7. Дается ссылка на метапоисковые системы по книжным магазинам (новинки и бывшие в употреблении) для облегчения заказа бумажной копии книги или публикации.
  8. Правила использования общедоступного раздела "Библиотека" детально прописаны с учетом законодательства РФ о библиотечном деле по аналогии с другими онлайновыми библиотекамии.
  9. Резервные копии полных текстов авторских материалов третьих лиц из открытых источников доступны из других разделов базы знаний по ссылкам типа "Если материал недоступен у автора и его хранение явно не запрещено, его библиотечный экземпляр (резервную копию) можно найти в нашей библиотеке".
  10. Любые письменные требования авторов об удалении резервных копий из библиотеки безусловно удовлетворяются.

4. Отдельные авторские материалы по теме:

  1. Кузнецов С.В. Технологии управления, основанного на знаниях // Проблемы теории и практики управления (Москва).- 24.12.2004.- 006.- C.85-89 <http://www.knowbase.ru/technologies-of-knowledge-based-management.htm>

  2. Кузнецов С.В. Технологическая основа базы знаний

  3. Кузнецов С.В. Примеры документирования знаний

  4. Титов В.В. Интерактивный справочник (пример вопрос-ответного доступа к базе знаний)

  5. Кузнецов С.В.. Эскиз проекта создания территориального аналитического центра коллективного пользования с элементами учреждения дополнительного образования и бизнес-инкубатора

  6. Кузнецов С.В. Структура и элементы технологии производства публичной базы знаний

  7. Кузнецов С.В.Открытые технологии образования” в сборнике НИИ образовательных технологий “Научное обеспечение открытого образования”, №, 1, Москва, МЭСИ, 2000. <http://www.u-learning.ru/educatei.htm>

  8. Кузнецов С.В. Практикум "Технологии познания" на основе демонстрационной DOS-версии информационно-поисковой системы "Артефакт", 1999 год.

  9. Кузнецов С.В. Доступ к текстовой информации. В сборнике “Участие библиотек в правовом воспитании населения и юридическом образовании”, СПб., Санкт-Петербургский государственный университет, 1999. <http://www.knowbase.ru/access.htm>.

  10. Кузнецов С.В.Информационные технологии в законопроектной деятельности”, глава 13 в научно-практическом пособии Института законодательства и сравнительного правоведения при Правительстве РФ “Законодательная техника”, М. Городец, 2000 <http://www.lawint.ru/chapt_13.htmlc>.

  11. Кузнецов С.В. “Базы правовых знаний - новое поколение средств доступа граждан к правовой информации через Интернет”, доклад на Международном семинаре - круглом столе под эгидой Совета Европы и Государственной Думы Федерального Собрания Российской Федерации “Кодификация законодательства как средство доступа граждан к правовой информации”, Санкт-Петербург, 9-10 марта 2000 года.

  12. Кузнецов С.В... Отчет "Технология программирования англоязычных запросов любых поисковых систем Интернет для автоматизированного мониторинга информации в соответствии с заданными рубриками Классификатора внешнеполитической деятельности МИД РФ" (Заказ Научно-исследовательского центра информатики при МИД России), сентябрь 2000.
  13. Кузнецов С.В. Отчет "Технология создания персональных следящих информационных систем" (Заказ Научно-исследовательского центра информатики при МИД России), сентябрь 2000. См. пример <http://www.onlineci.ru/cinews.htm>.
  14. Кузнецов С.В. "Техника поиска юридических противоречий", 2004 CD:\2 Avtorskie materialy\22 Metodiki\Poisk protivorehij.pdf <http://www.lawint.ru/lecontra.htm>
  15. Кузнецов С.В. "Технологии управления знаниями", 2004 <http://www.knowbase.ru/knowledge-management-technologies.htm> CD:\2 Avtorskie materialy\21 Publikatii\kmt00001.pdf
  16. Кузнецов С.В.. «Невидимый Интернет для бизнеса», 2006 <http://www.invisibleweb.ru>.

Опубликовано по адресу: http://www.knowbase.ru/public-knowledge-base-structure.htm
Дата последнего редактирования 21.02.2022
© Кузнецов Сергей Валентинович


Сайты (Сергей Кузнецов / Кузнецов С.В.):
Всепроникающее обучение
Исследование рисков и поиск возможностей через Интернет
Невидимый Интернет для бизнеса
Юридические исследования через Интернет
Средства автоматизации веб-поиска:
Мастер поиска
Заполнитель поисковых запросов на основе Мастера
Конструктор поисковых запросов на основе Мастера
Сценарий поиска через Яндекс: Рыночные ниши
Сценарий поиска через Яндекс: Выявление проблем
Сценарий поиска через Яндекс: Определения
Услуги (Сергей Кузнецов / Кузнецов С.В.):
Тематический мониторинг открытых источников
Поиск и мониторинг ниш на рынках
Технологические исследования через Интернет
Очные компьютерные тренинги
Дистанционное обучение
Об авторе: Резюме Сергея Кузнецова
Фотогалерея Сергея Кузнецова
Публикации и работы Сергея Кузнецова
Правила Сергея Кузнецова
Мифы о Сергее Кузнецове
Технологические работы Сергея Кузнецова
В разработке