1.1. Общие требования к оформлению базы знаний
1.2. Структура онлайновой базы знаний / обучающей энциклопедии
1.2.1. Тезаурус
1.2.2. Многомерные тематические классификаторы
1.2.3. Индекс "Предприятия"
1.2.4. Индекс "Персоны"
1.2.5. Индекс территорий
1.2.6. Хронологический индекс
1.2.7. Иные поисковые индексы
1.3. Варианты интерфейсов доступа
1.3.1. Диалог на естественном языке
1.3.2. Запрос на естественном языке
1.3.3. Доступ через классификаторы и реестры
1.3.4. Полнотекстовый поиск
1.3.5. Расширенный поиск
1.3.6. Пользовательский интерфейс доступа / поиска
1.3.7. Поисковый сторож
1.4. Особенности генератора отчетов базы знаний
1.4.1. Структура отчета о поиске в базе знаний
1.4.2. Стандартные (неспецифичные) элементы страницы
1.5. Карта сайта (базы знаний)
4. Отдельные авторские материалы по теме
1.2.1. Тезаурус (расширенный словарь опорных понятий базы знаний) в форме алфавитного реестра терминов.
Приблизительная структура публичной части отдельной тезаурусной статьи:
- Дескриптор (название понятия)
- Эквиваленты на всех рабочих языках базы знаний
- Рабочее определение термина на всех рабочих языках базы знаний, используемое в базе знаний
- Ссылки на другие тезаурусы (включая многоязычные), в которых дескриптор или его эквиваленты на иностранных языках используются в заголовках статей
- Близкие понятия, синонимы и сильно связанные термины (горизонтальные связи и ассоциации)
- Обобщенные (родовые) понятия (связи снизу-вверх)
- Подчиненные (видовые) понятия (связи сверху-вниз)
- Ортогональные (противоположные) понятия (связи отрицания)
- Обновляемый блок с определениями термина из открытых источников на русском, английском и иных рабочих языках проекта
- Иные стандартные элементы страницы
Закрытая технологическая часть отдельной статьи тезауруса:
- Реестр базы данных определений терминов и соответствующих метапоисковых серверов
- Реестр адресов страниц результатов поиска и поисковые запросы для обновления блока "Новости о понятии".
- Реестр адресов страниц результатов поиска и поисковые запросы для обновления блока "Аналитика о понятии".
- Реестр терминов и фразеологических оборотов, являющихся полными синонимами дескриптора
- Реестр терминов и фразеологических оборотов, являющихся полными антонимами дескриптора
- Все подходящие фрагменты текста (в учетом словоизменений), требующие навешивания ссылок на тезаурусную статью (для разметки текстов базы знаний) + шаблоны прикладной программы поиска-замены для пакетного (автоматизированного) навешивания ссылок на тезаурусную статью во всех фрагментах текстов, помещаемых в базу знаний.
- Средства автоматического построения полного перечня статей, из которых есть ссылки на тезаурусную статью.
1.2.2. Многомерные тематические классификаторы. Система фасетно-иерархических классификаторов, отражающих интересы целевых групп потребителей.
Классификатор имеет смысл только тогда, когда он в той или иной степени удовлетворяет целевые группы потребителей, иными словами, предоставляет им уникальные и эффективные средства навигации (решение любых проблем в 2-3 касания). Классификатор можно считать минимально удовлетворительным, если при каждом сеансе работы с базой знаний его используют более половины пользователей. Пример целевой группы:
- владельцы бизнеса
- первые руководители
- директора по развитию (стратегии)
- директора по персоналу
- директора корпоративных университетов
- директора по управлению знаниями
- директора по экономической безопасности
- аналитики и референты руководителей
Приблизительная структура публичной части отдельной рубрики (статьи) отдельного тематического классификатора:
- Классификационный код: код классификатора + код рубрики этого классификатора (десятичный, типа УДК)
- Дескриптор (название понятия) со ссылкой на тезаурус базы знаний или заголовок темы
- Ссылки на близкие рубрики иных классификаторовв (горизонтальные связи) и их коды
- Обобщенные (родовые) ситуации (связи вверх) и их коды
- Подчиненные (видовые) ситуации (связи вниз) и их коды
- Иные стандартные элементы страницы
Закрытая технологическая часть отдельной рубрики (статьи) тематического классификатора:
- Реестр адресов страниц результатов поиска по заданной рубрике классификатора + поисковые запросы для автоматического обновления блока "Аналитика".
- Реестр адресов страниц результатов поиска по заданной рубрике классификатора + поисковые запросы для автоматического обновления блока "Новости".
- Все подходящие фрагменты текста (в учетом словоизменений), требующие навешивания ссылок на статью тематического классификатора (метаданные) + шаблоны программы поиска-замены для пакетного навешивания ссылок на статью тематического классификатора во всех фрагментах текстов, помещаемых в базу знаний.
- Средства автоматического построения полного перечня статей, из которых есть ссылки на статью тематического классификатора.
1.2.3. Индекс "Предприятия" в форме алфавитного реестра наименований конкретных компаний, упоминающихся на сайте.
Возможная структура публичной части статьи о компании:
- Название и иные установочные данные компании
- Элементы досье на предприятие
- Иные стандартные элементы страницы
Закрытая технологическая часть статьи о компании
- Реестр баз данных с регистрационной и иной официальной информацией о предприятии.
- Реестр адресов страниц результатов поиска по предприятию + поисковые запросы для автоматического обновления блока "Аналитика о предприятии".
- Реестр адресов страниц результатов поиска новостей по предприятию + поисковые запросы для автоматического обновления блока "Новости предприятия".
- Все подходящие фрагменты текста (в учетом словоизменений), требующие навешивания ссылок на статью о предприятии (метаданные) + шаблоны программы поиска-замены для пакетного навешивания ссылок на статью о предприятии во всех фрагментах текстов, помещаемых в базу знаний.
- Средства автоматического построения полного перечня статей, из которых есть ссылки на статью о предприятии.
1.2.4. Индекс "Персоны" в форме алфавитного реестра инициалов конкретных людей, сгруппированного по первым буквам фамилий.
Возможная структура публичной части статьи о персоне:
- Инициалы и иные установочные персоны.
- Элементы досье на персону
- Иные стандартные элементы страницы
Закрытая технологическая часть статьи о персоне
- Реестр баз данных с информацией о персоне.
- Реестр адресов страниц результатов поиска по персоне + поисковые запросы для автоматического обновления блока "Аналитика о персоне".
- Реестр адресов страниц результатов поиска новостей о персоне + поисковые запросы для автоматического обновления блока "Новости о персоне".
- Все подходящие фрагменты текста (в учетом словоизменений), требующие навешивания ссылок на статью о персоне (метаданные) + шаблоны программы поиска-замены для пакетного навешивания ссылок на статью о персоне во всех фрагментах текстов, помещаемых в базу знаний.
- Средства автоматического построения полного перечня статей, из которых есть ссылки на статью о персоне.
1.2.5. Индекс территорий (континенты, страны, регионы, столицы...) - фасетно-иерархический классификатор географических мест, политического и административного-территориального деления мира и отдельных стран мира.
1.2.6. Хронологический индекс - реестр дат (опубликования автором, опубликования в базе знаний) с разбивкой по годам и по месяцам.
1.2.7. Иные поисковые индексы (товары, услуги, базы данных, сайты, методы и т.п. интересные посетителям основания деления материалов базы знаний)
Любой поиск (кроме полнотекстового) в базе знаний по определению результативен за счет выдачи аналитических материалов в случае избытка информации, и автоматического выполнения логического обобщения при ее отсутствии.
Вопрос-ответный интерфейс доступа к базе знаний (через обозреватель Интернет, голосовую линию, wap-терминал...) использует все возможности доступа, кроме полнотекстового поиска, в частности, классификаторы и реестры базы знаний. Диалог на естественном языке не требует компьютера или иного устройства доступа в Интернет и доступен пользователям без компьютерной подготовки.
1.3.2. Запрос на естественном языке
Интерпретатор запросов на естественном языке выполняет автоматическую привязку к имеющимся метаданным (реестры и классификаторы), после чего при необходимости уточняет проблему потребителя в диалоге (вопрос-ответ), и только затем выполняется поиск.
1.3.3. Доступ через классификаторы и реестры
Меню-ориентированный пользовательский интерфейс доступа через классификаторы и реестры позволяет получать выборки из базы данных, вводя одновременные ограничения по доступным тематическим классификаторам и реестрам.
Диалог на естественном языке, запросы на естественном языке и доступ через классификаторы (метаданные) обеспечивается системой классификаторов базы знаний. Поскольку классификаторы и реестры базы знаний поддерживаются системой полнотекстовых запросов на иностранных языках, появляется возможность предложить пользователю расширить поле поиска за счет
- текстов на иностранных языках (с переводом "на лету" на язык пользователя)
- параллельного опроса внешних открытых источников, в том числе на иностранных языках (функция "метапоиск по открытым источникам")
Полнотекстовый поиск использует командный язык запросов и позволяет искать в текстах практически любые текстовые фрагменты.Возможные требования к полнотекстовой поисковой систем см. в спецификации "Технологическая основа базы знаний".
Полнотекстовый поиск с командным языком запросов может быть дополнен возможностью одновременного использования любых перечисленных выше классификаторов и реестров.
1.3.6. Пользовательский интерфейс доступа / поиска
Зарегистрированный потребитель через форму проектирования интерфейсов доступа может скомбинировать описанные выше интерфейсы доступа и/или добавить описание собственного варианта интерфейса (возможно с собственным алгоритмом выборки, обработки и визуализации результатов поиска).
Поисковый сторож (search alert) предназначен для автоматического регулярного исполнения сохраненных заданий зарегистрированных потребителей на формирование выборки новой информации из базы знаний (через любой из перечисленных выше интерфейсов доступа / поиска) с последующей ее обработкой и визуализацией / отправкой потребителю.
1.4.1. Структура отчета о поиске в базе знаний
Возможная структура страницы результатов поиска:
- реестр материалов, полностью удовлетворяющих запросу (с разбивкой: аналитика, новости и прочее...);
- при избыточности материалов по проблеме потребителя в первую очередь выдается аналитика (продуктивность даже бесплатного поиска гарантирована!);
- при отсутствии материалов о проблеме потребителя автоматически проводится логическое обобщение (вариант безуспешного поиска исключен!), а также предлагается воспользоваться сервисом "корпоративный метапоиск"
- при избытке материалов по проблеме потребителя (более 30) автоматически проводится выдача только аналитических материалов (вариант безбрежности моря результатов поиска исключен!);
- реестр терминов тезауруса, чаще всего встречающихся в найденных материалах (с возможность уточнения результатов поиска по любому термину или их совокупности);
- реестр метаданных из материалов, удовлетворяющих запросу (по всем реестрам и классификаторам, с возможность уточнения результатов поиска по любому метаданному или их комбинации);
- реестр материалов, имеющих сходную совокупность метаданных (тематически близкие материалы);
- реестр связанных популярных материалов, которые чаще всего посещали другие пользователи в других аналогичных сеансах работы с базой знаний;
- реестр материалов, которые чаще всего искал авторизованный пользователь в прошлых сеансах работы с базой знаний (режим взаимного обучения).
1.4.2. Стандартные (неспецифичные) элементы страницы базы знаний или страницы результатов поиска в базе знаний
В зависимости от IP-адреса посетителя базы знаний содержимое страницы можно варьировать с заданной точностью (город, столица страны или центр территории, республика, графство, область, край, земля...), используя классификаторы территорий.
- Панели навигации по конкретному проекту (полное оглавление, карта проекта) и другим проектам.
- Тема: автоматически формируемый заголовок и содержательная часть конкретной страницы, например, статьи тезауруса.
- Аналитика: автоматически обновляемый блок с аннотациями аналитических статей (обзоров) на языке пользователя, непосредственно связанной с темой конкретной страницы. Сюда же включаются энциклопедические статьи.
- Новости: автоматически обновляемый блок аннотаций захватывающих новостей на языке пользователя, непосредственно связанных с темой конкретной страницы.
- Положительный опыт: автоматически обновляемый блок с историями успеха и прочей нерекламной информацией о достижениях на языке пользователя, непосредственно связанных с темой конкретной страницы.
- Негативный опыт: автоматически обновляемый блок информации на языке пользователя с хроникой катастроф, вкл. экономических, непосредственно связанных с темой конкретной страницы.
- Услуги: автоматически обновляемый блок информации на языке пользователя с предложениями разрешения проблем, непосредственно связанных с темой конкретной страницы.
- Эксперты: автоматически обновляемый блок информации на языке пользователя с именами авторов лучших решений, публикаций и учебников, консультантов и специалистов по разрешению проблем, резюме, непосредственно связанных с темой конкретной страницы.
- Персоны: автоматически обновляемый на языке пользователя реестр имен лиц, упоминаемых в публикациях по теме конкретной страницы.
- Предприятия: автоматически обновляемый реестр предприятий, упоминаемых в информации на языке пользователя по теме конкретной страницы.
- Территории: автоматически обновляемый реестр географических пунктов и единиц административно-территориального деления, упоминаемых в информации на языке пользователя по теме конкретной страницы.
- Власть: автоматически обновляемый реестр органов власти, упоминаемых в информации на языке пользователя по теме конкретной страницы.
- Ресурсы: автоматически обновляемый каталог лучших ресурсов Интернет по теме конкретной страницы (базы данных, справочники, энциклопедии, порталы и специализированные сайты с информацией на языке пользователя ...) и web-сервис по поиску дополнительных подходящих открытых источников.
- Обучение: автоматически обновляемый блок ссылок в виде каталога публикаций на языке пользователя для самообучения, учебных мероприятий и проблемных материалов - кейсов нарастающей сложности с подробно разобранными решениями. Сюда же можно и нужно включать готовые учебные кейсы (в публичную часть базы знаний - только их начало и конец, или выводы).
- Издания: автоматически обновляемый блок книжных новинок на языке пользователя, непосредственно связанных с темой конкретной страницы со ссылками для их заказа через Интернет.
- Прочее: автоматически обновляемые блоки уместной информации (вакансии, фотографии, видеозаписи, знакомства, блоги, мероприятия, товары, контекстная реклама...) на языке пользователя, полностью соответствующих теме конкретной страницы.
- Классификация: автоматически обновляемый блок кодов классификаторов, полностью соответствующих теме конкретной страницы. В этом блоке также помещаются ссылки на более конкретные темы (рубрики нижнего уровня) и более общие рубрики (верхнего уровня), что позволяет вести поиск с обощением или его конкретизировать.
- Подписка на обновления конкретной страницы и/или близкую к теме рассылку.
- Ссылки на доступный вариант страницы на всех рабочих языках базы знаний (как минимум на 14 европейских языков, арабский, бенгальский, китайский, корейский, хинди и японский). Если таковых нет, приводятся ссылки на подстрочный перевод страницы с языка оригинала на все рабочие языки базы знаний.
- Средства защиты от копирования (как ручного, так и автоматического), просмотра и копирования HTML-кода и автоматического мониторинга изменений (кроме роботов поисковых систем).
- Копирайт, дата последнего обновления.
Карта сайта полностью включает в себя именованные ссылки на все пользовательские интерфейсы доступа и статические страницы сайта. Карта сайта готовится на всех языках базы знаний.
- Если не указано иное, основная документация (в частности, система навигации) первоначально готовится на русском языке. Это не исключает включение в тело статей материалов на английском и других языках потенциальных пользователей.
- Если удается привлечь финансирование для производства варианта базы знаний на конкретном иностранном языке или их группе или найти добровольцев - носителей конкретного иностранного языка, проводится найм и обучение персонала. По результату сертификации компетентным специалистам даются полномочия для подготовки и редактирования материалов на конкретном языке в соответствующей папке типа http://www.knowbase.ru/en/
- Как вариант, можно рассматривать создание зеркала базы знаний на транслите с русского языка в соответствующей папке типа http://www.knowbase.ru/translit/.
- Можно пытаться договориться с производителями систем подстрочного перевода о сотрудничестве при производстве корпоративных баз знаний. В таком случае появляется возможность, с одной стороны, помещать, например, в библиотеке, полные подстрочные переводы материалов, с другой стороны, заказывать официальный и/или литературный перевод.
- Внизу каждой страницы базы знаний вешаются ссылки на автоматический перевод страниц базы знаний с языка оригинала на язык потенциальных пользователей базы знаний (как минимум 14 европейских языков + арабский, китайский, корейский и японский).
- Создание представительной базы знаний только на основе авторских материалов в большинстве случаев невозможно. Например, можно и очень полезно для самообучения вместо или вместе с интересным авторским текстом помещать его реферат или конспект. Хотя, автор плохо себе представляет качество реферата с работ великих мыслителей или допустим, реферат российской конституции..
- Многие ценные для конкретной базы знаний публикации в Сети или в традиционных библиотеках могут быть временно или постоянно недоступны по самым разнообразным причинам: от законодательных ограничений и невозможности получить книгу из отдаленной или зарубежной библиотеке по межбиблиотечному абонементу до технических проблем серверов.
- Имея ввиду Хартию о сохранении цифрового наследия http://www.ifap.ru/ofdocs/digit.htm и уважая авторские права, ставится проблема легального сохранения ценных материалов в конкретной публичной базе знаний.
- Авторские материалы третьих лиц из открытых источников вне раздела "Библиотека" приводятся только в форме автоматически сформированных аннотаций, авторских рефератов, конспектов или фрагментов текста из листингов поисковых машин и баз данных Интернет.
- Любая аннотация, реферат, конспект или фрагмент текста вне раздела "Библиотека" сопровождается ссылкой на место первичного (авторского) размещения материалов, по возможности удовлетворяющей стандартам цитирования web-ресурсов..
- Полные тексты авторских материалов третьих лиц из открытых источников приемлемого качества, полностью удовлетворяющие стандартам цитирования, сохраняются (резервируются) в общедоступном разделе "Библиотека" на соответствующем домене третьего уровня, например, http://library.5186364.ru. Предпочтительный формат резервирования - Portable Document Format (PDF) компании Adobe. Инструмент резервирования - любая программа конвертирования файлов или потока печати в нередактируемый формат, например, Cute PDF Writer (http://www.cutepdf.com/Products/CutePDF/writer.asp).
- Дается ссылка на метапоисковые системы по книжным магазинам (новинки и бывшие в употреблении) для облегчения заказа бумажной копии книги или публикации.
- Правила использования общедоступного раздела "Библиотека" детально прописаны с учетом законодательства РФ о библиотечном деле по аналогии с другими онлайновыми библиотекамии.
- Резервные копии полных текстов авторских материалов третьих лиц из открытых источников доступны из других разделов базы знаний по ссылкам типа "Если материал недоступен у автора и его хранение явно не запрещено, его библиотечный экземпляр (резервную копию) можно найти в нашей библиотеке".
- Любые письменные требования авторов об удалении резервных копий из библиотеки безусловно удовлетворяются.
Кузнецов С.В. Технологии управления, основанного на знаниях // Проблемы теории и практики управления (Москва).- 24.12.2004.- 006.- C.85-89 <http://www.knowbase.ru/technologies-of-knowledge-based-management.htm>
Титов В.В. Интерактивный справочник (пример вопрос-ответного доступа к базе знаний)
Кузнецов С.В.. Эскиз проекта создания территориального аналитического центра коллективного пользования с элементами учреждения дополнительного образования и бизнес-инкубатора
Кузнецов С.В. Структура и элементы технологии производства публичной базы знаний
Кузнецов С.В. “Открытые технологии образования” в сборнике НИИ образовательных технологий “Научное обеспечение открытого образования”, №, 1, Москва, МЭСИ, 2000. <http://www.u-learning.ru/educatei.htm>
Кузнецов С.В. Практикум "Технологии познания" на основе демонстрационной DOS-версии информационно-поисковой системы "Артефакт", 1999 год.
Кузнецов С.В. Доступ к текстовой информации. В сборнике “Участие библиотек в правовом воспитании населения и юридическом образовании”, СПб., Санкт-Петербургский государственный университет, 1999. <http://www.knowbase.ru/access.htm>.
Кузнецов С.В. “Информационные технологии в законопроектной деятельности”, глава 13 в научно-практическом пособии Института законодательства и сравнительного правоведения при Правительстве РФ “Законодательная техника”, М. Городец, 2000 <http://www.lawint.ru/chapt_13.htmlc>.
Кузнецов С.В. “Базы правовых знаний - новое поколение средств доступа граждан к правовой информации через Интернет”, доклад на Международном семинаре - круглом столе под эгидой Совета Европы и Государственной Думы Федерального Собрания Российской Федерации “Кодификация законодательства как средство доступа граждан к правовой информации”, Санкт-Петербург, 9-10 марта 2000 года.
Опубликовано по адресу: http://www.knowbase.ru/public-knowledge-base-structure.htm
Дата последнего редактирования 21.02.2022
© Кузнецов Сергей Валентинович