Информационные технологии управления знаниями

Гаврилова Т. А., Кудрявцев Д. В.

Рассматривая управление знаниями (УЗ) как совокупность процессов, которые управляют созданием, распространением, обработкой и использованием информации внутри предприятия [Джанетто, Уилер, 2005], мы сразу принимаем междисциплинрность и многоаспектность данного понятия. В данной статье будет кратко обсуждаться новые информационные технологии, помогающие организовать современную систему УЗ (СУЗ) на предприятии.

1. Введение и некоторые классификации

Размытая трактовка понятия «знания», которое используется в УЗ крайне свободно и широко (см. статью про инженерию знаний), требует уточнения. В СУЗ знаниями называют все виды информации, включая неструктурированный контент (письма, эскизы, фото), данные (в базах данных и хранилищах данных), и знания (как закономерности предметной области, позволяющие специалистам решать свои задачи). Подробнее об этом в статье про инженерию знаний.

Обмен и передача знаний в рамках одной организации обычно принимают форму создания баз знаний, обеспечивающих накопление и повторное использование знаний [Циперман, 2005, Haghi, 2005]. Передача знаний и опыта между организациями формирует рынок знаний, для ориентации в котором создаются соответствующие инструменты [Abecker, van Elst, 2003].

Таким образом, ресурсы знаний в широком смысле могут находиться в различных местах — в базах данных, базах знаний, картотечных блоках, у специалистов — и рассредоточены по всему предприятию.

Существуют различные классификации технологий УЗ [Marwick, 2001; Мильнер и др., 2006; Davies et al, 2005], например, в [Гаврилова, 2008], все инструменты СУЗ разбиты на 7 классов:

Анализ имеющейся в компании информации,

Извлечение, структурирование и формализация знаний (иначе, инженерия знаний),

Обмен и использование знаний,

Поиск информации по запросу,

Организация хранения,

Обучение, .

Интегрированные системы обработки, объединяющие вышеперечисленные функции.

Ценность данной классификации в охвате и представлении единого взгляда на весь комплекс задач управления знаний. Однако, если попытаться шире взглянуть на все многообразие средств УЗ, можно опереться на отчеты известной Gartner Group (http://gartner.com/). Среди многообразия програмных продуктов Gartner выделяет три категории, которые полностью поддерживают решение задач УЗ:

А. Технологии доступа к информации (Information Access Technology) [Andrews, 2007].

В. Совместная работа и социально-ориентированное ПО (Collaboration and Social Software) [Dracos, 2007].

С. Системы управления контентом (Enterprise Content Management), которую также можно рассматривать как инфраструктуру для представленных выше групп

Две первые категории соответствуют 2-м различным взглядам на знание [van Engers, 2001; Abecker and van Elst, 2003]:

1. Знание как «запас». Согласно этому подходу, знание – это актив, продукт, который может существовать независимо от человека и управление которым подобно управлению любыми другими ресурсами.

2. Знание как «поток». В таком подходе знание не может передаваться как некий объект, поскольку в формирование знания вносит существенный вклад человек-участник процесса передачи. Данный взгляд объясняется тем, что знание – результат интерпретации информации в определенном контексте. Знание не передается, а воссоздается в мозгу человека при получении информации в соответствии с исходными знаниями, опытом, ценностями и ожиданиями.

На практике оба взгляда часто сочетаются.

2. Лидеры программных средств для управления знаниями

Рассмотрим некоторых типичных представителей и функциональные возможности программных средств, относящихся к сформированным категориям.

Категория А. «Технологии доступа к информации».

Что включает понятие доступа? Конечно, в первую очередь - поиск по ключевым словам и сложные запросы (например: «Найти все отчеты отдела маркетинга, которые писал Иванов?”). Также важен поиск с использованием классификации (или таксономии) документов по группам.

Некоторые программы могут сами аннотировать любого входнй документ и строить автоматическаи классификации по текстам документов.

Лидерами в данной категории в соответствие с [Andrews, 2007] являются продукты компаний Autonomy (IDOL™ Server), Fast Search&Transfer (FAST ESP, Convera RetrievalWare), Endeca, IBM.

Категория В. «Совместная работа групп и социально-ориентированное ПО».

Эти программные продукты поддерживают коммуникации (мгновенные сообщения, почту, IP-телефонию, видео-конференции) и предоставляют единую виртуальную рабочую среду, включающую wiki (термин описандалее), совместную работу с документами, рабочие доски и пр.. Так можно организовать совместную разработку отчета в едином пространстве, выделив сообщество участников, или организовать коллективное обсуждение корпоративного праздника. Программы этой категории создают персональные профили сотрудников с описанием интересов, компетенции, опыта работ и т.п., а также каталоги экспертов.

Лидерами в данной группе являются продукты компаний BEA (BEA Aqualogic), SpikeSource (SuiteTwo), Socialtext (Socialtext), IBM и Microsoft[Dracos, 2007].

Категория С. «Системы управления контентом (Enterprise Content Management)»

Эта группа программ включает различные иструменты для гибкой и надежной работы с документами, например, регистрацию, управление версиями, безопасность, сканирование и распознавание. Также сюда относят создание архивов, наполнение, обновление и структурирование содержимого сайтов, организация взаимодействия с посетителями сайтов.

Лидерами в данной категории в соответствие с [Shegda et al, 2007] являются продукты компаний IBM (Content Manager, Filenet P8), EMC (EMC Documentum), Opentext (Livelink ECM 10).

Основными поставщиками интегрированных решений для разработчиков программных средств управления знаниями являются компании IBM, EMC, Opentext и Microsoft. Эти компании стараются покрыть функциональными возможностями своих программных продуктов весь комплекс задач управления знаниями. Компания IBM занимает лидирующие позиции во многих классах программных продуктов, поэтому далее будет детально рассмотрена ее продуктовая линейка.

Определение состава продуктов для управления знаниями проводилось с учетом [Богданова Е., 2006; Бизнес в паутине социальных сетей, 2007; Дёрре И. и др., 2007; IBM 208; IBM OmniFind Enterprise Edition, 2008]. Программы других поставщиков имеют сходный функционал, отличаясь лишь технологиями реализации, а также качеством и эффективностью работы.

Продукты категории А - «Технологии доступа к информации»

IBM OmniFind

OmniFind ориентирован на поиск информации для работников организации и клиентов. Поиск может одновременно проводиться по всем ресурсам - в интранете, по внешним корпоративным сайтам компании, в базах данных, и т.д.

Omnifind предоставляет полнотекстовый поиск по ключевым словам и фразам для начинающих пользователей, а также расширенные виды поиска для продвинутых пользователей. Система позволяет также задавать правила для автоматической классификации документов.

IBM Classification Module

Данный модуль автоматически классифицирует неструктурированный контент по заданным категориям, а также повзоляет создавать и настраивать таксономии. Эта программа выступает дополнением к IBM Omnifind, которое позволяет повысить эффективность и точность поиска с помощью навигации (browsing) и наложение ограничений на результаты поиска (например, поиск только в определенной категории).

WebSphere Portal

WebSphere Portal - это программная среда, реализующая единую точку индивидуального взаимодействия людей и программ. С точки зрения управления знаниями особенно важно в портале сочетание персонализации контента (взгляд на знание как на «запас») с возможностями совместной работы и обмена неформализованными знаниями (взгляд на знание как на «поток»).

Продукты категории В - средства совместной работа

IBM Lotus Notes and Domino

IBM Lotus Notes - это главная часть программного обеспечения IBM Lotus Domino, который обладает функциями планирования (календарь) и работы с электронной почтой. Продукт является платформой для совместной работы и повышения гибкости предприятия в целом. Близок известному продукту от Microsoft – почтовой системе Outlook.

IBM Lotus Sametime

IBM Lotus Sametime – это программа для общения и совместной работы с возможностью проведения Web-конференций (телеконференций через Интернет). Lotus Sametime позволяет предавать голосовые и видео-сообщения, определять местонахождение участников, и поддерживает связь с мобильными устройствами (например, мобильными телефонами).

IBM Lotus Quickr

IBM Lotus Quickr – это программный продукт для обеспечения совместной работы нескольких пользователей, который помогает организовать совместную работу сотрудников в интерактивном режиме как внутри организации, так и за ее пределами..

В интерактивные рабочие области пользователи могут включать календарь, дискуссионные форумы, блоги, wiki и другие средства совместной работы для управления проектами и создания общего контента.

IBM Lotus Connections

IBM Lotus Connections представляет собой решение для социализации бизнес-процессов, расширяющее инновационные возможности и ускоряющее работу с помощью объединения сотрудников, партнеров и заказчиков в динамические сети.

“Если Lotus Quickr — это управление контентом в контексте проекта, то Lotus Connections предоставляет средства для объединения людей, которые должны сотрудничать в работе над проектом. Система содержит пять основных компонентов: Profiles, Blogs, Communities, Activities и средство создания закладок Bookmarks (Dogear). Используя их, я и мои коллеги в моей организации и, возможно, за ее пределами, знают: что я из себя представляю — Profiles; над чем я сейчас работаю — Activities; чем я интересуюсь — Bookmarks (Dogear); что хочу обсудить — Blogs; с кем нахожусь в контакте — Communities.” – говорит Дэвид Фаррел, вице-президент IBM по программному обеспечению Lotus в регионе Европа, Ближний Восток и Африка [Бизнес в паутине социальных сетей, 2007].

Продукты категории С – системы управления контентом

Далее представлены не все компоненты системы управления контентом, а только те, которые используются для реализации системы управления знаниями.

IBM Content Manager

Это программный продукт для хранения, контроля, распределения и интеграции информации. Интегрирует данные различных форматов (документ, изображение, Web, медиа и другие) и сопрягается с различными профессиональными системами сканирования.

IBM WebSphere Information Integrator

WebSphere Information Integration обеспечивает доступ к данным, хранящимся в разнородных системах, интегрируя содержимые порталов, бизнес-приложений и других программ. Этот интегратор делает так, что множество разнородных хранилищ данных выглядят и функционируют как единый архив.

3. Некоторые отечественные программы

Среди отечественных продуктов, позиционирующихся как системы для поддержки УЗ, следует отметить несколько:

1) Система "Айкумена Аналитик" компании IQMen (http://www.iqmen.ru/our_proposal/ ) обеспечивает информационно-аналитическую поддержку принятия решений c помощью таких современных технологий как:

Автоматический сбор информации из разнородных источников: электронные СМИ, аналитические агентства, специализированные базы данных.

Автоматическое составление и рассылка индивидуальных тематических отчетов экспертам и руководству.

Средства графического анализа событий по любой тематике, оперативное выявление в новостном потоке горячих тем.

Мгновенная подготовка досье по любому вопросу.

Выборка наиболее важной фактической информации - дат, финансовых данных, персон и организаций.

Автоматическое выявление физических и юридических лиц, имеющих отношение к любому вопросу и анализ взаимосвязей между ними.

2) Система «Галактика ZOOM» — инструмент для создания хранилища текстовой информации, который обладает возможностями для проведения поиска и аналитических исследований.

Поиск информации в больших информационных массивах.

Выявление значимых слов и словосочетаний документа, отражающих содержание текста.

Сравнение документов - обнаружение сходства, различия и аномалий изучаемых объектов.

Динамика во времени - отслеживание изменений во времени слов или словосочетаний характеризующих изучаемый объект.

3) Система DocsVision также предназначена для задач управления документами и процессами (http://www.docsvision.com/). Система DocsVision "Делопроизводство" для создает архивы документов, автоматизирует делопроизводство в организации.

4) Система ЕВФРАТ-Документооборот (http://www.evfrat.ru) - комплексное решение по организации электронного документооборота на предприятии. Внедрение системы обеспечивает:

систематизацию учета и хранения документов;

оперативный доступ к документам и отчетной информации;

управление процессами движения и обработки документов;

5) Яndex.Server — программа для поиска информации в интернете или в локальной сети с учетом морфологии русского языка.

4. Веб 2.0 инструменты для работы со знаниями

В 2005 году Тим О’Рейли [О’Рейли, 2005] описал концепцию «эволюционировавшей всемирной паутины», которую он обозначил термином Web 2.0, подчеркнув тем самым ее значимость как следующего поколения интернет-систем. Под этим понятием он объединил уже сформировавшиеся к тому времени признаки веб-сайтов «новой волны», основным из которых, с пользовательской точки зрения, можно считать использование «коллективного разума» или, точнее, «коллективной деятельности». Пользователи интернета сами становятся создателями информации - создаваемый в сети контент, его описание и структурирование, оценка и ранжирование становятся результатом деятельность рядовых пользователей. Технологически вовлечение пользователей обеспечивается засчет интерактивность веб-страниц и простоты их интерфейсов – для размещения информации в интернете пользователю не нужно никаких специальных знаний.

Вот неполный список инструментов Веб 2.0:

интернет почта (mail.ru, yandex.ru, gmail.com),

cредства обмена сообщениями (ICQ, google-чат)

блоги (например, Живой Журнал, корпоративные блоги Яндекса, Google-а) – он-лайн журналы и дневники, позволяющие обмениваться мнениями, размещать новости. Обновления блогов могут рассылаться с помощью RSS-потоков – см. далее,

социальные сети (например, vkontakte.ru, moikrug), позволяющие узнать о знаниях, опыте, интересах других людей и представить свои,

средства интеграции и чтения новостных RSS-потоков (Яндекс Лента, Google Reader). RSS (Really Simple Syndication) - средство подписки на обновления новостей сайтов, записей блогов, результатов поиска по определенному запросу и на любые другие обновляемые материалы – фотографии, видео, веб-закладки и т.д.

Peer-to-peer сети (иногда P2P-сети) – средство эффективного обмена файлами (музыкой, видео, текстами) либо через интернет, либо между ограниченным числом пользователей. Данное средство открывает доступ к содержимому персональных компьютеров пользователей и обеспечивает высокую скорость передачи информации, благодаря специальной технологии разделения файла на отдельные фрагменты.

веб-закладки (del.icio.us, БобрДобр), позволяющие пользователям не только сохранять ссылки на интересные для них ресурсы, но и сопровождать их ключевыми словами, обмениваться этими ссылками, анализировать популярность ресурсов (количество ссылок) и тенденции, находить других пользователей со схожими интересами.

средства для размещения фотографий (photosight.ru, flickr.com), презентаций (slideshare) и видео (youtube), с богатыми возможностями описания материалов (теги, категории), поиска, обсуждения.

wiki-средства (pbwiki.com, wikispaces.com) – средства создания и функционирования веб-сайтов по типу Википедии (см. ru.wikipedia.org). Cтраницы вики-сайта совместно редактируются сотрудниками организации и выступают альтернативой письмам и вложениям электронной почты.

программы для коллективного редактирования документов в онлайне (Google Docs),

гибридные приложения (mashups), объединяющие несколько инструментов Web 2.0 между собой или с другими приложениями (например, интеграция географических карт от Google, Yahoo cо средствами размещения фотографий - Panoramio, flickr позволяет пользователям привязывать фотографии к местности)

средства планирования – календари (Google Календарь) и т.п.

К Web 2.0 можно также отнести «ПО как сервис» (Software as a Service, SaaS). Такое ПО работает через интернет, а компания ежемесячно оплачивает услуги сервис-провайдера. Это дешево и удобно. Не нужно покупать дорогие лицензии, устанавливать и настраивать сложный софт.

Более полумиллиона западных компаний успешно используют онлайновую платформу AppExchange от Salesforce.com, что позволяет подписаться на любое из нескольких сотен бизнес-приложений, доступных для подписки (CRM-системы, бухгалтерские программы и др.). В данный момент SaaS значительно уступает по популярности традиционным моделям использования ПО, но в будущем ситуация должна измениться. Gartner прогнозирует, что к 2011 г. доля SaaS в общем объеме рынка программного обеспечения вырастет до 25%, то есть в пять раз по сравнению с 2005 г. [Ализар, 2006]

Инструменты Web 2.0 подходят для поддержки совместной работы в системах управления знаниями: они просты, эффективны и уже знакомы некоторым пользователям. По оценкам компании McKinsey основной целью использования инструментов Web 2.0 в бизнесе является поддержка совместной работы в компании – 75% опрошенных менеджеров (70% - взаимодействие с покупателями, 51% - взаимодействие с поставщиками и партнерами). При этом бОльшая часть респондентов рассматривает совместную работу как инструмент управления знаниями [Bughin, Manyika, 2007]. Рисунки 1 и 2 отражают мнения пользователей, полученные в рамках других исследований, о пользе и препятствиях таких инструментов.

Источник: InformationWeek Research, 2006

Рис. 1. Польза инструментов Веб 2.0 для бизнеса

Источник: InformationWeek Research, 2006

Рис. 2. Препятствия для Веба 2.0 в бизнесе

Вряд ли инструменты Web 2.0 вытеснят с рынка стандартные системы управления документами и софт для групповой работы, но они определенно могут его дополнить и стать неотъемлемой их частью. Собственно, такая интеграция происходит уже сейчас ( см. выше описание IBM Lotus Quickr, Sametime и др.).

В России внедрение в корпоративные системы блогов, wiki и социальных сетей идет несколько медленнее, чем на Западе. Причины заключаются в худшем состоянии технической инфраструктуры. Широкополосный интернет, который является главным условием для развития публичных сервисов Веб 2.0, распространен только в Москве. По этой причине блоги, подкастинг, wiki и прочие современные технологии еще не стали достаточно популярными среди пользователей. Корпоративная культура только начинает приспосабливаться к использованию социально-ориентированных сервисов в бизнесе.

5. Семантический веб и онтологии в управлении знаниями

Сейчас значительная часть содержания Всемирной Сети (World Wide Web) предназначена для чтения человеком, а не для осмысленного манипулирования им с помощью компьютерных программ. Компьютер способен умело разобраться в разметке веб-страницы и произвести рутинную её обработку — тут идёт заголовок, здесь следует ссылка на другую страницу; но у компьютера нет надёжного способа обрабатывать смысл документа: это — домашняя страница компании Х, а эта ссылка ведёт на резюме сотрудников данной компании.

Семантический веб (Semantic Web) привносит смысловую структуру в содержание веб-страниц. Семантический веб — это не какая-то отдельная сеть, а расширение уже существующей, такое, что в ней информация снабжена точно определённым смыслом, позволяющим человеку и машине успешно взаимодействовать.

Сценарий работы таких программных средств представлен в основополагающей статье идеологов семантического веба – Тима Бернерса-Ли и Джеймса Хендлера, опубликованной в 2001 году в журнале Scientific American [Berners-Lee, Hendler, 2001]:

«Пит поднял трубку, звонила его сестра Люси из кабинета врача: «Моей маме нужно попасть на приём к врачу, а потом ей требуется пройти несколько сеансов физиотерапии. Примерно два раза в неделю. Я сейчас поручу своему агенту записать нас на приём к врачу». Пит сразу же согласился подвезти её маму на своей машине. В кабинете врача Люси дала указания своему электронному агенту Семантической Сети через свой портативный веб-браузер. Агент сразу же получил информацию о назначенном маме лечении от агента её врача, просмотрел несколько перечней медицинских учреждений, оказывающих подобные услуги, проверил, какие из них подходят [in-plan] по её страховому полису и находятся в окрестности 20 миль от её дома и при этом имеют рейтинг — «отличный» либо «очень хороший» согласно достоверным рейтинговым источникам. Далее агент попытался сопоставить имеющиеся часы приёма врачей (предоставленные агентами соответствующих мед. учреждений на их веб-сайтах) с расписаниями Пита и Люси. (Слова, выделенные курсивом, указывают на термины, семантика, или смысл, которых была предоставлена агентам посредством Семантической Сети.) Уже через несколько минут агент представил им план. Питу он не понравился — Университетская Клиника расположена на другой стороне города, и ему пришлось бы возвращаться обратно как раз в час пик. Он попросил своего агента повторить поиск с более строгими предпочтениями относительно места и времени. Тем временем агент Люси, полностью доверяя агенту Пита в рамках данной задачи, автоматически помогал, предоставляя тому права доступа и ссылки на уже добытую им информацию. Практически мгновенно был предложен новый план: найденная клиника была уже гораздо ближе, и часы приёма более ранние».

Для того, чтобы Семантический Веб мог функционировать, компьютеры должны иметь доступ к структурированным хранилищам информации и множествам правил вывода, которые могли бы использоваться для проведения автоматических рассуждений. Однако два хранилища информации или базы данных могут использовать различные идентификаторы для обозначения одного и того же понятия, такого, например, как почтовый индекс. И программа, желающая сравнить или как-то скомбинировать информацию из этих баз данных, должна знать, что два конкретных термина используются ими для обозначения одного и того же. В идеале, у программы должен быть способ распознавать подобные термины с одинаковым смыслом, с какими бы базами данных ей не пришлось столкнуться в процессе своей работы.

Решение этой проблемы даётся третим базовым компонентом Семантического Веба — совокупностью информации, которое специалисты именуют онтологией (см. статью про инженерию знаний). В философии онтологией называют некую теорию о природе бытия, ИТ-специалисты заимствовали этот термин, и для них уже онтология — это структура, задающая отношения между понятиями.

Онтология определяет классы объектов и отношения между ними. Например, понятие адрес может быть определено как разновидность понятия местонахождение [location], а код города можно задавать применительно лишь к местонахождениям и так далее. Задание классов, подклассов, а также отношений между индивидами [entities] является чрезвычайно мощным инструментом для использования в Вебе.

В простейшем случае, онтологии используют для увеличения точности поиска в Вебе — поисковая машина будет выдавать только такие сайты, где упоминается в точности искомое понятие, а не произвольные страницы, в тексте которых встретилось данное многозначное ключевое слово.

В полную силу Семантический Веб будет реализован тогда, когда люди создадут множество программ - агентов, которые, знакомясь с содержимым Веба из различных источников, обрабатывают полученную информацию и обмениваются результатами с другими программами. Семантический Веб стимулирует подобного рода синергию: даже те агенты, которые не были созданы специально для работы сообща, могут передавать информацию друг другу, коль скоро эта информация будет снабжена семантикой.

Полноценный Семантический Веб – это технология управления знаниями будущего, однако, уже сейчас можно пользоваться его отдельными технологиями и применять в ограниченных областях. Примером является Семантический веб организации — или реализация этой концепции в рамках отдельной организации [Cerebra, 2005].

Также и онтологии могут не только использоваться в