Фрагмент документа "О ДАЛЬНЕЙШЕМ ПРОВЕДЕНИИ РАБОТ ПО СОЗДАНИЮ МОСКОВСКОГО ГОРОДСКОГО ПОРТАЛА".
3.7. Параметры профиля взаимодействия информационных систем СГП Одним из наиболее важных аспектов ТОС является понятие профиля взаимодействия используемых ИС, который трактуется, как согласованный набор обязательных базовых стандартов, необходимых для решения конкретной задачи или класса задач. Исходя из структуры эталонной модели ИС, используемой в рамках СГП, следует выделить три основные группы стандартов, соответственно связанных с определенным уровнем указанной модели. Это, в частности, применяемые стандарты на: - протоколы передачи данных (уровень телекоммуникаций); - программные интерфейсы, используемые для взаимодействия ИС (уровень оболочки, т.е. форматы документов, метаданные, протоколы функционального взаимодействия и сервисов, и т.п.), а также: - используемое лингвистическое и организационное обеспечение (уровень информационных ресурсов). В нижеследующих подразделах приводятся соответствующие предложения и обоснования по каждой из групп стандартов, которые в совокупности представляют собой предлагаемый в рамках настоящей Концепции профиль ИС, используемых в рамках формируемой СГП. 3.7.1. Протоколы передачи данных В соответствии с представленной в разделе 2.5 общей схемой информационного взаимодействия порталов СГП обмен данными между соответствующими ИС в основном реализуется в полностью автоматизированном синхронном (онлайн) режиме. Очевидно, что для обеспечения указанного синхронного обмена должен быть использован единый (стандартизованный) протокол передачи данных. В соответствии с общими рекомендациями W3C и OASIS в качестве основного стандарта должен использоваться базовый протокол глобальной сети, а именно - HTTP(S). С другой стороны, следует заметить, что, по крайней мере, на начальной стадии формирования СГП существует реальная необходимость взаимодействия с рядом уже существующих (наследуемых) ИС, не обладающих HTTP ориентированными интерфейсами. Поэтому, в указанных частных случаях, предполагается опционное использование стандартного асинхронного протокола, а именно - SMTP. Важно отметить, что как в синхронном, так и в асинхронном режиме телекоммуникаций выбор в качестве обязательных указанных выше стандартных протоколов, в основном, обусловлен следующими причинами: - наличием множественных реализаций в рамках всех практически используемых программно-аппаратных платформ; - возможностью применения защищенных режимов передачи данных, в том числе использование механизма электронно-цифровой подписи; - практическим отсутствием ограничений на использование различных форматов передаваемых данных, обеспечиваемое наличием широкого набора разнообразных MIME кодировок; - высокой степенью надежности практически применяемых серверных приложений, использующих эти протоколы. 3.7.2. Форматы документов, Web-сервисы, метаданные Как указывалось ранее, в определенном смысле отдельные Интернет ресурсы и соответствующие ИС, составляющие тематическую сеть СГП, могут рассматриваться, как объединение (на основе общего содержательного контекста) неструктурированной текстовой информации, основанной на языке формата HTML. Поэтому, с общесистемной точки зрения формирование СГП фактически подразумевает переход к более высокому уровню интеграции Интернет ресурсов, т.е. к интеграции на основе обмена структурированной информацией и Web-сервисами. В этой связи очевидна необходимость выбора единых стандартов, как для форматов структурирования передаваемых информационных объектов, так и для обмена Web-сервисами. 3.7.2.1. Формат документов Очевидно, что эффективный автоматизированный обмен информацией между компонентами (узлами) указанной распределенной системы возможен лишь при условии использования стандартных форматов структурирования информационных объектов, которые не зависят от программно-аппаратной платформы, а также исключают какую-либо не однозначность интерпретации при обработке реквизитов (информационных элементов) объектов в рамках автоматизированного процесса обмена. В этой связи настоящая Концепция строго основывается на соответствующих рекомендациях консорциума W3С, рассматривающих в качестве стандартного формата обмена структурированной информацией язык разметки XML (eXtensible Markup Language) и его предметно-ориентированные реализации. В частности, основными аргументами в пользу такого выбора являются следующие свойства XML: - специализированная ориентация на цели информационного обмена в рамках распределенных ИС; - независимость от программно-аппаратной платформы реализации конкретных ИС; - гарантированная однозначность интерпретации данных в силу применения мета описаний XML документа с использованием DTD или XSD схем; - наличие гибких возможностей преобразования (на основе техники стилевых таблиц) XML документов в документы, реализованные в виде других тэговых форматов (например, HTML, RTF, PDF). 3.7.2.2. Web-сервисы и метаданные Для эффективной реализации автоматизированного доступа к Web-сервисам и их интеграции в рамках СГП необходимо обеспечить: - обнаружение доступных в данный момент времени сервисов; - получение метаданных о сервисе, включая сведения об организации предоставляющей сервис и описание характера сервиса; - автоматизированное распознавание используемого интерфейса сервиса. Для этого в контексте рассматриваемого профиля взаимодействия следует, как минимум, зафиксировать две стандартизирующие системы, а именно: - систему обнаружения, описания и в перспективе интеграции сервисов, доступных в рамках используемых ИС СГП; - единую систему метаданных, описывающих структуры данных и функции программных интерфейсов, используемых в процессе доступа к Web-сервисам. На основе принятых стандартов строится универсальная схема общепортального (т.е. в рамках всех составляющих СГП) предоставления сервисов, реализующая вызов удаленных процедур на основе обмена формализованными сообщениями. В этой связи настоящая Концепция предполагает, что указанная схема строится на основе обмена сообщения, использующими стандартный протокол SOAP (Simple Object Access Protocol). Как известно, в настоящее время SOAP является стандартным протоколом взаимодействия с Web-сервисами. Он основан на использовании формата XML, не зависит от используемого транспорта или программно-платформенной реализации приложений и, как следствие, обладает высоким уровнем модульности и расширяемости. В силу этого, указанный протокол рекомендуется международными консорциумами в качестве основного стандарта обмена соответствующими сообщениями. В свою очередь, для описаний внутренней структуры SOAP сообщений, а также функций интерфейса и необходимых метаданных Web-сервиса, следует использовать рекомендованный международными консорциумами стандартный XML-совместимый язык описаний сервисов WSDL (Web Service Definition Language). WSDL спецификация описывает сервисы с точки зрения набора узлов распределенной системы, обменивающихся сообщениями. Кроме того, одним из наиболее привлекательных свойств WSDL описаний является их независимость от фактически используемых формата сообщений и протокола сетевого обмена, что обеспечивает высокую работоспособность и расширяемость систем, основанных на данном стандарте. Наконец, для поиска, регистрации и интеграции Web-сервисов в рамках информационного обмена предлагается использование платформо-независимого реестра, основанного на стандартной спецификации UDDI (Universal Description, Discovery, and Integration), содержащей общую контактную, классификационную, а также детальную техническую информацию о конкретном сервисе. 3.7.3. Лингвистическое обеспечение Наряду с различными аспектами технологической совместимости ИС (т.е. использованием стандартных протоколов телекоммуникаций, форматов представления данных и программных интерфейсов) профиль взаимодействия ИС, используемых в рамках СГП, предполагает их соответствие требованиям лингвистической совместимости. В данном случае лингвистическая совместимость трактуется, как обязательное применение в рамках всех взаимодействующих ИС согласованных на основе определенных стандартов (единых понятий, терминов и определений) процедур смысловой обработки информационных объектов. Следует заметить, что помимо непосредственных целей формирования СГП (в частности, стандартизации процедур обмена информационными объектами между ИС) требование лингвистической совместимости также является абсолютно необходимым в контексте реализации единой поискового сервиса СГП, основанного на использовании всеми ресурсами тематической сети стандартизированных моделей навигации, полнотекстового индексирования и многокритериального поиска. Наиболее важной проблемой в плане обеспечения лингвистической совместимости является внедрение в функциональный дизайн взаимодействующих ИС стандартизованных процедур систематизации информационных объектов, т.е. процедур, использующих единые классификационную систему. В данном контексте указанная система понимается непосредственно в трактовке ГОСТ 7.74-96, т.е. как набор средств формализованного представления содержания документов, данных и информационных запросов посредством кодов или описаний классов логически sonpdnwemmncn множества понятий. Для целей формирования СГП наиболее приемлемым подходом построения единой классификационной системы представляется иерархический метод классификации, основанный на детальной системе тематических, а также предметной проблемно-ориентированных рубрикаторов, фактически представляющей собой иерархическую совокупность классификационных таблиц, содержащую полный перечень включенных в систему понятийных классов. Кроме того, дополнительным аргументом в пользу иерархической схемы единой классификации является указанная выше необходимость разработки и внедрения единого навигационного и информационно-поискового сервиса СГП. Важно также отметить, что предлагаемые единые рубрикаторы должны быть разработаны в соответствии с Единой системой классификации и кодирования технико-экономической и социальной информации в г. Москве, ЕСККМ, (см. Приложение 1 к постановлению Правительства Москвы N 496-ПП от 24.06.2003). Другим важным аспектом лингвистической совместимости взаимодействующих ИС является проблема обеспечения многокритериального поиска информации (например, поиск по адресу, району и т.п. атрибутам). В частности, при обмене информацией в виде структурированных XML документов, непосредственно содержащих данные информационных объектов или их стандартизованные описания (метаданные), необходимым условием является однозначная интерпретация значений атрибутов в соответствии с их типом. Достаточно очевидно, что указанная однозначность должна быть обеспечена на основе использования единой для всех ИС и, по возможности, наиболее полной системе справочников и словарей. В этой связи следует также заметить, что современные информационно-поисковые системы, основанные на полнотекстовой индексации, преимущественно работают с пользовательскими запросами, сформулированными на "естественном" языке. Как известно, несмотря на очевидную привлекательность для пользователя такой подход потенциально может ограничивать результативность поиска только теми информационными объектами, которые содержат в данных (или метаданных) словоформы терминов непосредственно присутствующих в запросе. Поэтому для обеспечения расширенного, более результативного поиска (т.е. поиска, основанного на использовании обобщенных понятий) необходимым условием является наличие единых словарей дескрипторов понятий, как правило, организованных в виде тезаурусов. Исходя из вышеприведенного, основные принципы обеспечения лингвистической совместимости ресурсов СГП могут быть сформулированы следующим образом. В рамках всех ИС, используемых в рамках эксплуатации СГП, необходимо: - использовать единую (универсальную) систему рубрикаторов, классифицирующих информационные объекты по их типу, а также по функциональному, отраслевому, территориальному и прочим признакам; - использовать единый набор справочников допустимых значений атрибутов информационных объектов в соответствии с принятой единой системой классификаторов; - разработать и внедрить стандартизованные схемы XML документов, использующихся в рамках процедур информационного обмена между ИС; - использовать единую систему словарей, применяемых при индексации документов и поисковых запросах. Необходимо отметить, что указанные выше элементы единого лингвистического обеспечения (рубрикаторы, словари, справочники, структуры метаданных т.п.) сами по себе являются информационными ресурсами. Соответственно их сопровождение, актуализация, а также предоставление доступа к ним со стороны ИС городских Интернет ресурсов, должны быть обеспечены рамках ОИС. В частности, с технической точки зрения указанный доступ должен быть обеспечен на основе использования соответствующих специализированных Web-сервисов. 3.7.4. Организационное обеспечение Еще одним важным аспектом формирования СГП является совместимость организационного обеспечения взаимодействующих ИС. Применительно к ИС, используемым в рамках СГП, основные принципы организационной совместимости могут быть сформулированы следующим образом. В рамках всех составляющих СГП необходимо: - применять общие регламенты создания, реализации редакционного цикла (актуализации), и публикации информационных объектов в зависимости от их типа и соответствующего режима обеспечения информационной безопасности; - использовать единую нормативно-правовую базу, регламентирующую деятельность операторов ИС в части сбора, актуализации и публикации документов, а также предоставлении интерактивных сервисов; - придерживаться общих требований по соблюдению информационной безопасности при работе с официальными и/или конфиденциальными данными. Приложение 1 |
Фрагмент документа "О ДАЛЬНЕЙШЕМ ПРОВЕДЕНИИ РАБОТ ПО СОЗДАНИЮ МОСКОВСКОГО ГОРОДСКОГО ПОРТАЛА".