Информационные ресурсы: определение, основные понятия, параметры, особенности открытого потока информации, помехи возникающие в кана - shikardos.ru o_O
Главная
Поиск по ключевым словам:
Похожие работы
Информационные ресурсы: определение, основные понятия, параметры, особенности открытого - страница №4/5

Раздел 4: ОСОБЕННОСТИ ОТКРЫТОГО ПОТОКА ИНФОРМАЦИИ

Разрушение существовавшей в СССР системы информационного обеспечения привело к существенному снижению качества и объемов общедоступных информационных ресурсов.

Большинство пользователей связывают этот процесс, в основном, с резким повышением стоимости информации, что существенно ограничило для большинства специалистов доступ к информационным ресурсам.

Остальные факторы, как правило, выпадают из анализа. Это обусловлено широко распространенным и "общепринятым" мнением (точнее, часто повторяемым утверждением), что на основании анализа открытых источников можно получить 80-90 процентов информации, необходимой для принятия решений.

Данное мнение обычно преподносится в качестве безапелляционных утверждений типа:

  1. Как и в области военного шпионажа, 95% промышленной информации может быть получено путем простого чтения прессы.

  2. Автор убежден, что изучение книг, прессы и других источников в мирное время может обеспечить получение до 80 процентов всей информации, необходимой для проведения внешней политики. [Хилсмэн Р. Стратегическая разведка и политические решения. -М.: Изд.Иностранной литературы, 1957,-192 с.]

  3. По самым грубым расчетам 80 процентов разведывательной информации добывается в результате изучении обычных, всем доступных источников-книг, газет, журналов (адмирал Роскоу Хилленкеттер).

Попытка выявить "первооткрывателя" этой "общеизвестной" истины привела к источникам, относящимся к началу нашего века. Следовательно, те, кто придерживается этого тезиса при обосновании приемов вскрытия и анализа реальной информационной ситуации в большинстве областей науки, техники, производства и управления, должны сначала доказать, что в распространении информации за последние почти сто лет не произошло никаких изменений. Но такой ответственности никто на себя не берет.

Более того, большинство исследований реальных информационных потоков свидетельствует об иных тенденциях. Например, из отчета ВНТИЦентра [Информационные процессы и их автоматизация.-М.: ГКНТ СССР, 1984,208 с.] следует, что:

  1. Более 80% сведений, заключенных в патентных документах, впоследствии НЕ ПУБЛИКУЮТСЯ в каких-либо информационных источниках. Это при условии, что ряд патентных ведомств владеет огромными массивами патентной информации, размеры которых достигают 20-30 млн. документов с ретроспективой до 50 лет, а по некоторым странам - до 100 лет.

  2. Большая часть отчетов, НИОКР, диссертаций, (70-80% по различным оценкам), никогда не публикуется, а публикуемые сведения появляются в научной печати со значительными (до нескольких лет) запаздыванием, причем эти публикации, как правило, не дают необходимой подробной информации.

Ознакомление с исследованиями о доступности информационных ресурсов, позволяет утверждать, что реальные возможности доступа к информации более правильно оценивать следующим образом:

  1. Анализ открытых источников позволяет выявить порядка 60-70 процентов информации, относящейся к общетеоретическим и общетехническим вопросам и составляющей исходную базу при решении научных, технических и производственных проблем. Условно назовем этот уровень "базовым". Базовый уровень позволяет иметь представление лишь о том, какие задачи и на какой общетехнической базе могут решаться, но не позволяет ответить на вопрос: как будет решена та или иная конкретная проблема. Эта информация относится к знаниям, обеспечивающим необходимый "средний" уровень подготовки кадров любой квалификации, но не раскрывает наиболее важных и перспективных разработок, методов и приемов работы, особенностей технологий и т.п. Базовый уровень нашего знания наиболее полно обеспечен открытым потоком публикаций.

  2. При переходе к изучению конкретных применений научно-конструкторских разработок в любой области открытые публикации становятся все менее надежным источником информации. Они охватывают не более 10-30 процентов информации, полученной в ходе выполнения НИОКР. Это, как правило, разрозненные данные, не позволяющие проводить необходимые обобщения и реконструкцию истинных направлений разработок.

  3. Переход к оценке и изучению производственно-экономических вопросов, определяющих состояние и технологию промышленного производства конкретных видов продукции, еще более снижает долю открытых источников (она не превышает 10-15 процентов, а по вопросам рынка и политики предприятий, фирм, исследовательских групп и организаций и т.п. снижается до долей процента).

Приведенные данные характеризуют предельные возможности по полноте потока открытых публикаций. Реальное положение, определяемое наличием открытых зарубежных публикаций в фондах ГСНТИ и коммерческих структурах, свидетельствует, что имеющийся поток значительного числа типов научно-технических документов (НИОКР, конструкторско-технологическая документация и экономическая информация) в настоящее время не позволяет достигнуть указанных выше величин.

Далее, необходимо иметь в виду, что процессы, происходящие в стране после августа 1991 г., еще сильнее обострили ситуацию информационного обеспечения. Ибо в результате развала всей инфраструктуры информационных ресурсов произошло катастрофическое снижение возможности доступа ко всем видам информации и засорение информационных потоков информацией малой надежности и достоверности.

До 1991 г. СССР в целом обеспечивал поступление в страну от 30 до 50 процентов зарубежных научно-технических документальных ресурсов и их широкое распространение через Государственную систему научно-технической информации. При этом высокая степень централизации и специализации информационных технологий позволяла существенно сокращать затраты на основные операции обработки всех потоков информации.

В 1991-1992 гг. фактически прекратилось комплектование зарубежной научно-технической литературой, вызванное прекращением валютного финансирования крупнейших (бывших союзных) центров научно-технической информации.

Кроме этого, принципиально изменился состав организационных единиц, создающих все виды информационных ресурсов в стране.

Россия, в лучшем случае, может рассчитывать на те информационные ресурсы, которые сохранились на территории РСФСР.

По данным "Концепции научно-технологической политики Российской федерации" на территории России по состоянию на 1 января 1991 г. было 58,3% от всех организаций СССР, осуществлявших научно-технические работы. Они выполняли 78,8% всех НИР бывшего Союза; 74,7% конструкторских и технологических работ; 75,2% опытных работ; 73,8% строительного проектирования; 70,0% научно-технических услуг. Но это при условии, что все организации выполняли свои работы в тесном взаимодействии с другими республиками, и уровнях финансирования, существовавших до 1991 г.

Но ныне этот уровень недостижим, ибо произошло сокращение числа научно-исследовательских организаций, изменилась система связей между ними, существенно сокращено финансирования, произошли значительные кадровые сокращения в системе организаций, осуществляющих научно-технические работы, нарушена вся система научно-технических изданий, распалась Государственная систем научно-технической информации.

Все это позволяет с высокой степенью вероятности предполагать, что в ближайшее время количество и качество информации в открытых потоках будет только снижаться. Тем более что на государственном уровне не осуществляется сколь-нибудь действенных мер по защите и сохранению информационных ресурсов страны.

Надеяться же на то, что "запад нам поможет, в лучшем случае, ГЛУПО.

Утверждение о существенной неполноте открытых потоков информации свидетельствует лишь о том, что наиболее важная информация недоступна большинству потенциальных пользователей. БОЛЕЕ ВАЖНЫМ является то, что в открытом потоке велик процент информации, не позволяющей принимать эффективные информационные решения.

Это вызвано тем, что документы открытого информационного потока имеют следующую особенность, с одной стороны, они сообщают некоторую информацию, цель которой привлечь внимание к данной проблеме, методу, объекту исследования, утвердить свое авторство (приоритет), иногда вызвать обсуждение и дискуссию по неясным, труднорешаемым проблемам, но, с другой стороны, в них содержится лишь некоторый минимум данных, как правило, исключающий использование приводимой информации без привлечения дополнительных документов, доступ к которым ограничен, либо необходимо приглашение самого автора, ибо только он обладает теми недостающими сведениями, которые позволяют повторить результат. Иначе повторение разработки потребует значительных дополнительных затрат на исследования.

Даже в патентах и других документах, выполняющих функцию защиты экономических интересов "субъектов права", информация представляется таким образом, "чтобы она была научно правильной, но незаконная реализация изобретения на основании опубликованных данных оказалась намного дороже, чем приобретение патентной лицензии".[7,с.11]. "Патентные эксперты хорошо знают, что подлинная ценность изобретения и изобретателей определяется некоторым неуловимым, во всяком случае, пока мало изученным свойством - ценностью идей. В связи с этим возникла целая система приемов "упаковки" духовных ценностей в области науки при их патентовании. СКРЫТАЯ ЦЕЛЬ ЛЮБОГО БЮРО ПАТЕНТОВ СОСТОИТ В ТОМ, ЧТОБЫ КАК МОЖНО БОЛЕЕ ЗАМАСКИРОВАТЬ ЦЕННУЮ ИДЕЮ ПОД РЕАЛИЗУЮЩЕЕ ЕЕ (А, ЗНАЧИТ, ОСУЩЕСТВИМОЕ), НО ПО ВОЗМОЖНОСТИ МАЛОЦЕННОЕ УСТРОЙСТВО. ТАКОЕ УСТРОЙСТВО ВСЕГДА ОПИСЫВАЕТСЯ С СОЗНАТЕЛЬНЫМ НАМЕРЕНИЕМ МАКСИМАЛЬНО ЗАВУАЛИРОВАТЬ ПРИНЦИП, ЛЕЖАЩИЙ В ЕГО ОСНОВЕ, ДА И САМО УСТРОЙСТВО, ПО КРАЙНЕЙ МЕРЕ, В ОГРОМНОМ ЧИСЛЕ СЛУЧАЕВ, ВЕСЬМА ДАЛЕКО ОТ САМОЙ СУЩНОСТИ ИЗОБРЕТЕНИЯ. Ведь идею, как таковую, отличает именно то, что она допускает большое разнообразие конкретных реализаций" [7,с.95]. Поэтому даже патенты, значение которых при решении ряда задач прогнозирования обычно оцениваются очень высоко, требуют более тщательного анализа при оценке описанных в них технических достижений. Об этом свидетельствует появление таких определений, присоединяемых к патентам: "бумажный", "отпугивающий", "заградительный", "дезинформирующий". [14,с.25].

Засорение информационных потоков недостоверными, непроверенными данными значительно усложняет работу по использованию опубликованных документов. Например, имеются сведения о строительстве завода по производству брома, стоимостью около 30 млн. долларов, который в результате использования недостоверных данных, заложенных в технологические процессы, не смог выдавать запланированной продукции. Значительное число примеров преднамеренной фальсификации приведено в работе[9], там же указывается, что плохих данных больше, чем хороших. Существует много областей экономики, где о качестве информации мы имеем лишь слабое представление, поскольку по ним вообще отсутствуют данные.

Все это показывает, что утверждения о высокой степени достоверности данных в открытых публикациях также требует критической оценки.

Это обусловлено следующими причинами:

  1. Выводы о достоверности делаются на основании многочисленного числа источников информации за длительный промежуток времени, включающий как первые публикации об объектах, так и публикации, относящиеся к моменту поступления объекта в эксплуатацию, а иногда и снятия объекта с производства. Т.е. производится ретроспективная оценка прошедшего опыта, когда объект заменяется новым и становится объектом критики, а не объектом, данные о котором подлежат сокрытию.

  2. Рассматриваются данные об объекте без оценки важности различных групп данных с точки зрения решаемых задач. Так значительное число данных по геометрическим и весовым характеристикам и их сравнительно высокая точность скрывает отсутствие данных по другим характеристикам (назначению объекта, принципам функционирования, особенности технологии производства и эксплуатации, недостатки, недоработки, слабые места, неудачные решения и т.д.). Например, в одной из работ проанализировано 4895 характеристик и параметров авиационной, ракетной и космической техники, из них 2144(41%) - геометрические и весовые, 784(около 16%) - летно-тактические, 400(около 8%) - вооружение.

  3. Не всегда уточняется, что понимается под достоверным значением исследуемого параметра и какая степень совпадения с достоверным значением принимается за совпадение. Например, в одной из работ одни и те же данные, отличающиеся друг от друга не более чем на 10% учитываются один раз и считаются достоверными, а в другой - за "истинное значение" принимается первое по дате появления.

  4. Ряд исследований, проводившихся органами НТИ в 70-х годах, показывают, что около 50% всех публикуемых за рубежом данных - это разрозненные данные, кроме этого имеется большое число "белых пятен", для маскировки которых используются пустые (фиктивные) данные.

  5. Наличием за рубежом разработанной системы "обезличивания" информации и "целевого" регулирования информации в совокупном потоке публикаций.

Анализ достоверности данных по двум классам объектов (ЭВМ и запоминающие устройства, проведенный вмассиве 7000 параметров, взятых из различных источников [10], выявил следующие основные группы причин, порождающие отклонения в значениях параметров: различная мера точности, варьирование данных (указывается либо диапазон, либо минимум, либо усредненная величина и т.п., но характер величин не оговаривается); различные размерности (в ряде случаев пересчет к единой размерности не возможен); изменение данных в результате модернизации, изменении технологии выпуска, различия в конфигурации объекта; опечатки; наличие нескольких фирм изготовителей (приводит к множественности вариантов, наименований и т.п.); отсутствие единых схем описания объектов; тенденциозный подбор данных; сознательная дезинформация; неопознанные причины, вызванные недостаточной информацией по объекту.

Уже сам перечень групп показывает, что выявление достоверной информации из документов требует разработки широкого спектра специальных мер, приемов и методов оценки пригодности данных и использованию их к принятию решений.

Начавшийся процесс накопления фактографических данных в памяти информационных систем показал, что ни одна из характеристик не может считаться достоверной пока не проведена ее проверка на достоверность. При создании массивов фактографических данных, в них должны накапливаться ВСЕ данные, встречающиеся в доступных пользователю источниках информации, а не только "достоверные", ибо только в этом случае создаются предпосылки для выявления противоречивых данных, исключаются случаи исключения "неудобных" данных и пропуска сложных ситуаций.

Под сложной ситуацией понимаются данные о "необычном", "невозможном" использовании известных средств и методов, "принципиально невозможных" явлениях и действиях, т.е. все то, что не укладывается в тезаурус отдельного исполнителя и/или целого коллектива исполнителей.

"Дезинформационный взрыв" породил ряд сложных проблем, решение которых невозможно без разработки специальных методов изучения и выявления фальсифицированных, скрытых или искаженных данных. При использовании недостоверных данных обесцениваются или вообще становится бесполезной другая информация, обладающая высокой степенью точности. При этом особое внимание должно уделяться достоверности СОВОКУПНОСТИ СИСТЕМЫ ДАННЫХ, что является в ряде случаев более важным фактом, чем достижение высокой точности отдельных групп данных.

Особо следует подчеркнуть, что некритическое использование публикуемых данных может привести к серьезным последствиям при принятии решений. Необходимо постоянное отслеживание достоверности данных и эффективности, принимаемых на их основе решений, т.е. при использовании данных должна сохраняться возможность восстановления "прошлых" решений на основе имеющихся данных, ибо только сохранение "цепочек оценки данных" позволяет отслеживать причины неправильных решений и источники недостоверных данных, используемых при принятии решений.

Выявление недостоверной и устаревшей информации, циркулирующей в документах, становится одной из важнейших задач, так как публикуемые в документах данные, в ряде случаев, позволяют подтвердить и обосновать "даже противоречивые решения и научные гипотезы, построить теоретические модели, дающие противоположные результаты".

Наиболее простым, но достаточно надежным и эффективным методом локализации некачественной информации, является издание перечней документов, содержащих устаревшие и недостоверные данные.

Более действенным методом обеспечения науки, техники и производства достоверными данными является осуществление сложных, комплексных государственных и международных программ, направленных на сбор, оценку и нормализацию различных видов данных. Например, Государственная служба стандартных и справочных данных и др.

Для повышения эффективности использования открытого потока информации используются следующие методы:

  1. Анализ тематической направленности открытого потока публикаций и динамики публикаций по всем областям науки и техники. При этом особое внимание должно уделяться вновь появившимся направлениям исследований и тем областям знаний, в которых происходит колебание числа публикаций.

  2. Выявление из открытого потока публикаций, ранее подлежавших засекречиванию, и формирование из этих публикаций самостоятельного массива. На базе ранее засекреченных публикаций необходимо проводить ретроспективные сравнения (независимо от сроков давности) тематики открытых и закрытых работ. Это позволит проводить оценку ранее принятых решений, а также уточнять связи между закрытыми и открытыми публикациями и выявлять причины рассекречивания документов (исследований).

  3. Получение сводных перечней научных кадров по странам, областям знаний, фирмам, научным коллективам. Отслеживанию должны подвергаться авторы, имеющие хотя бы одну открытую работу по тематике, которая представляет интерес при оценке. Кроме перечней необходимо выявлять связные совокупности авторов по: тематикам и проблемам; взаимным публикациям; местам работы, совместному участию в научных конференциях, симпозиумах; по принадлежности к научным школам и коллективам; участию во взаимосвязанных разработках и исследованиях; ученым степеням и оценкам научной квалификации ("гамбургский счет"), а также степени самостоятельности в решении научно-технических задач и уровню их новизны, оригинальности подходов и проектных решений и т.д.

  4. Сопоставление открытых и закрытых источников информации по одной и той же тематики с целью выявления: аспектов информации, по которым идет закрытие; направлений дезинформации; определение предмета засекречивания (истинное наименование и/или специфическая функция, выполняемая объектом, и/или значение характеристики, и/или принцип действия, и/или ресурсы, необходимые для производства и т.д.); определение сопутствующих признаков (несекретных), по которым могут быть выявлены открытые разработки, связанные с той или иной частью закрытых исследований.

  5. Выявление отечественных исследований, к которым проявляется повышенный интерес зарубежных исследователей. А также сбор и анализ негативных и нейтральных оценок в отношении разработок, имеющих приоритетные оценки внутри страны.

  6. Выявление недостоверных и устаревших публикаций и связанных с ними исследований, разработок, проектов. Составление перечней недостоверных данных.

  7. Выявление взаимосвязанных множеств публикаций, на базе которых могут быть подготовлены сводные обзоры, а также выявлены перечни тематик, проблем, по которым отсутствуют публикации (имеются информационные "белые пятна").

  8. Построение сравнительных ранжированных (по уровню информированности, изученности и проработанности) тематических перечней раздельно по отечественным и зарубежным публикациям и их сопоставление. В ряде случаев необходимо вести не совокупный анализ, а анализ по схемам: "предприятие-предприятие", "предприятие-группа предприятий", "страна-страна" и т.п. Хорошим и эффективным примером анализа по подобным схемам являются сопоставительные анализы, проводимые Гарфилдом для выявления степени участия различных стран в решении конкретных проблем.

  9. Составление перечней труднодоступных документов и массивов, существующих в конкретных странах и содержащих информацию по интересующим проблемам, с целью направленного поиска требуемой информации. Указанное направление работ недостаточно проработано, а это приводит к тому, что затрачиваются значительные усилия на получение, оценку и анализ второстепенных источников, вместо того, чтобы осуществлять целенаправленный поиск исходного документа.

При проведении анализа необходимо учитывать, что существуют специальные методы, обеспечивающие "обезличивание" информации, что значительно затрудняет аналитическую обработку открытых источников информации.

Различают две группы методов:

  • методы, используемые на уровне единичной публикации;

  • методы "обезличивания" информации на совокупности публикаций. Для единичных публикаций наиболее распространены методы уже упоминавшиеся выше: изложение общей идеи и соображений по предмету исследований, демонстрация методов и результатов исследований с потребительской стороны, т.е. излагается выгода, возможное применение, общая схема, но не дается углубленного изложения, позволяющего повторить полученные результаты, вскрыть заложенные в объекте новые идеи, решения, принципы; изложение проводится применительно к предмету представленному в публикации без связи с основными целями проводившихся исследований.

Например, анализ значительного числа публикаций по методам закрытия информации в автоматизированных системах позволяет сделать вывод о необходимости разработки систем защиты, получить перечень основных методов защиты, но, практически, отсутствуют подходы, реализация которых позволяет реализовать надежную систему закрытия, либо средств "взлома".

Закрытие на уровне отдельной публикации не решает проблемы, необходим комплекс мероприятий по "обезличиванию" нформации на уровне совокупности публикаций.

В основе методов обезличивания информации лежат следующие основные принципы:

  • Разделение публикации на несколько групп данных, каждая из которых имеет различный уровень засекречивания (от несекретно до самых высоких грифов).

  • Формирование нескольких каналов информирования об одной и той же публикации (т.е. одна и та же публикация, в зависимости от того, какая группа данных включается в информационное издание, может сообщать различную информацию о публикации). Это позволяет привлекать к информационному документу различные группы пользователей, не разглашая определенных групп сведений.

  • "Электронная цензура" всей совокупности данных, включаемых в информационные издания, на основе максимально нормализованной терминологии. Это полностью исключает "утечку" новой, неразрешенной к публикации информации. При этом осуществляется разрыв связей между совокупностью документов (для несанкционированного пользователя) за счет выделения указанных связей в группу закрытых данных.

  • Выделения из общей совокупности групп данных, которые не публикуются в печатных изданиях, а отражаются только на машинных носителях и доступных только в автоматизированном режиме, и доступ к которым строго регламентирован за счет реализации процедур защиты. Такие массивы никогда не публикуются в обобщенном виде.

  • Обмен массивами только по каналам связи между строго регламентированными категориями пользователей.

  • Публикация только библиографических описаний документов с представлением самих документов на особых условиях.

  • Сосредоточение результатов обработки в автоматизированных центрах. На запрос выдаются только конкретные данные, массивы - не передаются. Это создает следующую ситуацию:

    • обеспечивается защита от серии запросов, каждый из которых несекретен, но по совокупности позволяет получить закрытую информацию;

    • перед выдачей возможно любое редактирование результатов (данных), в зависимости от уровня допуска;

    • система аккумулирует запросы и на их основе вскрывает интересы пользователя;

    • контроль за всеми ссылками, указанными в публикациях, с целью выявления "неучтенных" в системах информации документов. Однако следует обратить внимание на все более широкое распространение новых видов публикаций (например, индексные издания), в которых полностью отсутствуют ссылки на используемую литературу, информацию о которой пользователь может получить только за дополнительную оплату и только к заказанной статье. Это полностью исключает работу по схеме SCI.

Подобные методы закрытия позволяют, при необходимости, формировать у конкретных пользователей "ИСКАЖЕННОЕ ИНФОРМАЦИОННОЕ ОТРАЖЕНИЕ" исследуемых проблем.

Все это ведет к жесткому регулированию ("невидимому" для большинства пользователей) открытого потока информации.

Раздел 5: "ПОМЕХИ", ВОЗНИКАЮЩИЕ В КАНАЛАХ ПОСТУПЛЕНИЯ (ПЕРЕДАЧИ) ИНФОРМАЦИИ

На информацию, поступающую к пользователю, всегда наложены "помехи", которые затрудняют (а иногда полностью исключают) ее правильно понимание, что приводит к ошибкам в принятии информационных решений.

Последствия ошибок имеют очень широкий диапазон: от принятия результативного, но не оптимального решения задачи, до действий, вызывающих тяжелые отрицательные последствия.

Степень воздействия "помехи" на принятие решений зависит от условий, в которых принимается решение, профессиональной подготовки пользователя и психологических факторов (внутренних и внешних), воздействующих на процесс принятия решений.

Возможные варианты воздействий "помехи" на пользователя могут быть представлены следующим перечнем:
1. "Помеха" не дошла до пользователя (и, соответственно, не оказала непосредственного воздействия на его действия):

1.1. Источник информации с "помехой" оказался недоступным пользователю:

1.1.1. по режимным ограничениям;
1.1.2. языковой барьер;
1.1.3. представлен на носителях, которые не могут быть доступны пользователю из-за отсутствия требуемых технических средств;
1.1.4. подмножество источников не входит в число контролируемых (просматриваемых, отслеживаемых, и т.п.) пользователем;
1.1.5. прочие причины.

1.2. Источник доступен:

1.2.1. "помеха" пропущена пользователем;
1.2.2. "помеха" отброшена пользователем в результате несоответствия критериям, используемым при сборе информации;
1.2.3. информация не соотнесена с задачами и объектами, контролируемыми (отслеживаемыми) пользователем;
1.2.4. "помеха" не воспринята пользователем по причине профессиональной неподготовленности (иной аппарат представления, непонятно и т.п.).

2."Помеха" дошла до пользователя:

2.1. Воспринята как достоверная информация и использована в принятии информационных решений:

2.1.1. нанесла невосполнимый ущерб;
2.1.2. возможный ущерб локализован (снижен, ограничен) другими одновременно действующими причинами,
2.1.3. возможность ущерба находится в скрытой фазе (не наступили условия, в которых "помеха" проявляет себя, "помеха" включена в рабочие картотеки и готовится к включению в процессы активного использования):

2.1.3.1. условия нарастания опасности использования;
2.1.3.2. тиражирование ошибочных информационных решений в виде заготовок информационных решений, сценариев действий и т.п.;
2.1.3.3. скрытое создание "критической массы помех" (скрытое внедрение "помехи" в состав информационных ресурсов пользователя), внедрение "помехи" в систему знаний пользователя, что в последствии создает устойчивый стереотип неправильных действий пользователя.

2.1.4. "помеха" становится основой ложных теоретических, методических и других построений, используемых при принятии информационных решений (приняла образ теории, методики, стандартного решения, общепринятого взгляда (мнения) и т.п.).

2.2. Ложная информация выявлена и идентифицирована:

2.2.1. Одним пользователем (группой взаимосвязанных или конкурирующих пользователей):

2.2.1.1. исключена пользователем из используемой базы информационных ресурсов, но это знание скрывается от конкурентов и других пользователей;
2.2.1.2. используется для дезинформирования;
2.2.1.3. начата работа по локализации распространения "помехи" в информационных ресурсах и сетях, вызванных действием "помехи";
2.2.1.4. разработаны эффективные меры по ликвидации последствий вызванных действием "помехи".

2.2.2. "Помеха" вошла в групповой (корпоративный), национальный или мировой регистр недостоверной (устаревшей, неактуальной) информации.
2.2.3. Возникли различные группы пользователей, использующих "помеху" для достижения определенных групповых интересов (целей):

2.2.3.1. использование "помех" в качестве системных фильтров контроля за качеством информации;
2.2.3.2. использование регистра "помех" для выявления целей, прилей, причин и последствий принятия решения информационных решений на их основе и причин возникновения "помех";
2.2.3.3. анализ последствий использования дефектной информации;
2.2.3.4. выявление влияния "помех" на многоуровневые информационные решения;
2.2.3.5. пересмотр информационных решений, принятых на основании дефектной информации.

2.2.4. Отсутствие реакции пользователей на выявленные "помехи".

3. "Помеха" воздействует на пользователя в скрытом виде, как результат чужих информационных решений (это воздействие особенно сложно выявить и локализовать).

Информационные "помехи" в процессе циркуляции в каналах обмена информации непрерывно преобразуются. Это заключается в том, что содержательная суть не изменяется, а изменяются только внешние, структурные, адресные, идентификационные признаки. В результате "помеха", как бы настраивается на условия, в которых принимаются решения; становится по форме, источнику поступления, "понятности", частоте формальной повторяемости очень похожей на истинную информацию. Например, пройдя многократный перевод, то или иное положение обрушивается на пользователя в качестве подтверждения информации "данными из других источников", особенно когда сам источник обладает высокой степенью надежности.

Более того, ложные посылки (фактология) став базой теоретических положений, формально-логическая правильность которых трудно опровергаема, очень часто становится основой "квазитеорий", поддерживаемых теми или иными профессиональными группами.

Далее, даже в тех случаях, когда "помеха" была идентифицирована и исключена из научного обращения, она может "лечь на грунт" в какой либо публикации и через какое-то время в иных условиях проявить себя в среде тех пользователей, которые не оповещены (не знают) о ее недостоверности, о тех отрицательных последствиях, которые она может вызвать (и вызывала) ранее.

Т.е. "помеха" по принципам действия, распространения и воздействия напоминает возбудителя особо опасных инфекционных заболеваний: со своим инкубационным периодом, изменчивостью возбудителя, сменой носителей и переносчиков и потерей свойств защитных вакцин и мероприятий.

Анализ различных схем распространения и появления дезинформации позволяет выявить основные виды "помех", оказывающих влияние на качество информационных ресурсов и принятие информационных решений:

  1. Избыточная идеализация объекта.

  2. Подмена объекта.

  3. Искажение модели описания объекта.

  4. Ошибки идентификации.

  5. Перевод.

  6. Искажения информации.

  7. Неспособность восприятия информации (недостаток образования, психологическое невосприятие, давление авторитетов, устойчивые стереотипы).

  8. Отсутствие информации.

  9. Частичная или полная недоступность информации.

  10. Неисследованность.

  11. Незнание.

  12. Обобщение.

  13. Слияние информационных массивов различного уровня обобщения, достоверности, полноты, семантической (содержательной) определенности и т.п.

  14. Старение информации.

  15. Ошибки математического аппарата и ошибки в формулах.

  16. Целенаправленная дезинформация.

  17. Недоиспользование информации.

Наиболее сложные ситуации возникают тогда, когда в результате искажений информации создаются ситуации, при которых происходит подмена объекта изучения и/или показателей, которыми описывается данный объект, либо при сборе информации об объекте принята неправильная (неполная для данной задачи модель объекта).

Поэтому при оценке информации основное внимание должно уделяться анализу базовых допущений, принятых при решении задачи.

=

5.1. ИЗБЫТОЧНАЯ ИДЕАЛИЗАЦИЯ ОБЪЕКТА

Основой этого класса "помех" является привлекательность упрощенных понятных всем, как кажется неспециалистам, рассуждений. Чем примитивнее схема (максимально упрощенная теория природного или социального явления), тем удобнее выстроить ее внешне безупречно, выборочно представить те или иные факты, которые ее подтверждают.

Избыточная идеализация, как правило, произвольно исключат наиболее сложные и наименее изученные свойства, структуры и элементы объектов. В состав характеристик включают те, которые известны, обходят те, по которым нет информации или она противоречива, неоднозначна. Наиболее характерным примером подобной идеализации, нашедшим у нас в 70-х годах широкую "научную" прессу, является определение АБСТРАКТНОЙ ИНФОРМАЦИОННО-ПОИСКОВОЙ СИСТЕМЫ (ИПС): "под абстрактной ИПС понимается совокупность информационно-поискового языка (с правилами перевода с естественного языка на этот язык и наоборот) и критерия смыслового соответствия между поисковыми образами документов и поисковыми предписаниями. В понятие абстрактной ИПС не включаются средства ее технической реализации."

То-есть, из определения ИПС были выброшены важнейшие составляющие: массивы, технические средства, каналы связи, персонал, нормативно-техническая документация, правовая база-то, без чего невозможны проектирование и поиск наиболее эффективных технических решений, создание и функционирование реальных систем.

Ущерб, нанесенный такой идеализацией реального объекта, каким является ИПС, был велик, т.к. из изучения были исключены многие факторы, влияющие на создание и функционирование систем. Фактически в 60-70 годах реальное проектирование было не связано с направлениями теоретических работ в области функционирования систем, что привело к перекосу в разработках. Более того, наибольших успехов добились те группы, которые опирались на иные подходы к описанию систем.

Другим примером избыточной идеализации объектов, являются простейшие модели описания сложных технических систем (таблицы характеристик, рекламные описания и т.п.). В них, как правило, не более 7-10 параметров, свидетельствующих о "преимуществах" данного объекта.

Любая попытка приведения однородных объектов, заданных подобными моделями, к аналитическим матрицам, с помощью которых пытаются их сравнивать, приводит к появлению матриц с таким числом нулей, прочерков и несопоставимых признаков, что сделать более-менее объективное сопоставление объектов - невозможно.
=

5.2. ПОДМЕНА ОБЪЕКТА

Подмена одного объекта другим в результате неправильного и/или нетождественного определения границ объекта и признаков, позволяющих выявлять (задавать) эти границы, - наиболее распространенная "помеха" при решении любых задач, в том числе и при принятии решений.

В результате под одним идентификатором объекта сосредотачивается информация о различных объектах (тождественных, сходных по случайным признакам, но существенно различающихся в главном: назначении, реализуемым функциям и их полноте, по воздействию на другие объекты, конфигурации и т.д.). Нередко различные группы пользователей один и тот же объект отождествляют как различные объекты. При этом возможен вариант, когда различные группы значений характеристик об объекте соотносят с разными объектами, а сам оригинал - объект "исчезает" как самостоятельная единица учета, т.е. отсутствует в модельных представлениях лиц, принимающих решение.

Подмена объекта ведет как к появлению "объектов-фантомов" (несуществующих в реальной действительности объектов), так и "исчезновению" реальных объектов-оригиналов. Приведенный в п.5.1 пример избыточной идеализации объекта введением понятия абстрактной ИПС может служить и иллюстрацией подмены реального объекта изучения. Ибо приведенное определение фактически подменяет ИПС упрощенной моделью языка индексирования и процедуры отождествления сходства запроса с содержанием документа.

Воздействие этой группы "помех" тем больше, чем более ограничен доступ к информации об объекте, и, чем ниже квалификация лиц, принимающих решения и ведущих подготовку информации.

Преднамеренная подмена объектов часто проводится в тех случаях, когда для публикации результатов исследований в качестве "крыши" используется иное подразделение, иной проект, в рамках которого как бы ведутся те или иные разработки. Такой прием позволяет скрыть действительное назначение разрабатываемого объекта, область его применения и т.п.

Результатом таких подмен является появление объектов техники с несвойственной им конфигурацией оборудования или фиктивных объектов.

Примером могут служить и многочисленные случаи, когда прототипу или макетным образцам технических объектов приписываются характеристики объектов, которые могут прийти им на смену, а также присвоение имени конечного продукта, экспериментальным образцам различных модификаций объекта, проходящих испытания.
=

5.3. ИСКАЖЕНИЕ МОДЕЛИ ОПИСАНИЯ ОБЪЕКТА

Искажения модели описания объекта, могут быть преднамеренным, и/или определяться "благими намерениями" (выделение "главного", большая наглядность и обозримость описания, исключение "пустых мест" в характеристиках, "умолчание" "несущественных параметров", сокрытие особенностей определения используемых показателей и т.п.), либо просто "по умолчанию".

"Умолчание", когда те или иные особенности не упоминаются совсем, ведет к тому, что перед пользователем возникает целый набор трудно разрешимых альтернатив, например:

  • не упомянуто, следовательно, отсутствует и/или "как обычно", и/или "в пределах принятых нормативов";

  • есть, но нет достаточных оснований для включение в число характеристик, задающих объект;

  • нет данных;

  • данные однотипных объектов несопоставимы и/или не свидетельствуют в пользу рекламируемого (либо выбранного за базовый) объекта.

Основные искажений модели описания объекта могут быть заданы следующим перечнем:

  1. Полнота информационного описания не соответствует требованиям решаемой задачи.

  2. Неправильно заданы границы описания оригинал-объекта.

  3. Неправильно построены показатели, задающие анализируемые свойства (параметры, характеристики) объекта.

  4. Нарушены допустимые отклонения от точности представления показателей.

  5. Разброс в значениях показателей.

  6. Отсутствие (пропуск) невыгодных показателей.

  7. Ложные данные по свойствам объекта.

  8. Сокрытие данных по объекту.

Перечисленные группы искажений взаимодействуют комплексно.

Поэтому при описании каждого оригинал-объекта, необходимо как-бы воссоздавать условия появления этого описания, контролировать на достоверность все внесенные в описание данные, обосновывать возможность их использования при принятии конкретного информационного решения.

5.4. ОШИБКИ ИДЕНТИФИКАЦИИ

Как правило, возникновение ошибок идентификации начинается на этапе поиска информации.

Исследования, связанные с изучением различных указателей документальных источников информации, свидетельствуют о том, что значительные искажения вводятся составителями документов за счет ошибок в написании имен авторов (коллективных и индивидуальных, а также наименований объектов. Например:

  • Создавая в течение 10 лет сводную картотеку коллективных авторов на основе фондов государственной библиотеки "Прусский культурный фонд" (Зап.Берлин), немецкой библиотеки во Франкфурте-на-Майне и Боварской библиотеке в Мюнхене, выявили 207 тыс. авторов и 402 тыс. написаний их фамилий [РЖ 6И202,1985].

  • Варианты написания фамилии автора-венгерского математика Georgt Polia в различных изданиях имеют следующие формы представления [Д.Пойя. Математическое открытие. Решение задач: основные понятия, изучение, преподавание.-М.: Наука, Гл. ред. физ.- мат.лит., 1970]: Дж.Пойа, Георг Полиа (немецкий вариант), Дьердь Пойа(венгерский вариант), Д.Пойя.

  • По данным [ЭИ Информатика,#9,1984, Исследование достоверности библиографических ссылок] в опубликованных журнальных статьях от 10 до 13% библиографических ссылок содержит ошибки. Анализ 2500 ссылок на одну из работ за 1976-1981 гг. показал: 180 авторов одновременно сослались и на статью о книге и книгу; из них в 148 указано заглавие статьи, причем 114-верно, а в 34 случаях(23%) с той же ошибкой, что в книге. Более подробный анализ показал (в данном примере), что лишь малое число авторов может быть обвинено в некорректном цитировании(4-5%). Значительная часть ошибок относится к тем данным, которые задают номера томов, страниц, что существенно затрудняет поиск требуемых источников и, соответственно, контроль приведенной в источниках информации.

  • Ошибки, связанные с ложным отождествлением однофамильцев в качестве одного и того же лица. Последствия различны: от неправильной идентификации уровня доверия к информации и области деятельности и уровня квалификации, до неправильной оценки достоверности и надежности источника информации.

Особо следует рассмотреть вопросы, связанные с идентификацией марок изделий и наименований фирм и предприятий.

В ряде технических заданий на разработку баз данных по изделиям и организационным единицам обычно используются следующие посылки:

  • Марки изделий являются, в сущности, не лексическими единицами естественного языка, а однозначно заданными (для каждого изделия) условными обозначениями. В связи с этим неоднозначность их написания и интерпретации в системе маловероятна (?!). Необходимо только не допускать отклонений от обозначений, установленных производителями изделий. Какая-либо дополнительная нормализация употреблений марок изделий является излишней.

  • Предприятия и фирмы также могут быть однозначно идентифицированы по их официальным названиям, установленным самими фирмами и используемыми в научно-технической литературе. Как и другие наименования, эти названия не переводятся на другие языки. Возможно, правда, применение транслитерации.

Приведенные утверждения некорректны. В действительности идентификация изделий, фирм и предприятий по их наименованиям является достаточно сложной проблемой. Это обусловлено следующими причинами:

  • многие объекты имеют несколько имен, каждое из которых используется в конкретных условиях;

  • существуют родовые имена, под которыми группируется некоторое подмножество однородных, но не тождественных по своему назначению, свойствам, функциям и характеристикам объектов;

  • одни и те же имена могут принадлежать принципиально различным объектам;

  • перенос наименований в иную языковую среду ведет, как правило, к появлению имен заменителей, которые после прохождения через несколько языковых преобразований порождают имена-идентификаторы, которые не могут быть однозначно идентифицированы с исходным объектом, что ведет к появлению "объектов-фантомов".

Трудности идентификации объектов по их наименованиям пытаются обойти с помощью использования "записи их имен на языке оригинала".

Но такой подход реально осуществить далеко не просто, т.к. он не может быть реализован без наличия в системах полного алфавита ВСЕХ языков, на которых ведется обработка информации.

Но и это не избавит от ложных отождествлений объектов. Ибо абсолютно идентичное по написанию имя собственное, может принадлежать принципиально различным объектам.

Поэтому утверждения типа: в настоящее время в информационных изданиях (например, ВИНИТИ, система МОСФИтракторостроения (одна из подсистем бывшего МЦНТИ стран-членов СЭВ) ) сложилась традиция записи названий предприятий и фирм на языке оригинала; -необходимо рассматривать как прием, используемый в действующих системах, но одновременно необходимо понимать, что данный прием в действительности не дает решения проблемы однозначной идентификации объектов по их именам.

Одним из методов повышения качества идентификации имен собственных (принадлежащих самым различным объектам: фамилий, географических наименований, наименований фирм) является транслитерация.

Именно этим вызвана разработка систем и правил транслитерации различных имен (географических наименований, наименований фирм, предприятий, имен собственных), представленных на различных языках, использующих различные алфавиты на основе латиницы, кириллицы и других графических представлений символов.

Создание правил, соответствующих зачастую противоречивым, сложившимся под воздействием различных факторов традициям передачи иноязычных имен собственных в русских текстах крайне затруднительно. В нашей стране этой проблеме не уделялось должного внимания, что существенно затрудняло обработку данных в полиязычных информационных системах. Проведенные в 80-х годах работы по разработке стандартов по транслитерации латиницы в кириллицу создавали определенную базу нормирования представления латинизированных текстов русским алфавитом.

Однако процессы суверенизации республик разрушили достигнутые договоренности, а их переход на национальные языки еще более осложнил вопросы однозначной идентификации имен объектов.

Сложность идентификации усиливается рядом дополнительных факторов:

  • смена алфавита, проведенная в ряде республик, влечет изменение норм написания, как на языке оригинала, так и на языках перевода. Например: Кыргызстан, Башкаркостан;

  • массовым переименованием объектов учета (фамилий, географических наименований и др.);

  • разрушением сложившихся норм перевода на другие языки;

  • появлением огромного числа новых слов в базовых языках. Данная ситуация будет особенно характерна для всех новых государственных образований на территории бывшего СССР.

В принципе, перед разработчиками информационных систем республик возникла еще более сложная проблема создания многоязычных и многоалфавитных перечней наименований изделий, фирм, предприятий и других имен собственных, и каждая республика теперь будет решать эти проблемы самостоятельно и далеко не всегда успешно, что существенно осложнит проблемы идентификации объектов по их именам.
=


<< предыдущая страница   следующая страница >>