Главная Случайная страница


Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






Решение этих задач составляет технологию доступа к информационным ресурсам и ресурсам знаний.

1. Выбор информационных ресурсов

При решении информационной задачи встает вопрос выбора информационных ресурсов. Если имеется предметный каталог информационных ресурсов, то мы выбираем рубрику, к которой относится необходимая нам информация, и осуществляем поиск среди документов, относящихся к этой рубрике. Однако необходимая информация может содержаться не только среди документов, относящихся к данной рубрике, но и в других рубриках. Данную особенность информации принято называть "рассеиванием" информации.

Исследования в области информатики показали, что 50% информации будет содержаться не в той рубрике, которая выделена для документов определенного содержания, а в соседних рубриках. Из этой закономерности следует, что если вы будете искать только в одной рубрике предметного каталога, то потери информации составят 50%.

Процесс выбора информационных ресурсов должен основываться в первую очередь на работе с источниками метаинформации, такими, как каталоги, справочники, реферативные и библиографические издания. Рассмотрим наиболее популярные из них.

Авторитетным справочником по периодическим изданиям является Ulrich's Periodicals Directory (http://ulrichsweb.com), подготавливаемый американской фирмой Bowker. В данном справочнике представлено наиболее полное описание периодических изданий со всего мира. Доступ к справочнику возможен через Интернет после подписки, а также на CD-ROM.

Метаинформация по профессиональным базам данных содержится в Gale Directory of Databases (www.gale.com). Gale Directory of Databases была создана в 1993 г. при слиянии трех справочных изданий, приобретенных компанией Gale Research: Computer-Readable Databases (основано в 1975 г. Редактором Marta Е. Williams, приобретено Gale в 1987 г.), Directory of Online Databases (основано ассоциацией Cuadra в 1979 г., приобретено Gale в 1992 г.), Directory of Portable Databases (основано Cuadra Elsevier в 1990 г. и также приобретено Gale в 1992 г.). Эти три справочных издания были объединены в единое издание Gale Directory of Databases, которое в виде двух томов публикуется дважды в год. В первом томе издания приводится список всех онлайновых баз данных. Там же можно найти статистические даннные об индустрии профессиональных баз данных, демонстрирующие рост числа баз данных, их производителей и продавцов, увеличение объемов баз данных — числа записей и ряд других сведений. Во второй том включена информация обо всех базах данных, распространяемых на CD-ROM.

Gale Directory of Databases (http://www.gale.com/pdf/facts/gdd.pdf) предоставляет детальную информацию о более чем 19 тыс. баз данных, доступных в режиме онлайн и на CD-ROM или в иной форме. Описание баз данных включает наименование и контактную информацию производителя баз данных, тематику представленной информации, ее язык и географию, частоту обновления, варианты подписки и ее стоимость и др.

Тематика описываемых баз включает в себя все отрасли науки и профессиональной деятельности. Отдельно выделены документы, содержащие подробные сведения о 3600 производителях баз данных и 2400 онлайновых службах и поставщиках баз данных, списки предлагаемых баз.

Метаинформация о российских информационных ресурсах подготавливается научно-техническим центром "Информрегистр" (www.inforeg.ru) в виде электронного каталога, по итогам добровольной регистрации российских баз данных. Работы по учету и регистрации баз и банков данных, а также по ведению Государственного регистра баз данных осуществляются "Информрегистром" в соответствии с постановлением Правительства РФ "О государственном учете и регистрации баз и банков данных" от 28 февраля 1996 г. № 226. На 2003 г. электронный каталог Государственного регистра баз данных содержал описания 8129 баз данных. Однако данный каталог не может дать полного представления о российский базах данных, так как регистрация добровольная и многие производители свои базы не регистрируют по различным причинам.

ООО "Международное бюро информации и телекоммуникаций" (МБИТ) (www.mbt.ru) выступает поставщиком метаинформации, предлагая на информационном рынке следующие услуги: российскую энциклопедию информации и телекоммуникаций (электронная версия находится на сайте "Инфопартнер" (http://reit.mbt.ru/rus/)), веб-каталог деловой информации, веб- каталог бизнес-ресурсов по рынку товаров и услуг, оказание информационно-поисковых, аналитических и консультационных услуг.

Известно, что ни одна реферативная база данных, подготавливаемая зарубежными или отечественными производителями, не может претендовать на полноту тематического и видового охвата первоисточников, как бы она к этому ни стремилась. Только поданным Ulrich's Periodicals Directory, почти 66 тыс. наименований периодических и продолжающихся изданий (из них 49 тыс. являются периодическими) реферируется и индексируется для различных информационных продуктов.

Работа с метаинформацией позволяет подготовить обоснование выбора того или иного информационного ресурса в соответствии с требованиями пользователя.

При поиске основными критериями оценки информационного ресурса являются следующие:

· источники информации, из которых формируются информационный ресурс, их количество;

· периодичность обновления информации (ежедневное, еженедельное и т.п.);

· возможные варианты подписки и стоимость доступа к информационному ресурсу;

· пользовательский интерфейс, удобные поисковые инструменты;

· • полнота поиска;

· содержательное наполнение информационного ресурса, т.е. тематика представленной в нем информации, географическое покрытие, временной охват, глубина ретроспективы и т.д.;

· возможности применять формализованный поиск информации.

Виды подписки на доступ к базам данных могут быть различными, так же как и способы оплаты доступа к информации. Среди основных вариантов подписки можно выделить:

· разовое обращение к информационной системе. Оплата за документ предусмотрена в агентствах Интегрум Техно, LexisNexis и др.;

· абонементный доступ к информационной системе на какой-либо период времени. Например, Reuters Business Briefing (www.factiva.com) - 750 долл. США в месяц за 20 ч работы и дополнительная плата за получение маркетинговой и аналитической информации.

2. Поиск информации в профессиональных базах

Интенсивное развитие информационно-коммуникационных технологий повлекло за собой лавинообразный рост накапливаемой информации. Было замечено, что рост документальной информации подчиняется закону Мура с небольшой корректировкой, т.е. объем документальной информации удваивается каждые три года.

Большие массивы информации ведут к увеличению затрат на приобретение доступа к информационным ресурсам и времени для работы с ними. Эффективность работы с информационными ресурсами зависит во многом от методов структуризации информации в базах данных, программного обеспечения для работы сбольшим массивом информации и, конечно, от квалификации специалистов, где большое значение приобретают знания и умения поиска информации.

Одним из основных преимуществ профессиональных баз данных перед ресурсами Интернета является обработка поступающей информации, т.е. разнесение ее по рубрикам, выделение в документах сегментов, таких, как автор, заголовок, дата и т.п. Например, информационные ресурсы в системе LexisNexis иерархически структурированы, что обеспечивает пользователю дополнительные возможности для проведения поиска.

Вся информация, находящаяся в LexisNexis, расположена в различных библиотеках, всего 180 библиотек. Каждая библиотека представляет собой коллекцию источников информации, относящихся к определенной тематике; например, библиотека NEWS (газеты, журналы, сообщения информационных агентств, бюллетени), библиотека COMPANY (разнообразная справочная информация о компаниях), библиотека MARKET (содержит источники информации о рекламе, маркетинге, исследованиях, рынка, сбыте, состоянии мирового и регионального рынков различных товаров) и т.д., или же библиотеки формируются по географическому признаку, например, WORLD, EUROPE, ASIA и т.д.

Каждая библиотека содержит файлы. Файл является минимальной единицей, в которой проводится поиск. Файл содержит документы, поступающие от одного или нескольких источников информации.

Каждый документ в файле состоит из нескольких частей, которые называются сегментами. Общими сегментами для всех документов являются: название (сегмент HEADLINE); автор (сегмент BYLINE); дата (сегмент DATE); текст документа (сегмент BODY). Кроме того, дополнительно в зависимости от тематики документа выделяются сегменты "компания" (куда заносятся наименования всех компаний, упоминавшихся в документе); продукт (название продуктов или услуг, о которых идет речь в документе); регион; персонал и т.д. В зависимости от типа документа — статья в газете, маркетинговый отчет, судебное дело, биография известного человека — будет меняться набор сегментов, из которых состоит документ, и названия сегментов.

Поисковые инструменты информационных систем могут иметь как общие черты, так и существенные различия. В некоторых видах систем удобство инструментов для работы с массивами документов является основным конкурентным преимуществом. Например, на российском рынке правовой информации производители справочно-правовых систем борются за потребителя путем совершенствования интерфейса и поисковых инструментов своих систем.

Поиск информации является важной составляющей работы с информационными ресурсами и занимает значительное время работы пользователя с системой. Для повышения эффективности процесса поиска и сокращения затрачиваемого на него времени разрабатываются различные поисковые инструменты и формы предоставления информации. Файлы могут быть либо фактографические, либо документальные.

Выполнение информационного поиска возможно либо по тексту (полнотекстовый поиск), либо при помощи каталога. При полнотекстовом поиске отыскиваются слова в тексте документа либо в его сегменте, например, в заголовках статей и рефератах, перебирая все варианты написания и синонимы. В некоторых системах поисковая программа позволяет вводить набор слов и учитывает некоторые формы слова, например, множественное число.

Каталог в информационной системе — это оглавление файлов, составленное по тематическому или региональному признаку, имеющее иерархическую структуру.

Полнотекстовый поиск и поиск при помощи каталога не являются взаимоисключающими, напротив, наиболее эффективные стратегии поиска получаются при их комбинации.

Несмотря на разнообразие поисковых инструментов, процесс поиска информации можно разбить на четыре этапа.

1. Формулировка задачи. Цель этого этапа состоит в четком определении информационной потребности. Информационной потребностью может быть определенный документ, например закон или публикация, конкретная информация или информация, посвященная определенному кругу вопросов. Исходя из формулировки потребности, можно выбрать наиболее подходящие методы поиска, подобрать ключевые слова, которые могут встречаться в искомых документах.

2. Выбор информационного ресурса. После формулировки информационной задачи необходимо выбрать информационный ресурс, который может содержать неполную информацию. Выбор информационного ресурса ограничивается возможностями получения доступа.

3. Построение запроса. После того как информационная задача строго сформулирована и выбран информационный ресурс, необходимо составить поисковый запрос.

Для документальной информационной системы может быть предложена следующая последовательность действий:

· выбрать соответствующую тематическую рубрику (как правило, в базах данных информация разнесена по рубрикам);

· разбить вопрос на понятия, которые следует искать отдельно, а затем объединить их соответствующими логическими операторами (and, or, not), если в системе поиска предусмотрены булевы операции.

Практически во всех информационных системах существует свой язык построения поисковых запросов для проведения Поиска слов и выражений по тексту документа. Общими элементами этих языков является булева логика, разработанная английским математиком Джорджем Булем (1815-1864). Булева логика используется тогда, когда поисковый запрос содержит более одного понятия. В этом случае можно применить операции: "И" (AND - требует наличия всех терминов, в результате уменьшает число найденных документов), "ИЛИ" (OR - требует наличия в документе хотя бы одного понятия, в результате увеличивает число документов), "НЕ" (NOT - требует отсутствия термина, в результате уменьшает число найденных документов);

· учесть все варианты написания слов и синонимы при поиске произвольного текста. Необходимо использовать соответствующие классификаторы, словари и тезаурусы, что может значительно повысить эффективность запроса.

4. Оценка результатов поиска является важным этапом информационного поиска. Она зависит от того, для каких целей будут использованы результаты поиска.

Критерии оценки поиска:

· количество найденных документов;

· найденные источники информации;

· оперативность информации.

По результатам поиска, как правило, запрос корректируется. Для достижения наилучшего результата специалисты составляют несколько запросов на поиск информации. При поиске информации большое значение имеют знание специалиста инструментов поиска и умение их применять. При подписке на информационную систему сотрудники фирмы, как правило, проходят обучение работе с этой системой.

Таким образом, информационный поиск представляет собой упорядоченную последовательность действий, для того. чтобы отыскать необходимую информацию.

Особое внимание следует уделить вопросам минимизации стоимости получаемой информации от источников. В ряде случаев поиск информации производится в рамках выделенной для этого суммы. Работая с метаинформацией, возможно предварительно оценить стоимость необходимой информации.

Высокая квалификация пользователя и умение работать на предварительном этапе с документацией резко снижают общую стоимость информации, необходимой пользователю.

Последнее изменение этой страницы: 2016-07-23

lectmania.ru. Все права принадлежат авторам данных материалов. В случае нарушения авторского права напишите нам сюда...