Главная Случайная страница


Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






Данные и знания. Экстенсионал и интенсионал понятия.

Знания - совокупность фактов, закономерностей и эвристических правил, с помощью которых решается поставленная задача.

Истинные знания образуются на основе распределенных взаимосвязей разнородной информации.

По определению Денхема Грэя, "знания - это абсолютное использование информации и данных, совместно с потенциалом практического опыта людей, способностями, идеями, интуицией, убежденностью и мотивациями".

Структурированность. Знания должны быть "разложены по полочкам".

Удобство доступа и усвоения. Для человека - это способность быстро понять и запомнить или, наоборот, вспомнить; для компьютерных знаний - средства доступа к знаниям.

Непротиворечивость. Знания не должны противоречить друг другу.

Процедуры обработки. Знания нужны для того, чтобы их использовать. Одно из главных свойств знаний - возможность их передачи другим и способность делать выводы на их основе. Для этого должны существовать процедуры обработки знаний.

Понятие "информации" непосредственно связано с сущностью процессов внутри информационной системы, тогда так понятие "знание" скорее ориентировано на качество процессов. Понятие "знание" тесно связано с процессом принятия решений.

Рассмотренные понятия являются частью одного потока: у истока его находятся данные, в процессе передачи которых возникает информация, и в результате использования информации, при определенных условиях, возникают знания.

Для получения ценных знаний необходимы качественные процедуры обработки. Процесс перехода от данных к знаниям занимает много времени и стоит дорого.

Понятие – один из способов представления знаний.

Существует 2 способа определения понятия:

Интенсионал – определение понятия через понятие более высокого уровня абстракции с указанием специфических свойств.

Экстенсионал – определение понятия через перечисление понятий более низкого уровня иерархии или фактов, относящихся к определяемому. Т.е определение через данные.

В широком понимании данные представляют собой факты, текст, графики, картинки, звуки, аналоговые или цифровые видео-сегменты.

Данные могут быть получены в результате измерений, экспериментов, арифметических и логических операций.

Данные должны быть представлены в форме, пригодной для хранения, передачи и обработки.

Иными словами, данные - это необработанный материал, предоставляемый поставщиками данных и используемый потребителями для формирования информации на основе данных

Объект описывается как набор атрибутов.

Объект также известен как запись, случай, пример, строка таблицы и т.д.

Атрибут - свойство, характеризующее объект.

Например: цвет глаз человека, температура воды и т.д.

Атрибут также называют переменной, полем таблицы, измерением, характеристикой.

Измерение - процесс присвоения чисел характеристикам изучаемых объектов согласно определенному правилу. В процессе подготовки данных измеряется не сам объект, а его характеристики.

Шкала - правило, в соответствии с которым объектам присваиваются числа.

Переменные могут являться числовыми данными либо символьными.

Числовые данные, в свою очередь, могут быть дискретными и непрерывными.

Дискретные данные являются значениями признака, общее число которых конечно либо бесконечно, но может быть подсчитано при помощи натуральных чисел от одного до бесконечности.

Непрерывные данные - данные, значения которых могут принимать какое угодно значение в некотором интервале. Измерение непрерывных данных предполагает большую точность.

 

Сообщения, коды, шифры, знаки, символы.

Сигнал называется дискретным, если параметр сигнала может принимать лишь

конечное число значений, и существен лишь в конечном числе моментов времени

(возможно, периодически повторяющихся).

Дискретными сообщениями называются такие сообщения, которые могут быть

переданы с помощью дискретных сигналов.

Языковые сообщения в письменной форме строят обычно, записывая знаки

письма (графемы) друг за другом. Хотя длинные сообщения могут размещаться

на многих строчках и страницах, это разбиение не имеет, вообще говоря, никакого

значения; оно не несёт важной информации. По существу такие сообщения

являются последовательностями знаков. Это оказывается справедливым и для

устных языковых сообщений, если разложить устный текст на элементарные

составные части, так называемые фонемы, и под знаками понимать фонемы.

Точка зрения, что сообщение есть последовательность знаков, не

ограничивается, разумеется, тем случаем, когда знаки - это фонемы или графемы

(например, знаки букв и цифр, знаки препинания). Знаки планет или знаки

зодиака и даже кивок и покачивание головой также могут пониматься как знаки.

Поэтому мы определим понятие знака существенно шире.

Знак- это элемент некоторого конечного множества отличимых друг от

друга „вещей", набора знаков.

Набор знаков, в котором определён (линейный) порядок знаков, называется

Алфавитом.

Если N - предложение некоторого естественного языка, то N можно

рассматривать как последовательность знаков, по крайней мере, тремя разными

способами.

Прежде всего, N представляет собой последовательность букв, цифр, знаков

препинания и т. д.; далее, N — это последовательность слов, которые в другом

контексте могут сами рассматриваться как знаки; наконец, и всё предложение

целиком можно рассматривать как один знак.

Первое понимание используется, например, когда имеется правило для

кодирования сообщения N в текстовом файле; второе понимание лежит в основе

стенографических сокращений; крайнее третье понимание бывает уместным при

переводе на другой естественный язык, когда пословица одного языка

переводится соответствующей по смыслу пословицей другого языка.

Дискретные сообщения представляют собой (конечные или бесконечные)

последовательности знаков. При этом, исходя из соображений, связанных с

физиологией органов чувств, или из чисто технических соображений, их обычно

разбивают на конечные последовательности знаков, называемые словами.

На более высоком уровне каждое слово можно снова рассматривать как знак,

при этом соответствующий набор знаков будет, вообще говоря, шире

первоначального. Обратно, данный набор знаков можно получить с помощью

составления слов, исходя из некоторого набора с меньшим числом знаков, в

частности из двоичного набора знаков. Некоторые из перечисленных выше

наборов получены с помощью словообразования „над" конкретными двоичными

наборами знаков или, абстрактно, над набором {1, 0}.

Слова над двоичным набором знаков называются двоичными словами. Они не

обязаны иметь постоянную длину (см. азбуку Морзе), если это всё же так, то

говорят об n-разрядных двоичных знаках и n-разрядных двоичных кодах.

Дадим теперь точное определение:

Кодом называется правило, описывающее отображение одного набора знаков в

другой набор знаков (или слов); также называют и множество образов при этом

отображении. Если каждый образ при кодировании является отдельным знаком, то такое

отображение мы называем шифровкой, а образы - шифрами (англ. cipher).

Поскольку здесь имеется криптографический аспект, обращение этого

отображения — когда онооднозначно — называется декодированием или

дешифровкой. В коммерческих и криптографических кодах слова, фразы и понятия

естественных языков кодируются в большинстве случаев словами над некоторым

буквенным или цифровым алфавитом, обычно пятерками. В технических кодах

буквы, цифры и другие знаки почти всегда кодируются двоичными словами.

Последнее изменение этой страницы: 2016-08-11

lectmania.ru. Все права принадлежат авторам данных материалов. В случае нарушения авторского права напишите нам сюда...