Г Л А В А   1

 

ПРЕДСТАВЯНЕ  НА  ДАННИТЕ

DATA  REPRESENTATION

 

 

§ 1.1  Представяне на данните в цифровите процесори

Presentation of Data in Digital Processors

 

 

 

      Понятието  информация

      Терминът “информация” е масово употребяван в най-различни контексти на общуването ни, но малко са онези, които биха били в състояние да го определят научно. Този термин (латинско information – разяснение, изложение, осведоменост) е едно от най-общите понятия в науката, означаващ някакви сведения, някакви знания, съвкупност от някакви данни или знания и пр.

      В широкия смисъл, когато се говори за информация, това означава отражение на реалния свят, а в тесния смисъл означава някакви сведения, които са обект на съхранение, на предаване или на преобразование.

      От гледна точка на практиката информацията винаги представлява някакво съобщение и в този смисъл информационното съобщение е свързано с предавателя, с приемника и с канала за връзка, както е юлистрирано на фигурата.

 

 

      Видове информация и свойства на информацията

      Като правило, свойствата на всеки обект, подлаган на изучаване, могат да бъдат разделени на два класа: външни и вътрешни свойства.

      Вътрешни свойства – това са свойства, органически присъщи на обекта. Тези свойства обикновено са скрити от изучаващия обекта и се изявяват косвено при взаимодействие на дадения обект с други обекти.

      Външни свойства – това са свойства, характеризиращи поведението на обекта при взаимодействието му с други обекти.

      За всяка информация могат да бъдат посочени три обекта на взаимодействието: източник на информацията, приемник на информацията и обект или явление, което дадената информация отразява. По тези причини могат да бъдат определени три групи външни свойства, най-важните от които са свойствата на информацията от гледна точка на потребителя. Първата група външни свойства, които ще представим, са:

      Качество на информацията (или показател на качеството) – някаква обобщена положителна характеристика на информацията, отразяваща степента на нейната полезност за потребителя. Най-често се разглеждат (или се въвеждат) показатели на качеството, които могат да се изразят количествено.

      Качеството на информацията се характеризира с:

Релевантност (същественост) – способност на информацията да съответства на необходимостите на потребителя.

Пълнота – свойство на информацията изчерпателно (за дадения потребител) да характеризира обекта и/или процеса, който отразява.

Своевременност (актуалност) – способност на информацията да съответства на нуждите на потребителя в съответния момент от времето.

Достоверност – свойство на информацията да не съдържа скрити грешки.

Достъпност - свойство на информацията, което характеризира възможността да достигне до дадения потребител.

Защитетост - свойство на информацията, което характеризира невъзможността от несанционираното й използване или изменение.

Ергономичност - свойство на информацията, което характеризира удоството на формата или на обема от гледна точка на дадения потребител.

      Информацията, логически и адекватно отразяващата обективните закономерности в природата, в обществото и в мисленето, се определя като научна информация. Това определение характеризира взаимоотношението “информация-отразяван обект/явление”, което по същество се отнася към втората група от външни свойства на информацията, най-значителното от които е свойството адекватност.

Адекватност – свойство на информацията еднозначно да съответства на отразявания обект или явление. За потребителя обаче адекватността е вътрешно свойство, което се проявява чрез свойствата релевантност и достоверност.

      Измежду вътрешните свойства на информацията най-важни са обемът (количеството) и нейната вътрешна организация (структура). Според вътрешната организация информацията се дели на две групи:

1.       Данни (лат. data) – обикновен, логически неподреден набор от разнообразни сведения.

2.       Логически подредени, логически организирани по някакъв начин набори от данни.

      Подредеността на данните се постига чрез налагане върху тях на някаква структура (от тук произлиза често използвания термин – структура от данни).

      В тази втора група специално се отделя организираната по особен начин информация, наречена знания. Знанията, за разлика от данните, представляват информация не за някакъв единичен, конкретен факт, а представляват информация за това как са устроени всички факти от определен тип.

      На края ще разгледаме група от свойства на информацията, които характеризират взаимоотношенията “информация-източник”, както и свойства на информацията, свързани с процеса на нейното съхранение.

      Най-важното свойство в този смисъл представлява свойството жизнеспособност, което се изразява в способността на информацията да съхранява своето качество във времето, съхраняваща се в единичен екземпляр.

      Уникална се нарича информацията, която се съхранява в един единствен екземпляр.

      Класификация на информацията по вид може да беде направена във връзка с наличието или отсъствието на едни или други свойства, например по предметна принадлежност (икономическа, историческа, техническа и т.н.).

      Информацията може да съществува във вид на:

·         Текстове, рисунки, чертежи, фотографии;

·         Светлинни или звукови сигнали;

·         Радиовълни и т.н.

      В областта на компютърните науки понятието информация е фундаментално и актуално и се използва за именоване дори на професионални направления, ето защо специалистът в това направление е длъжен да изгради пълно и правилно своето разбиране за него.

      Данните, които обработват цифровите машини, се делят на три вида:

·      Логически;

·      Символни;

·      Числови.

      Единственото техническо средство за представяне на данните в електронните изчислителни машини (само ония, които се имат предвид тук) се основава на устойчиви във времето природни явления. Най-често това са състояния на известни електронни схеми или физически носители на информация. Обикновено природата предлага, при определени условия, две устойчиви състояния: тъмно/светло, намагнитено (наелектризирано) в плюс (+), или в минус (-); посока на движение - напред/назад; отпушен/запушен електронен елемент и т.н. С други думи става дума за системи от два символа. Елементите (в широкия смисъл на тази дума), които могат да съществуват дълготрайно (устойчиво) в такива състояния, могат да бъдат наречени двузначни. Техните две устойчиви състояния, по предварителна уговорка, могат да бъдат означени със символите (0,1). Тъй като тези два символа с еднакъв успех се използват за означаване както на логически, така и на числови данни, то елементите които ги реализират (разбирайте техническите средства), се наричат логически и в същото време цифрови. Употребата на едното или другото наименование на елементите най-често зависи от контекста на обработката и интерпретацията на данните. Възможността за такава двойна интерпретация се нарича дуализъм и успешно се използва в научните изследвания. За да постъпят данните в черната кутия (вижте фигура 1 в предговора), очевидно се налага изводът, че и трите вида данни следва да бъдат представяни с помощта на уговорените символи или още цифри. Това е основният мотив електронните изчислителни машини от този вид да се наричат цифрови.

      Тази природа на нещата предопределя избора на абстракциите, с помощта на които човек е успял да материализира голяма част от своята дейност. Абстракциите, които човек е въвел, познавайки света и себе си, са много. В процеса на тяхното прилагане той използва главно две системи – гласова (звукова) и писмена (графична). Въпреки своята сложност и многообразие всяка от системите се основава на едно минимизирано по обем множество изразни елементи, характеризиращо се с функционална пълнота. Обемът на тези множества обаче е много по-голям от 2. Ето защо, когато говорим за представяне на данните от входно-изходния поток на интересуващото ни техническо средство (фигура 1) (вижте Предговора), е пределно ясно, че двузначната система не може да се приложи буквално, а само в условията на еднозначен двоичен код.

      Понятието код се определя като

изразно средство, съпоставимо еднозначно в права и обратна посока на съответен първичен елемент.

Двоичният код съществува в определено изразно поле както е показано на рисунката

като последователност от двоични цифри, която следва да се разбира като еднозначно (еквивалентно) означение (съответствие) на даден първичен елемент (например буквата Ю) както в права, така и в обратна посока. Кодът на даден първичен елемент, например символ, избран при натискане на клавиш от клавиатурата на компютъра, се формира (образува) в логическа схема, наречена шифратор (кодер). Възстановяването (визуализацията) на първичния елемент по зададената му кодова комбинация се постига от логическа схема, наречена дешифратор (декодер). Множеството двоични комбинации, които се съпоставят съответно на множеството първични символи, се дефинира с помощта на таблица. Тази таблица наричаме кодова таблица.

      Проблемите, свързани с разработване на кодове, оптимални за определено приложение, няма да бъдат разглеждани тук. Ще отбележим само, че дължината на кодовата комбинация е пропорционална на обема на апаратните разходи за обработване на така кодираната информация, ето защо за параметъра дължина обикновено се търси минимум, с други думи дължината на кодовата комбинация трябва да бъде минимална.

      След казаното следва да се разбира най-общо, че входно-изходният даннов поток от фигура 1 (вижте Предговора) представлява по своята техническа реализация поток от последователно следващи двоични комбинации. Създаването на кодовите комбинации в този поток се извършва от специални устройства, които няма да бъдат разглеждани тук. Само като пример можем да споменем, че едно такова устройство е аналого-цифровият преобразовател (АЦП).

      В по-общ смисъл, на двоичните комбинации може да се гледа като на числа, ето защо е необходимо да определим това понятие, още повече че то, заедно с някои други, беше вече твърде свободно употребено.

      Числото, което изразява една двоична комбинация често се използва за означаване на някаква размерност (дименсия) на дадена величина, например, дължина – двадесет и пет метра (25[m]). Тук числото 25 е записано в десетична бройна система, понятие, което ще определим точно в следващия раздел. Двоичната комбинация, която изразява числото 25 е последователността 11001, т.е. може да се запише, че 25=11001. И за да е по-ясно, понякога ще записваме така  25(10)=11001(2).

      В областта на компютърните науки се използват различни дименсии – бит, байт, дума и пр. Например 1 бит (1[b]) се определя като комбинация с една двоична цифра. Ако дължината на комбинацията е 8 бита (8[b]), то тя се именова 1 байт (1[B]), а ако е дълга 16 бита се говори за 2 байта (2[B]) или за 1 дума (1[W]).

      Освен за означаване на дължини, пояснените размерности (дименсии) се използват за означаване и на други понятия. Така например в областта на компютърните науки често се налага да се означи обем (в смисъла на вместимост), например обем на паметта. Убедени сме, че читателят е добре информиран и знае, че обемът на паметта в компютърните системи, се измерва с брой байтове. В този смисъл определението, че паметта има обем от 2 гигабайта (2[GB]), той е срещал и то има за него определен смисъл. Искаме да кажем още, че пояснените по-горе размерности не са единствени, и че има развита система от такива. Ще поясним тази система със следната таблица

 

Таблица на количествените означения

С десетични преставки

С двоични преставки (ISO)

бит

b

1

бит

b

1

байт

B

2**3=8[b]

байт

B

2**3=8[b]

дума

W

2**4=16[b]=2[B]

дума

W

2**4=16[b]=2[B]

двойна дума

DW

2**5=32[b]=4[B]

двойна дума

DW

2**5=32[b]=4[B]

килобайт

KB

10**3

кикибайт

KiB

2**10

мегабайт

MB

10**6

мебибайт

MiB

2**20

гигабайт

GB

10**9

гибибайт

GiB

2**30

терабайт

TB

10**12

тебибайт

TiB

2**40

петабайт

PB

10**15

пебибайт

PiB

2**50

ексабайт

EB

10**18

ексбибайт

EiB

2**60

сетабайт

ZB

10**21

себибайт

ZiB

2**70

йотабайт

YB

10**24

йобибайт

YiB

2**80

 

      Както се вижда от таблицата, има съществена разлика в означеното количество в зависимост от интерпретацията на бройната система. В днешно време в компютърното говорене все още десетичните представки се използват за изказване на двоичните количества. Например при изказването “един килобайт” имаме предвид количеството 1024, за което следва да се говори "един кикибайт". Така изказването “един килобайт” следва да означава количеството 1000. Това несъответствие в компютърната област е историческо обусловено и е характерно за по-старото поколение специалисти. Тук следва да поискаме извинение от читателя, тъй като увлечени в текста, на много места в нашите книги и ние сме допуснали това несъответствие, което, разбира се, може да доведе в някои случаи до неразбиране. Това важи и за много книги и публикации отнасящи се за компютърната област. Все пак прецизността в говоренето е признак за коректност и основание за яснота и човек следва да бъде дисциплиниран.

 

 

Следващият раздел е:

1.1.1  Понятие за бройна система  (Concept  notation)