Кодирането на информация е невероятно широкообласт на знанието. Разбира се, тя е пряко свързана с развитието на цифровите технологии. В много модерни образователни институции най-популярната тема е информационното кодиране. Днес ще проучим основните интерпретации на това явление във връзка с различни аспекти на компютърната работа. Ще се опитаме да отговорим на въпроса: "Дали кодирането на процес, метод, инструмент или всички тези явления едновременно?"
Практически всички типове данни товапоказвани на екрана на компютъра, някак си представляват двоичен код, състоящ се от нули и единици. Това е най-простият, “нисък” начин за шифроване на информация, позволяваща на компютъра да обработва данни. Бинарният код е универсален: той се разбира от всички компютри без изключение (всъщност той е създаден за тази цел - за да се стандартизира използването на информацията в цифрова форма).
Базовата единица, която използва двоичната системакодирането е малко (от фразата "двоична цифра" - "двуцифрена"). Това е 0 или 1. Като правило, битовете не се използват поотделно, а се комбинират в 8-цифрени последователности - байтове. Всяка от тях, следователно, може да съдържа до 256 комбинации от нули и единици (2 до 8-та сила). По правило не се използват единични байтове за записване на значителни количества информация, а по-големи количества с префикси "kilo", "mega", "giga", "tera" и т.н., всеки от които е 1000 пъти по-голям от предишния. ,
Самый распространенный вид цифровых данных - это текст. Как се кодира? Това е доста лесен за обяснение процес. Писмо, препинателен знак, цифра или знак могат да бъдат кодирани с един или няколко байта, т.е. компютърът ги вижда като уникална поредица от нули и единици и след това ги показва на екрана в съответствие с алгоритъма за разпознаване. Има два основни световни стандарта за "криптиране" на компютърен текст - ASCII и UNICODE.
В ASCII всеки символ се кодира самоедин байт. Това означава, че чрез този стандарт можете да "шифровате" до 256 символа - което е повече от достатъчно, за да се покажат символите на повечето азбуки в света. Разбира се, всички съществуващи национални писмови системи няма да се впишат в този ресурс. Ето защо, за всяка азбука създава своя собствена "подсистема" криптиране. Информацията се кодира чрез знакови системи, адаптирани към националните шаблони за писане. Всяка от тези системи, от своя страна, е неразделна част от глобалния ASCII стандарт, приет на международно равнище.
Като част от ASCII системата, същият този ресурс от 256знаци, разделени на две части. Първите 128 са символите, запазени за английската азбука (букви от a до z), както и числа, основни препинателни знаци и някои други символи. Вторият 128 байта е запазен, от своя страна, под национални системи за писма. Това е "подсистемата" за неанглийски азбуки - руски, хинди, арабски, японски, китайски и много други.
Всеки от тях е представен като отделенкодиращи таблици. Тоест, това може да се случи (и, като правило, това се случва), така че една и съща последователност от битове да бъде отговорна за различни букви и символи в две отделни “национални” таблици. Освен това, поради особеностите на развитието на ИТ сферата в различните страни, те дори се различават. Например за руския език най-често се срещат две системи за кодиране: Windows-1251 и KOI-8. Първият се появи по-късно (както и самата операционна система, съгласна с него), но сега много ИТ специалисти го използват като приоритет. Ето защо компютърът, така че да може да гарантира четенето на руски текст върху него, трябва да може правилно да разпознае двете таблици. Но, като правило, няма проблеми с това (ако на компютъра има модерна операционна система).
Методите за кодиране на текст през цялото времесе подобряват. В допълнение към "еднобайтовата" ASCII система, способна да работи само с 256 стойности за символи, има и "двубайтова" UNICODE система. Лесно е да се изчисли, че позволява кодиране на текст в размер, равен на 2 до 16-та степен, т.е. 65 000 536. Той от своя страна има ресурси за едновременно кодиране на почти всички съществуващи национални азбуки на света. Използването на UNICODE не е по-рядко от използването на „класическия“ ASCII стандарт.
По-горе определихме как да се "криптира"текстове и как се използват байтове. Каква е ситуацията с цифровите снимки и снимки? Също така доста просто. Също както при текста, същите байтове играят важна роля в кодирането на компютърната графика.
Процесс построения цифровых изображений в целом подобно на механизмите, по които работи телевизията. На телевизионния екран, ако погледнете внимателно, картината се състои от набор от отделни точки, които заедно образуват разпознаваеми фигури на известно разстояние от окото. Телевизионната матрица (или CRT проектор) получава хоризонталните и вертикалните координати на всяка точка от предавателя и постепенно изгражда изображението. Компютърният принцип на кодиране на графики работи по същия начин. Байта за "криптиране" на изображения се базира на задаване на всяка от точките на екрана на съответните координати (както и на цветовете на всеки от тях). Това се говори на прост език. Разбира се, графичното кодиране е много по-сложен процес от същия текстов.
Метод задания точкам соответствующих координат и Цветовите параметри се наричат "растерни". Много формати на компютърни графични файлове се наименуват по същия начин. Координатите на всяка точка от изображението, както и техният цвят, се записват в един или няколко байта. От какво зависи количеството им? Основно на колко нюанса на цвета "криптират". Един байт, както знаете, е 256 стойности. Ако такъв брой оттенъци е достатъчно за изграждане на картина, ние управляваме с този ресурс. По-специално, можем да разполагаме с 256 нюанса на сивото. И това ще е достатъчно, за да кодира почти всяко черно-бяло изображение. На свой ред, за цветни изображения на този ресурс ще бъде ясно, че не е достатъчно: човешкото око, както знаете, може да различи до няколко десетки милиона цвята. Ето защо, необходимите "състав" не е 256 стойности, а стотици хиляди пъти повече. Защо за кодиращите точки не се използва един байт, а няколко: според съществуващите стандарти може да има 16 (65 536 цвята могат да бъдат „криптирани“) или 24 (16,777,000 216 цветове).
За разлика от текстовите стандарти, разнообразиетокоето е сравнимо с броя на световните езици, с графики, нещата са малко по-прости. Най-често срещаните файлови формати (като JPEG, PNG, BMP, GIF и т.н.) се признават еднакво добре на повечето компютри.
Няма нищо трудно, за да се разберепринципите са кодиране на графична информация. Клас 9 на всяко средно училище в Русия, като правило, включва курс по компютърни науки, където такива технологии са разкрити в някои подробности на много прост и разбираем език. Има и специализирани програми за обучение на възрастни - те се организират от университети, лицеи или училища.
Следователно, съвременният руски човек имакъде да се запознаят с кодове, които имат практическо значение по отношение на компютърната графика. И ако искате да се запознаете със собствените си основни познания, можете да получите достъпни материали за обучение. Те включват, например, главата "Кодиране на графична информация (клас 9, учебник" Информатика и ИКТ "под авторството на Угринович Н. Д.).
Компьютер регулярно используется для слушане на музика и други аудио файлове. Както при текста и графиките, всеки звук на компютъра е еднакъв байт. Те, от своя страна, се “декриптират” от аудио картата и други микросхеми и се преобразуват в звуков звук. Принципът тук е почти същият като при грамофонните плочи. В тях, както знаете, всеки звук съответства на микроскопичен жлеб върху пластмаса, който се разпознава от читателя, и след това се изразява. В компютъра всичко изглежда. Само ролята на каналите се играе байтове, в естеството на които, както и в случай на текст и снимки, се намира двоично кодиране.
Ако в случай на компютърни изображенияедин елемент е точка, а когато записва звук, това е така нареченото "броене". В него по правило се записват два байта, генериращи до 65 хиляди 536 микро-осцилации. За разлика от това, когато това се случва при изграждането на изображения, за да се подобри качеството на звука, не се добавят допълнителни байтове (те очевидно са повече от достатъчно), а увеличение на броя на "пробите". Въпреки че в някои аудиосистеми се използват както по-малки, така и по-големи номера. Когато се извърши аудиокодиране, стандартната единица за измерване на "плътността на потока" на байтовете е една секунда. Това означава, че микро осцилациите, криптирани с 8 хиляди проби в секунда, очевидно ще бъдат с по-ниско качество от последователността на звуците, кодирани от 44 хиляди "проби".
Международната стандартизация на аудио файловете, както и в случая с графиките, е добре развита. Има няколко типични аудио медийни формати - MP3, WAV, WMA, които се използват в целия свят.
Един вид "хибридна схема", в коятоаудио криптирането е комбинирано с кодиране на изображения, използвано в компютърните видеоклипове. Обикновено филмите и клиповете се състоят от два типа данни - като такива, звукът и съпътстващата видео последователност. Начинът, по който първият компонент е „кодиран“, описахме по-горе. Вторият е малко по-сложен. Принципите тук са различни от графичното кодиране, обсъдено по-горе. Но благодарение на универсалността на "концепцията" на байта, същността на механизмите е напълно разбираема и логична.
Спомнете си как е подреден филмът.Това не е нищо повече от поредица от отделни рамки (има, като правило, 24). Компютърните видеоклипове се правят по същия начин. Всяка рамка е снимка. Начинът, по който е изграден с помощта на байтове, дефинирахме по-горе. На свой ред във видеото има определена област от код, която ви позволява да свързвате отделни рамки един с друг. Един вид заместител на цифров филм. Отделна единица за измерване на видеопотока (подобно на точките за снимки и образци за звук, както във филмов формат на филми и клипове), се счита за рамка. Последната в една секунда, в съответствие с приетите стандарти, може да бъде 25 или 50.
Както и при аудиото, имастандартни международни видеофайлови стандарти - MP4, 3GP, AVI. Производителите на филми и реклами се опитват да създават образци от медии, които са съвместими с възможно най-много компютри. Тези файлови формати са сред най-популярните, те се отварят на почти всеки модерен компютър.
Съхраняването на компютърните данни се извършваразлични медии - дискове, флаш памети и т.н. Както казахме по-горе, байтовете, като правило, се пренасят с префикси "мега", "гига", "тера" и т.н. В някои случаи размерът на кодираните файлове е че е невъзможно да ги поставите с наличните ресурси на диска. След това се използват различни методи за компресиране на данни. Всъщност те са и кодиращи. Това е друга възможна интерпретация на термина.
Има два основни механизма за компресиране на данни.За първата от тях последователността на битовете се записва в "опакована" форма. Това означава, че компютърът не може да чете съдържанието на файловете (да го възпроизвежда като текст, картина или видео), ако не изпълнява процедурата за разопаковане. Програмата, която извършва компресиране на данни по този начин, се нарича архиватор. Принципът на неговата работа е доста прост. Архивирането на данни като един от най-популярните методи, чрез които информацията може да се кодира, компютърните науки на ниво училище се изучават непременно.
Както помним, процесът на "криптиране" на файлове вбайтовете са стандартизирани. Вземете стандарта ASCII. За да кажем, че криптираме думата "здравей", се нуждаем от 6 байта, въз основа на броя на буквите. Това е колко място заема дискът с този текст. Какво ще стане, ако напишем думата "здравей" 100 пъти подред? Нищо специално - за това ни трябват съответно 600 байта, същото количество дисково пространство. Въпреки това, можем да използваме архиватор, който ще създаде файл, в който, чрез много по-малък брой байтове, команда, която изглежда така: „hello multiply by 100“ ще бъде „криптирана“ След като преброим броя на буквите в това съобщение, стигаме до извода, че ни е нужен само 19 байта за запис на такъв файл. И толкова дисково пространство. Когато “разопаковате” архивния файл, се случва “декриптиране”, а текстът поема оригиналната си форма с “100 поздравления”. Така, използвайки специална програма, която използва специален механизъм за кодиране, можем да спестим значително количество дисково пространство.
Процесът, описан по-горе, е доста универсален: колкото и знакови системи да се използват, кодирането на информацията за целите на компресирането е винаги възможно чрез архивиране на данни.
Какъв е вторият механизъм?До известна степен това е подобно на това, което се използва в архиваторите. Но основната му разлика е, че компресираният файл може да бъде показан от компютър без процедурата за разопаковане. Как работи този механизъм?
Как мы помним, в исходном виде слово "привет" отнема 6 байта. Въпреки това, можем да отидем на трик и да го напишем по следния начин: "prvt." 4 байта. Всичко, което остава да се направи, е да "научи" компютъра да добавя буквите, които сме отстранили в процеса на показване на файла. Трябва да се каже, че на практика “образователният” процес е организиран и не е необходим. Основните механизми за разпознаване на липсващи символи се намират в повечето съвременни компютърни програми. Това означава, че основната част от файловете, с които се занимаваме всеки ден, е някак си "криптирана" от този алгоритъм.
Разбира се, съществуват "хибридни" системикодираща информация, която позволява компресиране на данни, като едновременно се използват и двата горепосочени подхода. И те вероятно ще бъдат още по-ефективни по отношение на спестяването на дисково пространство от всяко отделно.
Разбира се, използвайки думата "здравей", ние тръгнахмесамо основните принципи на механизмите за компресиране на данни. В действителност те са много по-сложни. Различни системи за кодиране на информация могат да предложат изключително сложни механизми за компресиране на файлове. Въпреки това виждаме как е възможно да се спести дисково пространство, почти без да се влоши качеството на информацията на компютъра. Особено важна е ролята на компресирането на данни при използването на изображения, аудио и видео - тези видове данни са по-взискателни към дисковите ресурси.
Както казахме в самото начало, кодирането -Това е сложно явление. След като се справихме с основните принципи за кодиране на цифрови данни въз основа на байтове, можем да засегнем друга област. Това е свързано с използването на компютърни кодове в малко по-различни стойности. Тук под „код” имаме предвид не поредица от нули и единици, а колекция от различни букви и символи (които, както вече знаем, вече са съставени от 0 и 1), което има практическо значение за живота на съвременния човек.
В сърцето на работата на всяка компютърна програма -код. Той е написан на език, разбираем за компютъра. PC, който дешифрира кода, изпълнява определени команди. Отличителна черта на компютърна програма от друг тип цифрови данни е, че съдържащият се в него код е в състояние да "декриптира" самия (потребителят трябва само да започне този процес).
Друга особеност на програмите е относителнагъвкавост на използвания код. Това означава, че човек може да даде на компютъра същите задачи, като използва достатъчно голям набор от "фрази" и ако е необходимо на друг език.
Другая практически значимая область применения буквен код - създаването и форматирането на документи. Като правило, простото показване на символи на екрана не е достатъчно от гледна точка на практическото значение на използването на компютър. В повечето случаи текстът трябва да бъде конструиран с помощта на шрифт с определен цвят и размер, придружен от допълнителни елементи (като например таблици). Всички тези параметри са зададени, както в случая с програмите, на специални езици, които са разбираеми за компютъра. Компютърът, разпознаващ "командите", показва документите точно както желае потребителят. Освен това текстовете могат да бъдат форматирани по същия начин, както и с програмите, с различни набори от „фрази“ и дори на различни езици.
Съществува обаче основна разлика между кодоветеза документи и компютърни програми. Тя се състои в това, че първите не могат да се декриптират. За да отворите файлове с форматирани текстове, винаги са необходими програми на трети страни.
Еще одна интерпретация термина "код" за компютри, това е криптиране на данни. По-горе използвахме тази дума като синоним на термина "кодиране" и това е допустимо. В този случай, чрез криптиране, ще разберем друг вид феномен. А именно, кодирането на цифрови данни, за да се забрани достъпът до тях от други хора. Защита на компютърните файлове - най-важната дейност в сферата на информационните технологии. Това всъщност е отделна научна дисциплина, включва и училищната информатика. Кодирането на файлове с цел предотвратяване на неоторизиран достъп е задача, важността на която се посочва на гражданите на съвременните държави още в детска възраст.
Как са механизмите, чрез коитокриптирани ли са данните? По принцип е толкова просто и разбираемо, колкото всички предишни, които разглеждахме. Кодирането е процес, който може лесно да бъде обяснен от гледна точка на основните принципи на логиката.
Да предположим, че трябва да изпратим съобщение"Иванов отива при Петров", за да не може никой да го прочете. Надяваме се да шифровате съобщението на компютъра и да видите резултата: "10-3-1-15-16-3-10-5-7-20-11-17-6-20-20-3-21". Този код, разбира се, е много прост: всяка цифра съответства на поредния номер на буквите на нашата фраза в азбуката. "И" е на 10-то място, "Б" - на 3, "А" - на 1 и т.н. Но съвременните системи за кодиране на компютри могат да криптират данни, така че ще бъде изключително трудно да се избере ключът за тях.