Все что относится к информатике. Стоит ли учиться этому предмету? Двоичное кодирование информации

Понятие термина

Термин информатика (слияние Информация и Автоматика) возник в $60$-х годах во Франции для определения области человеческой деятельности, которая занимается автоматизированной обработкой информации с использованием электронных вычислительных машин (ЭВМ). В большинстве стран Западной Европы и США используется термин компьютерная наука (computer science), последнее время эти два понятия отождествляются.

С бурным развитием микропроцессорной техники информатика выделилась в самостоятельную область науки, которая занимается изучением свойств информации, процессами передачи и обработки информации.

Однозначного определения понятия информатики не существует, и связано это с многогранностью ее функций, возможностей, средств и методов. Приведем пример одного из них:

Определение 1

Информатика – это область человеческой деятельности, которая связана с процессами обработки информации с помощью средств вычислительной техники и взаимодействием этих средств со средой применения.

Предмет и задачи информатики

Рассматривая информатику в качестве фундаментальной науки, основным ее направлением является разработка методов и средств создания информационного обеспечения процессов управления любыми объектами на базе компьютерных информационных систем.

Одной из главных задач информатики является изучение информационных систем; места, которое они занимают; структуры, которую должны иметь; особенностей функционирования; их общих закономерностей.

Задачами информатики являются:

исследование информационных процессов любой природы;
разработка вычислительной техники и создание новой технологии обработки информации на основе полученных результатов исследования информационных процессов;
научные и инженерные разработки с целью создания, внедрения и обеспечения эффективного применения компьютерной техники и технологии во всех сферах человеческой жизнедеятельности.

Основная задача информатики заключается в систематизации приёмов и методов работы с программно-аппаратными средствами вычислительной техники.

Целью фундаментальных исследований информатики является систематизация знаний о всех возможных информационных системах, определение общих закономерностей построения этих систем и их функционирования.

Предмет информатики – разработка эффективных методов преобразования информации.

Составляющими предмета информатики являются понятия:

аппаратного обеспечения средств вычислительной техники;
программного обеспечения средств вычислительной техники;
средств взаимодействия аппаратного и программного обеспечения.

Главной функцией информатики является разработка методов и средств обработки информации и использование их в организации технологического процесса обработки информации.

В наше время информатика тесно переплетается с другими науками и охватывает практически все виды жизнедеятельности человека: производство, торговые операции, медицину, образование, криминалистику и т.д.

Рисунок 1. Место информатики в системе наук

Направления практических приложений информатики:

Архитектура вычислительных систем.
Интерфейсы вычислительных систем (аппаратные, программные и программно-аппаратные).
Программирование.
Преобразование структуры данных.
Защита информации.
Автоматизация.
Стандартизация.

Рисунок 2. Структура информатики

Научная область, которая воплощает практическое применение информатики, основана на базе знаний следующих разделов:

Теоретическая информатика – раздел информатики, который активно использует математический аппарат для описания различных информационных процессов . Опирается на математическую логику и содержит теорию алгоритмов и автоматов, теорию информации и теорию кодирования, теорию формальных языков и грамматик, исследование операций (операционное исчисление) и т.д.

Вычислительная техника – раздел, в котором выполняется разработка общих принципов построения вычислительных систем. Раздел не изучает технические детали вычислительных систем, но принципиальные решения на уровне архитектуры, которые подразумевают описание состава, функциональных возможностей и принципов взаимодействия отдельных устройств.

Программирование – раздел информатики, который занимается разработкой системного и прикладного программного обеспечения. С помощью программирования образуется связь между различными научными областями, которая позволяет моделировать и решать задачи из этих областей с помощью вычислительных систем (компьютеров).

Информационные системы – составная часть информатики, отвечающая за анализ потоков информации, их оптимизацию, структурирование, принципы хранения и поиска информации. Значение информационных систем оценивается исследованиями в этой области, которые позволяют создавать новые операционные системы для ПК, была создана и успешно развивается глобальная сеть Интернет.

Искусственный интеллект – раздел информатики, в котором решаются вопросы различных наук (например, психологии, лингвистики, математики и т. д.): моделирование рассуждений, генерация новых знаний, перевод с одного языка на другой с помощью программного обеспечения и др. Разработки в области искусственного интеллекта самым прямым образом влияют на создание интеллектуальных интерфейсных систем взаимодействия человека и компьютера, которые сведут это взаимодействие к более эффективному общению и оно станет более схожим на общение между людьми.

Слово «информация» происходит от латинского слова informatio , что означает разъяснение, высказывания, осведомленность. Само слово информация лишь сравнительно недавно стало превращаться в точный термин. До этого информацию воспринимали как то, что присутствует в языке, письме или передается при общении. Сейчас смысл, который вкладывается в это понятие, очень изменился и расширился. Возникла особая математическая дисциплина — теория информации.

Хотя в теории информации и вводится несколько ее конкретных определений, все они не охватывают всего объема этого понятия. Рассмотрим некоторые определения.

Информация — это отражение реального (материального, предметного) мира, которое выражается в виде сигналов, знаков.

Информация — любая совокупность сигналов, сведений (данных), которые какая-либо система воспринимает из окружающей среды (входная информация), выдает в окружающую среду (исходная информация) или сохраняется внутри определенной системы (внутренняя информация).

Информация существует в виде документов, рисунков, текстов, звуковых и световых сигналов, энергетических и нервных импульсов и т.п.

Под информацией понимают сведения об объектах окружающего мира, которые воспринимаются человеком, животным, растительным миром или специальными устройствами и повышают их уровень информированности.

Информация передается с помощью сообщений. Сообщение бывают устными, письменными, в виде рисунков, жестов, специальных знаков или организованными каким-то другим образом. Примерами сообщений являются: показания измерительного устройства, дорожные знаки, текст телеграммы, устный рассказ и тому подобное.

Виды информации

Информацию можно разделить на виды по нескольким признакам:

По способу восприятия

Для человека информация делится на виды в зависимости от типа рецепторов, воспринимающих ее:

Визуальная — воспринимается органами зрения.
Аудиальная — воспринимается органами слуха.
Тактильная — воспринимается тактильными рецепторами.
Обонятельная — воспринимается обонятельными рецепторами.
Вкусовая — воспринимается вкусовыми рецепторами.

По форме представления

По форме представления информация делится на следующие виды:

Текстовая — что передается в виде символов, предназначенных обозначать лексемы языка.
Числовая — в виде цифр и знаков, обозначающих математические действия.
Графическая — в виде изображений, событий, предметов, графиков.
Звуковая — устная или в виде записи передача лексем языка аудиальным путем.

По назначению

Массовая — содержит тривиальные сведения и оперирует набором понятий, понятным большей части социума.
Специальная — содержит специфический набор понятий, при использовании происходит передача сведений, которые могут быть не понятны основной массе социума, но необходимы и понятны в рамках узкой социальной группы, где используется данная информация.
Личная — набор сведений о какой-либо личности, которые определяют социальное положение и типы социальных взаимодействий внутри популяции.

Свойства информации

Полезность. Полезность информации оценивается по тем задачам, которые можно решить с ее использованием. Сведения, важные и полезные для одного человека, оказываются бесполезными для другого, если он не может их использовать.

Актуальность. Информация актуальна (своевременна), если она важна в данный момент времени. Если вы собираетесь ехать поездом, то для вас важна информация о том, когда этот поезд отправляется. Однако эта информация теряет свою актуальность после того, как поезд тронулся.

Вероятность (правдивость) . Информация считается достоверной, если она не противоречит реальной действительности, правильно ее объясняет и подтверждается. Если вы узнали о наводнении из информационной телепрограммы, то эта информация, по всей вероятности, является достоверной. В то же время слухи о пришествии инопланетян, которое ожидается на следующей неделе, недостоверны.

Объективность. Информация может быть объективной или субъективной (зависеть или не зависеть от чьего суждения). Например, сообщение «вода в море холодная» является субъективным, одновременно сообщение «температура +17 градусов Цельсия» дает объективную информацию.

Полнота. Информация полная, если ее достаточно для правильных выводов и принятия правильных решений. Если человеку на основе какой-либо информации приходится что-то решать, то он сначала оценивает, достаточно этой информации для принятия правильного решения.

Понятность. Информация понятна, если при ее восприятии нет необходимости в дополнительных сообщениях (не возникает вопросов). Если человеку говорят что-то, к восприятию чего он еще не подготовлен, например обращаются английском раньше, чем человек выучил этот язык, то он из услышанной информации вынесет совсем другую информацию, чем это было бы тогда, когда человек выучил английский язык.

Носители информации

Среда, в которой зафиксировано сообщение, называют носителем сообщения. В «докомпьютерную» эру информацию хранили на бумаге, фотографиях, кинопленке, магнитной ленте и др. С появлением первых компьютеров нашли широкое применение перфокарты и перфоленты, магнитные диски, компакт-диски.

Перфокарта — это лист тонкого картона стандартных размеров. В определенных позициях перфокарты пробивают дырочки. Наличие дырочки в определенной позиции считают единицу, а ее отсутствие — ноль.

Перфолента — это лента плотной бумаги стандартной ширины, на которую заносится информация пробивкой дырочек в соответствующих позициях на 5-ти или 8-ми параллельных дорожках.

Конечно, за дырочками, нанесенными на перфокарты или перфоленты, стоит вполне определенная информация.

Магнитные ленты и магнитные диски для хранения информации начали использовать с развитием вычислительной техники. Для записи 1 (единицы) намагничивалась небольшая область. Размагниченная (или намагниченная противоположно) область означала 0 (ноль).

Гибкие магнитные диски, или ГМД (FDD), позволяли легко переносить информацию с одного компьютера на другой, а также сохранять информацию, которая не используется на компьютере постоянно. Выпускались дискеты, как правило, с диском диаметром 3,5 дюйма и имели емкость всего 1,44 Мбайта.

Жесткие магнитные диски, или винчестеры (HDD), и сегодня являются основным типом носителей для долговременного хранения информации. Накопитель включает собственно магнитный диск, систему позиционирования и комплект магнитных головок — все это размещено в герметично закрытом корпусе.

Магнитные карточки содержат закодированную информацию, эта технология используется в кредитных, телефонных и регистрационных карточках, а также пропусках и «ключах» для кодовых замков.

Компакт-диски (оптические диски или CD) — это диск из специальной пластмассы с зеркальным покрытием с той стороны, с которой записывается и считывается информация. Информация на диск записывается так: диск вращается, и на его поверхности лазером в определенных местах наносятся «повреждение» поверхности таким образом, чтобы от них не отражался луч лазера при считывании. Таким образом записывается 1, «неповрежденные» места означают логический 0.

Существуют CD-R, DVD-R — оптические диски, на которые можно осуществлять однократную запись, а также CD-RW, DVD-RW — оптические диски, на которые можно осуществлять многократную запись.

Формы и способы представления информации

Символьная форма представления информации является наиболее простой, в ней каждый символ имеет какое-то значение. Например: красный свет светофора, показатели поворота на транспортных средствах, различные жесты, сокращения и обозначения в формулах.

Текстовая форма представления информации является более сложной. Эта форма предусматривает, что содержание сообщения передается не через отдельные символы (цифры, буквы, знаки), а их сочетанием, порядком размещения. Последовательно расположены символы образуют слова, которые в свою очередь могут образовывать предложения. Текстовая информация используется в книгах, брошюрах, газетах, журналах и т.

Графическая форма представления информации, как правило, имеет наибольший объем. К этой форме относятся фотографии, картины, чертежи, графики и тому подобное. Графическая форма более информативна. Видимо, поэтому, когда берем в руки новую книгу, то первым делом ищем в ней рисунки, чтобы создать о ней наиболее полное впечатление.

Информацию можно подавать одним из способов: буквами и знаками, жестами, нотами музыки, рисунками, картинами, скульптурами, звукозаписью, видеозаписью, кинофильмами и тому подобное.

Информация может быть в виде непрерывных (аналоговых) и дискретных (цифровых) сигналов.

Информация в аналоговом виде меняет свое значение постепенно (показатели термометра, часов со стрелками, спидометра и т.д.).

Информация в дискретном виде меняет свое значение с определенным шагом (показатели электронных часов, весы с гирями, подсчет количества предметов и т.п.).

Информатика

Термин информатика происходит от двух слов: информация и автоматика. Значит информатика это «наука о преобразовании информации».

Этот термин впервые введен в обиход во Франции в середине 60-х годов XX в., когда началось широкое использование вычислительной техники. Тогда в англоязычных странах вошел в употребление термин «Computer Science» для обозначения науки о преобразовании информации, которая базируется на вычислительной технике. Теперь эти термины являются синонимами.

Основа информатики — информационные технологии — совокупность средств и методов, с помощью которых осуществляется во всех сферах жизни и деятельности человека.

Информационная система — взаимосвязанная совокупность средств, методов и персонала, используемая для хранения, обработки и выдачи информации с целью достижения конкретной задачи.

Современное понимание информационной системы (ИС) предусматривает использование компьютера в качестве основного технического средства обработка информации. Как правило, это компьютеры, оснащенные специализированными программными средствами.

В работе ИС, в ее технологическом процессе можно выделить следующие этапы:

Зарождение данных — формирование первичных сообщений фиксируют результаты определенных операций, свойства объектов и субъектов управления, параметры процессов, содержание нормативных и юридических актов и т.п.
Накопление и систематизация данных — организация такого их размещения, которое обеспечивало бы быстрый поиск и отбор нужных сведений, защита их от искажений, потери, деформирование целостности и др.
Обработка данных — процессы, в результате которых на основании ранее накопленных данных формируются новые виды данных: обобщающие, аналитические, рекомендательные, прогнозные. Производные данные также могут проходить дальнейшую обработку, давая сведения обобщенности и др.
Отображение данных — представление их в форме, пригодной для восприятия человеком. Прежде всего — это вывод на печать, то есть изготовление документов, удобных для восприятия человеком. Широко используют построение графических иллюстративных материалов (графиков, диаграмм) и формирование звуковых сигналов.

Сообщения, которые формируются на первом этапе, могут быть обычным бумажным документом, сообщением «в электронном виде» или тем и другим одновременно. В современных информационных системах сообщение по большей части имеют «электронный вид». Основные составляющие информационных процессов:

сбор данных: накопление данных с целью достаточной полноты для принятия решений;
сохранения;
передача;
обработка.

Одним из важнейших условий применения электронно — вычислительных машин (ЭВМ) для решения тех или иных задач является построение соответствующего алгоритма (программы), содержащий информацию о правилах получения результирующей (итоговой) информации из заданной (входной) информации.

Программирование — дисциплина, исследующая методы формулировки и решения задач с помощью ЭВМ, и является основной составной частью информатики.

Итак, информация, ЭВМ, алгоритм — три фундаментальных понятия информатики.

Информатика — комплексная научная и инженерная дисциплина, изучающая все аспекты проектирования, создания, оценки, функционирования компьютерных систем обработки информации, ее применение и влияние на различные области социальной практики.

Родоначальниками информатики является науки: документалистика и кибернетика. Кибернетика — переводится, как «искусный в управлении».

В информатике выделяют три основных части:

алгоритмы обработки информации (algorithm )
вычислительную технику (hardware )
компьютерные программы (software ).

Предмет информатики составляют понятия:

аппаратное обеспечение средств вычислительной техники
программное обеспечение средств вычислительной техники;
средства взаимодействия аппаратного и программного обеспечения;
средства взаимодействия человека и аппаратного и программного обеспечения.

Методы и средства взаимодействия человека с аппаратными и программными средствами называется интерфейсом .

Двоичное кодирование информации

В разговорной речи часто встречаются такие выражения, как передача информации, сжатие информации, обработка информации. В таких случаях всегда идет об определенном сообщении, которое закодировано и передано тем или иным способом.

В вычислительной технике наиболее часто применяется двоичная форма представления информации , основанной на представленные данных последовательностью двух знаков: 0 и 1

Эти знаки называются двоичными цифрами, по — английски — binary digit , или, сокращенно bit (бит) .

Также используется восьмеричная форма представления информации (основана на представленные последовательности цифр 0, 1, …, 7) и шестнадцатеричная форма представления информации (основана на представленные последовательностью 0, 1, …, 9, A, B, C, …, F).

Информационным объемом сообщение называется количество битов в этом сообщении. Подсчет информационного объема сообщение является чисто техническим заданием, так как при таком подсчете содержание сообщения не играет никакой роли.

В современной вычислительной технике биты принято объединять в восьмерки, которые называются байтами: 1 байт = 8 бит. Наряду с битами и байтами используют и большие единицы измерения информации.

1 bit binary digit {0,1};
1 байт = 8 бит;
1 Кбайт = 2 10 байт = 1024 байт;
1 Мбайт = 2 10 Кбайт = 1024 Кбайт = 2 20 байт;
1 Гбайт = 2 10 Мбайт = 1024 Мбайт = 2 30 байт;
1 Тбайт = 2 10 Гбайт = 1024 Гбайт = 2 40 байт.
1 Пбайт = 2 10 Тбайт = 1024 Тбайт = 2 50 байт.

С помощью двух бит кодируются четыре различных значения: 00, 01, 10, 11. Тремя битами можно закодировать 8 состояний:

000 001 010 011 100 101 110 111

Вообще с помощью n бит можно закодировать 2 n состояний.

Скорость передачи информации измеряется количеством битов, передаваемых за одну секунду. Скорость передачи бит за одну секунду называется 1 Бодом. Производные единицы скорости передачи называются Кбод, Мбод и Гбод:

1 Кбод (один килобод) = 2 10 бод = 1024 бит / с;
1 Мбод (один мегабод) = 2 20 бод = 1024 Кбод;
1 Гбод (один гигабод) = 2 30 бод = 1024 Мбод.

Пример . Пусть модем передает информацию со скоростью 2400 бод. Для передачи одного символа текста нужно передать около 10 битов. Таким образом, модем способен за 1 секунду передать около 2400/10 = 240 символов.

На ЭВМ можно обрабатывать не только числа, но и тексты. При этом нужно закодировать около 200 различных символов. В двоичном коде для этого нужно не менее 8 разрядов (2 8 = 256). Этого достаточно для кодирования всех символов английского и русского алфавитов (строчные и прописные), знаков препинания, символов арифметических действий некоторых общепринятых спецсимволов.

В настоящее время существует несколько систем кодирования.

Наиболее распространенными являются следующие системы кодирования: ASCII, Windows-1251, KOИ8, ISO.

ASCII (American Standard Code for Information Interchange — стандартный код информационного обмена)

В системе ASCII закреплены 2 таблицы кодирования: базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, расширенная от 128 до 255.

В первых 32 кодах (0-31) размещаются так называемые управляющие коды, которым не соответствуют никакие символы языков, и, соответственно коды не выводятся ни на экран, ни на устройстве печати.

Начиная с кода 32 по код 127 размещены коды символов английского алфавита.

Символы национального алфавита размещены в кодах от 128 до 255.

Кодирования Windows-1251 стала стандартом в российском секторе Wold Wide Web .

KOИ8 (код обмена информацией) является стандартным кодированием в сообщениях электронной почты и телеконференций.

ISO (International Standard Organization ) — международный стандарт. Это кодирования используется редко.

Появление информатики обусловлено возникновением и распространением новой технологии сбора, обработки и передачи информации, связанной с фиксацией данных на машинных носителях. Основной инструмент информатики — компьютер.

Компьютер, получивший свое название от первоначального назначения — выполнения вычислений, имеет второе очень важное применение. Он стал незаменимым помощником человека в его интеллектуальной деятельности и основным техническим средством информационных технологий. А быстрое развитие в последние годы технических и программных возможностей персональных компьютеров, распространение новых видов информационных технологий создают реальные возможности их использования, открывая перед пользователем качественно новые пути дальнейшего развития и адаптации к потребностям общества.

Формирование информатики как науки происходило в XX веке и было связано с развитием вычислительной техники.

Понятие "информатика" возникло в 60-х годах во Франции. Так решили назвать область знаний, изучающую применение электронных вычислительных машин для автоматизации обработки данных. Слово "информатика" образовано из двух слов "информация" и "автоматика".

В англоязычных странах, особенно в США, вместо термина "informatics" обычно используют "computer science", то есть компьютерная наука.

Хотя понятия "информатика" и "компьютерная наука" можно считать синонимами, второй появился раньше, в начале 40-х годов XX века. Компьютерная наука представляла собой соединение возможностей электронно-вычислительных машин (ЭВМ) того времени, математической логики и теории алгоритмов.

В дальнейшем в компьютерной науке появлялись новые направления. Это было связано с усовершенствованиями ЭВМ, которые позволили использовать их в более широком спектре областей человеческой деятельности.

Хотя информатика делает акцент на обработке информации, ее появление и развитие неразрывно связаны с существованием компьютерной техники. Об информатике как о научной дисциплине наряду с другими науками заговорили в 70-80-х года XX века, когда вычислительные машины стали более доступными для разнообразной публики.

Изначально компьютер был инструментом для автоматизации трудоемких вычислений. Однако постепенно эволюционировал в инструмент для работы с почти любой информацией, а не только числовой. На сегодняшний день существует огромное количество программ и приложений, предназначенных для работы с текстом, графикой, таблицами, базами данных и многим другим.

Из информатики начали выделяться отдельные научные направления. Так как материальный мир разнообразен, и существует множество сфер человеческой деятельности, то предмет изучения информатики также весьма неоднороден. Поэтому информатику можно рассматривать как комплексную науку, что затрудняет ее однозначное определение.

В 80-х годах Е.П. Ершов дал ей такое определение:

Информатика – это находящаяся в процессе становления наука, изучающая законы и методы накопления, передачи и обработки информации с помощью ЭВМ, а также область человеческой деятельности, связанная с применением ЭВМ.

Информатика тесно связана с математикой, так как опирается на ее достижения. Это объясняется тем, что объекты естественных и технических наук, а также социальные явления можно описать с помощью понятий математики – функций, систем уравнений, неравенств и другого.

С другой стороны, предмет изучения информатики – информация – кроме прочего является общенаучным и социальным понятием.

По-сути задачей информатики является изучение способов использования научных и технических достижений для обработки данных разной природы. Цивилизация в XX веке пришла к тому рубежу накопления данных, когда возникла проблема их хранения, использования, доступа, передачи, преобразования. Компьютерная наука изучает решение этих проблем с помощью вычислительной техники.

В настоящее время активно протекают процессы, связанные с переводом информации, накопленной цивилизацией, в электронный вид. Можно ожидать, что многие объекты реального мира в скором времени обретут свой цифровой аналог.

В англоязычных странах применяют термин computer science – компьютерная наука.

Теоретической основой информатики является группа фундаментальных наук таких как: теория информации, теория алгоритмов, математическая логика, теория формальных языков и грамматик, комбинаторный анализ и т.д. Кроме них информатика включает такие разделы, как архитектура ЭВМ, операционные системы, теория баз данных, технология программирования и многие другие. Важным в определении информатики как науки является то, что с одной стороны, она занимается изучением устройств и принципов действия средств вычислительной техники, а с другой – систематизацией приемов и методов работы с программами, управляющими этой техникой.

Информационная технология – это совокупность конкретных технических и программных средств, с помощью которых выполняются разнообразные операции по обработке информации во всех сферах нашей жизни и деятельности. Иногда информационную технологию называют компьютерной технологией или прикладной информатикой.

Информация аналоговая и цифровая.

Термин «информация» восходит к латинскому informatio,– разъяснение, изложение, осведомленность.

Информацию можно классифицировать разными способами, и разные науки это делают по-разному. Например, в философии различают информацию объективную и субъективную. Объективная информация отражает явления природы и человеческого общества. Субъективная информация создается людьми и отражает их взгляд на объективные явления.

В информатике отдельно рассматривается аналоговая информация и цифровая. Это важно, поскольку человек благодаря своим органам чувств, привык иметь дело с аналоговой информацией, а вычислительная техника, наоборот, в основном, работает с цифровой информацией.

Человек воспринимает информацию с помощью органов чувств. Свет, звук, тепло – это энергетические сигналы, а вкус и запах – это результат воздействия химических соединений, в основе которого тоже энергетическая природа. Человек испытывает энергетические воздействия непрерывно и может никогда не встретиться с одной и той же их комбинацией дважды. Нет двух одинаковых зеленых листьев на одном дереве и двух абсолютно одинаковых звуков – это информация аналоговая. Если же разным цветам дать номера, а разным звукам – ноты, то аналоговую информацию можно превратить в цифровую.

Музыка, когда ее слушают, несет аналоговую информацию, но если записать ее нотами, она становится цифровой.

Разница между аналоговой информацией и цифровой, прежде всего, в том, что аналоговая информация непрерывна, а цифровая дискретна.

К цифровым устройствам относятся персональные компьютеры – они работают с информацией, представленной в цифровой форме, цифровыми являются и музыкальные проигрыватели лазерных компакт дисков.

Кодирование информации.

Кодирование информации – это процесс формирования определенного представления информации.

В более узком смысле под термином «кодирование» часто понимают переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки.

Компьютер может обрабатывать только информацию, представленную в числовой форме. Вся другая информация (звуки, изображения, показания приборов и т. д.) для обработки на компьютере должна быть преобразована в числовую форму. Например, чтобы перевести в числовую форму музыкальный звук, можно через небольшие промежутки времени измерять интенсивность звука на определенных частотах, представляя результаты каждого измерения в числовой форме. С помощью компьютерных программ можно преобразовывать полученную информацию, например «наложить» друг на друга звуки от разных источников.

Аналогично на компьютере можно обрабатывать текстовую информацию. При вводе в компьютер каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.

Как правило, все числа в компьютере представляются с помощью нулей и единиц (а не десяти цифр, как это привычно для людей). Иными словами, компьютеры обычно работают в двоичной системе счисления, поскольку при этом устройства для их обработки получаются значительно более простыми.

Единицы измерения информации. Бит. Байт.

Бит – наименьшая единица представления информации. Байт – наименьшая единица обработки и передачи информации.

Решая различные задачи, человек использует информацию об окружающем нас мире. Часто приходится слышать, что сообщение несет мало информации или, наоборот, содержит исчерпывающую информацию,при этом разные люди, получившие одно и то же сообщение (например, прочитав статью в газете), по-разному оценивают количество информации, содержащейся в нем. Это означает, что знания людей об этих событиях (явлениях) до получения сообщения были различными. Количество информации в сообщении, таким образом, зависит от того, насколько ново это сообщение для получателя. Если в результате получения сообщения достигнута полная ясность в данном вопросе (т.е. неопределенность исчезнет), говорят, что получена исчерпывающая информация. Это означает, что нет необходимости в дополнительной информации на этутему. Напротив, если после получения сообщения неопределенность осталась прежней (сообщаемые сведения или уже были известны, или не относятся к делу), значит, информации получено не было (нулевая информация).

Подбрасывание монеты и слежение за ее падением дает определенную информацию. Обе стороны монеты «равноправны», поэтому одинаково вероятно, что выпадет как одна, так и другая сторона. В таких случаях говорят, что событие несет информацию в 1 бит. Если положить в мешок два шарика разного цвета, то, вытащив вслепую один шар, мы также получим информацию о цвете шара в 1 бит.

Единица измерения информации называется бит (bit) – сокращение от английских слов binary digit, что означает двоичная цифра.

В компьютерной технике бит соответствует физическому состоянию носителя информации: намагничено – не намагничено, есть отверстие – нет отверстия. При этом одно состояние принято обозначать цифрой 0, а другое – цифрой 1. Выбор одного из двух возможных вариантов позволяет также различать логические истину и ложь. Последовательностью битов можно закодировать текст, изображение, звук или какую-либо другую информацию. Такой метод представления информации называется двоичным кодированием (binary encoding).

В информатике часто используется величина, называемая байтом (byte) и равная 8 битам. И если бит позволяет выбрать один вариант из двух возможных, то байт, соответственно, 1 из 256 (2 8). Наряду с байтами для измерения количества информации используются более крупные единицы:

1 Кбайт (один килобайт) = 2\up1210 байт = 1024 байта;

1 Мбайт (один мегабайт) = 2\up1210 Кбайт = 1024 Кбайта;

1 Гбайт (один гигабайт) = 2\up1210 Мбайт = 1024 Мбайта.

Например, книга содержит 100 страниц; на каждой странице – 35 строк, в каждой строке – 50 символов. Объем информации, содержащийся в книге, рассчитывается следующим образом:

Страница содержит 35 × 50 = 1750 байт информации. Объем всей информации в книге (в разных единицах):

1750 × 100 = 175 000 байт.

175 000 / 1024 = 170,8984 Кбайт.

170,8984 / 1024 = 0,166893 Мбайт.

Файл. Форматы файлов.

Файл – наименьшая единица хранения информации, содержащая последовательность байтов и имеющая уникальное имя.

Основное назначение файлов – хранить информацию. Они предназначены также для передачи данных от программы к программе и от системы к системе. Другими словами, файл – это хранилище стабильных и мобильных данных. Но, файл – это нечто большее, чем просто хранилище данных. Обычно файл имеет имя, атрибуты, время модификации и время создания.

Файловая структура представляет собой систему хранения файлов на запоминающем устройстве, например, на диске. Файлы организованы в каталоги (иногда называемые директориями или папками). Любой каталог может содержать произвольное число подкаталогов, в каждом из которых могут храниться файлы и другие каталоги.

Способ, которым данные организованы в байты, называется форматом файла.

Для того чтобы прочесть файл, например, электронной таблицы, нужно знать, каким образом байты представляют числа (формулы, текст) в каждой ячейке; чтобы прочесть файл текстового редактора, надо знать, какие байты представляют символы, а какие шрифты или поля, а также другую информацию.

Программы могут хранить данные в файле способом, выбираемым программистом. Часто предполагается, однако, что файлы будут использоваться различными программами, поэтому многие прикладные программы поддерживают некоторые наиболее распространенные форматы, так что другие программы могут понять данные в файле. Компании по производству программного обеспечения (которые хотят, чтобы их программы стали «стандартами»), часто публикуют информацию о создаваемых ими форматах, чтобы их можно было бы использовать в других приложениях.

Все файлы условно можно разделить на две части – текстовые и двоичные.

Текстовые файлы – наиболее распространенный тип данных в компьютерном мире. Для хранения каждого символа чаще всего отводится один байт, а кодирование текстовых файлов выполняется с помощью специальных таблиц, в которых каждому символу соответствует определенное число, не превышающее 255. Файл, для кодировки которого используется только 127 первых чисел, называется ASCII - файлом (сокращение от American Standard Code for Information Intercange – американский стандартный код для обмена информацией), но в таком файле не могут быть представлены буквы, отличные от латиницы (в том числе и русские). Большинство национальных алфавитов можно закодировать с помощью восьмибитной таблицы. Для русского языка наиболее популярны на данный момент три кодировки: Koi8-R, Windows-1251 и, так называемая, альтернативная (alt) кодировка.

Такие языки, как китайский, содержат значительно больше 256 символов, поэтому для кодирования каждого из них используют несколько байтов. Для экономии места зачастую применяется следующий прием: некоторые символы кодируются с помощью одного байта, в то время как для других используются два или более байтов. Одной из попыток обобщения такого подхода является стандарт Unicode, в котором для кодирования символов используется диапазон чисел от нуля до 65 536. Такой широкий диапазон позволяет представлять в численном виде символы языка любого уголка планеты.

Но чисто текстовые файлы встречаются все реже. Документы часто содержат рисунки и диаграммы, используются различные шрифты. В результате появляются форматы, представляющие собой различные комбинации текстовых, графических и других форм данных.

Двоичные файлы, в отличие от текстовых, не так просто просмотреть, и в них, обычно, нет знакомых слов – лишь множество непонятных символов. Эти файлы не предназначены непосредственно для чтения человеком. Примерами двоичных файлов являются исполняемые программы и файлы с графическими изображениями.

Примеры двоичного кодирования информации.

Среди всего разнообразия информации, обрабатываемой на компьютере, значительную часть составляют числовая, текстовая, графическая и аудиоинформация. Познакомимся с некоторыми способами кодирования этих типов информации в ЭВМ.

Кодирование чисел.

Есть два основных формата представления чисел в памяти компьютера. Один из них используется для кодирования целых чисел, второй (так называемое представление числа в формате с плавающей точкой) используется для задания некоторого подмножества действительных чисел.

Множество целых чисел, представимых в памяти ЭВМ, ограничено. Диапазон значений зависит от размера области памяти, используемой для размещения чисел. В k -разрядной ячейке может храниться 2 k различных значений целых чисел.

Чтобы получить внутреннее представление целого положительного числа N , хранящегося в k -разрядном машинном слове, нужно:

1) перевести число N в двоичную систему счисления;

2) полученный результат дополнить слева незначащими нулями до k разрядов.

Например, для получения внутреннего представления целого числа 1607 в 2-х байтовой ячейке число переводится в двоичную систему: 1607 10 = 11001000111 2 . Внутреннее представление этого числа в ячейке имеет вид: 0000 0110 0100 0111.

Для записи внутреннего представления целого отрицательного числа (–N) нужно:

1) получить внутреннее представление положительного числа N ;

2) получить обратный код этого числа, заменяя 0 на 1 и 1 на 0;

3) полученному числу прибавить 1 к полученному числу.

Внутреннее представление целого отрицательного числа –1607. С использованием результата предыдущего примера и записывается внутреннее представление положительного числа 1607: 0000 0110 0100 0111. Обратный код получается инвертированием: 1111 1001 1011 1000. Добавляется единица: 1111 1001 1011 1001 – это и есть внутреннее двоичное представление числа –1607.

Формат с плавающей точкой использует представление вещественного числа R в виде произведения мантиссы m на основание системы счисления n в некоторой целой степени p , которую называют порядком: R = m * n p .

Представление числа в форме с плавающей точкой неоднозначно. Например, справедливы следующие равенства:

12,345 = 0,0012345 × 10 4 = 1234,5 × 10 -2 = 0,12345 × 10 2

Чаще всего в ЭВМ используют нормализованное представление числа в форме с плавающей точкой. Мантисса в таком представлении должна удовлетворять условию:

0,1 p Ј m p . Иначе говоря, мантисса меньше 1 и первая значащая цифра – не ноль (p – основание системы счисления).

В памяти компьютера мантисса представляется как целое число, содержащее только значащие цифры (0 целых и запятая не хранятся), так для числа 12,345 в ячейке памяти, отведенной для хранения мантиссы, будет сохранено число 12 345. Для однозначного восстановления исходного числа остается сохранить только его порядок, в данном примере – это 2.

Кодирование текста.

Множество символов, используемых при записи текста, называется алфавитом. Количество символов в алфавите называется его мощностью.

Для представления текстовой информации в компьютере чаще всего используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации, т. к. 2 8 = 256. Но 8 бит составляют один байт, следовательно, двоичный код каждого символа занимает 1 байт памяти ЭВМ.

Все символы такого алфавита пронумерованы от 0 до 255, а каждому номеру соответствует 8-разрядный двоичный код от 00000000 до 11111111. Этот код является порядковым номером символа в двоичной системе счисления.

Для разных типов ЭВМ и операционных систем используются различные таблицы кодировки, отличающиеся порядком размещения символов алфавита в кодовой таблице. Международным стандартом на персональных компьютерах является уже упоминавшаяся таблица кодировки ASCII.

Принцип последовательного кодирования алфавита заключается в том, что в кодовой таблице ASCII латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений.

Стандартными в этой таблице являются только первые 128 символов, т. е. символы с номерами от нуля (двоичный код 00000000) до 127 (01111111). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов, начиная со 128 (двоичный код 10000000) и кончая 255 (11111111), используются для кодировки букв национальных алфавитов, символов псевдографики и научных символов.

Кодирование графической информации.

В видеопамяти находится двоичная информация об изображении, выводимом на экран. Почти все создаваемые, обрабатываемые или просматриваемые с помощью компьютера изображения можно разделить на две большие части – растровую и векторную графику.

Растровые изображения представляют собой однослойную сетку точек, называемых пикселами (pixel, от англ. picture element). Код пиксела содержит информации о его цвете.

Для черно-белого изображения (без полутонов) пиксел может принимать только два значения: белый и черный (светится – не светится), а для его кодирования достаточно одного бита памяти: 1 – белый, 0 – черный.

Пиксел на цветном дисплее может иметь различную окраску, поэтому одного бита на пиксел недостаточно. Для кодирования 4-цветного изображения требуются два бита на пиксел, поскольку два бита могут принимать 4 различных состояния. Может использоваться, например, такой вариант кодировки цветов: 00 – черный, 10 – зеленый, 01 – красный, 11 – коричневый.

На RGB-мониторах все разнообразие цветов получается сочетанием базовых цветов – красного (Red), зеленого (Green), синего (Blue), из которых можно получить 8 основных комбинаций:

Разумеется, если иметь возможность управлять интенсивностью (яркостью) свечения базовых цветов, то количество различных вариантов их сочетаний, порождающих разнообразные оттенки, увеличивается. Количество различных цветов – К и количество битов для их кодировки – N связаны между собой простой формулой: 2 N = К .

В противоположность растровой графике векторное изображение многослойно. Каждый элемент векторного изображения – линия, прямоугольник, окружность или фрагмент текста – располагается в своем собственном слое, пикселы которого устанавливаются независимо от других слоев. Каждый элемент векторного изображения является объектом, который описывается с помощью специального языка (математических уравнения линий, дуг, окружностей и т.д.) Сложные объекты (ломаные линии, различные геометрические фигуры) представляются в виде совокупности элементарных графических объектов.

Объекты векторного изображения, в отличие от растровой графики, могут изменять свои размеры без потери качества (при увеличении растрового изображения увеличивается зернистость).

Кодирование звука.

Из физики известно, что звук – это колебания воздуха. Если преобразовать звук в электрический сигнал (например, с помощью микрофона), то видно плавно изменяющееся с течением времени напряжение. Для компьютерной обработки такой – аналоговый – сигнал нужно каким-то образом преобразовать в последовательность двоичных чисел.

Делается это, например, так – измеряется напряжение через равные промежутки времени и полученные значения записываются в память компьютера. Этот процесс называется дискретизацией (или оцифровкой), а устройство, выполняющее его – аналого-цифровым преобразователем (АЦП).

Чтобы воспроизвести закодированный таким образом звук, нужно сделать обратное преобразование (для этого служит цифро-аналоговый преобразователь – ЦАП), а затем сгладить получившийся ступенчатый сигнал.

Чем выше частота дискретизации и чем больше разрядов отводится для каждого отсчета, тем точнее будет представлен звук, но при этом увеличивается и размер звукового файла. Поэтому в зависимости от характера звука, требований, предъявляемых к его качеству и объему занимаемой памяти, выбирают некоторые компромиссные значения.

Описанный способ кодирования звуковой информации достаточно универсален, он позволяет представить любой звук и преобразовывать его самыми разными способами. Но бывают случаи, когда выгодней действовать по-иному.

Издавна используется довольно компактный способ представления музыки – нотная запись. В ней специальными символами указывается, какой высоты звук, на каком инструменте и как сыграть. Фактически, ее можно считать алгоритмом для музыканта, записанным на особом формальном языке. В 1983 ведущие производители компьютеров и музыкальных синтезаторов разработали стандарт, определивший такую систему кодов. Он получил название MIDI.

Конечно, такая система кодирования позволяет записать далеко не всякий звук, она годится только для инструментальной музыки. Но есть у нее и неоспоримые преимущества: чрезвычайно компактная запись, естественность для музыканта (практически любой MIDI-редактор позволяет работать с музыкой в виде обычных нот), легкость замены инструментов, изменения темпа и тональности мелодии.

Есть и другие, чисто компьютерные, форматы записи музыки. Среди них – формат MP3, позволяющий с очень большим качеством и степенью сжатия кодировать музыку, при этом вместо 18–20 музыкальных композиций на стандартном компакт-диске (CDROM) помещается около 200. Одна песня занимает, примерно, 3,5 Mb, что позволяет пользователям сети Интернет легко обмениваться музыкальными композициями.

Компьютер – универсальная информационная машина.

Одно из основных назначений компьютера – обработка и хранение информации. С появлением ЭВМ стало возможным оперировать немыслимыми ранее объемами информации. В электронную форму переводят библиотеки, содержащие научную и художественную литературы. Старые фото- и кино-архивы обретают новую жизнь в цифровой форме.

Анна Чугайнова

Информатика – относительно молодая наука, которая к тому же очень быстро эволюционирует, что часто приводит к таким формам ее развития, которые были до сих нор неизвестны человечеству. Вместе с тем значение информатики постоянно возрастает, так как информатизация активно проникает во все сферы деятельности человека. Эти особенности информатики приводят к тому, что до сих но]) в научном сообществе не удалось выработать общепринятое определение этой пауки. Практически в каждой отрасли науки можно встретить свое, отличное от других определение информатики. Поэтому информатика для математика, специалиста по компьютерной технике, экономиста, философа, социолога, филолога – это очень часто, на первый взгляд, совсем разные науки. Однако если обратиться к истории становления информатики как науки, становится ясно, что ее базовые принципы и понятийный аппарат во многом универсальны, т.е. не зависят от конкретной сферы ее применения.

Происхождение термина "информатика"

Термин "информатика" возник в 60-х гг. XX в. во Франции для названия области, занимающейся автоматизированной обработкой информации с помощью электронных вычислительных маш ин. Французский термин informatique (информатика) образован путем слияния слов information (информация) и automatique (автоматика) и означает информационную автоматику, или автоматизированную переработку информации. В англоязычных странах этому термину соответствует синоним computer science (наука о компьютерной технике) .

В 1963 г. советский ученый Ф. Е. Темников одновременно с зарубежными авторами определяет информатику как науку об информации вообще, состоящую из трех основных частей – теорий информационных элементов, информационных процессов и информационных систем. Это был первый важный поворот в судьбе понятия "информатика", но он долго оставался лишь историческим фактом. Эта попытка обосновать новое понятие, доказать его необходимость не была успешной и в должной мере не оценена, в силу того что публикация была осуществлена в малоизвестном, специальном журнале (Известия вузов. Электромеханика. 1963. № 11). Так или иначе тогда понятие "информатика" еще не получило в нашей стране заметного распространения. Хотя в научной литературе уже в тот период часто встречались трактовки "информатики через призму взглядов Темникова". Так, в 1968 г. напечатана работа А. И. Михайлова, А. И. Черного и Р. С. Гиляревского "Основы информатики", в которой подробно рассмотрены понятия научно-технической информации и методы ее обработки .

В 1972 г. в СССР выходит Большая советская энциклопедия (БСЭ), в которой дефиниция термина "информатика" была однозначно сориентирована на гуманитарность этой науки, в частности, на процесс коммуникации.

Информатика – область гуманитарного знания, изучающая структуру и общие свойства научной информации, а также основные закономерности процессов информационной коммуникации .

Такой разброс представлений о месте и роли научной информатики приводит к тому, что ее определения становятся все более размытыми, пытаются дистанцироваться от какой-либо конкретики. Па Международном конгрессе в Японии в 1978 г. дается широкое определение информатики.

Понятие информатики охватывает области, связанные с разработкой, созданием, использованием и материально-техническим обслуживанием систем обработки информации, включая машины, оборудование, математическое обеспечение, организационные аспекты, а также комплекс промышленного, коммерческого, административного, социального и политического воздействия.

В 1982 г. выходит монография академика В. М. Глушкова "Основы безбумажной информатики" (2-е издание, исправленное и дополненное, увидело свет в 1987 г. ). А год спустя годичное общее собрание Академии наук СССР принимает решение о создании в Академии наук отделения информатики. С этого момента идеи информатики в нашей стране получили прописку не только в науке, но также и среди специалистов-практиков.

Каково тогда было понимание информатики? В указанной монографии академика В. М. Глушкова нет прямого определения информатики как новой науки. Но исходя из содержания этой книги и материалов АН СССР о создании нового отделения можно сделать следующий вывод.

Информатика – это совокупность средств всей современной информационной теории, техники и технологии, суммарное, комплексное обозначение этой области знаний.

По-другому говоря, информатика как наука вбирает сегодня самые разные по своей сущности и природе информационные идеи, средства и процессы, связанные с удовлетворением информационных потребностей общества в настоящем и будущем. Однако в рамках современной информатики можно вычленить и более конкретные области ее приложения. Поэтому в статье К. К. Колина "Эволюция информатики и проблемы формирования нового комплекса наук об информации" предложена двухуровневая структура предметной области информатики . Верхний уровень отведен теоретической информатике, которая как теоретическая основа систематизированного научного знания охватывает три основных нижележащих уровня – техническую, социальную и биологическую информатику. Каждый из нижележащих уровней обладает своей спецификой, так как изучает и описывает информационные процессы в зависимости от среды функционирования. Двухуровневая структура предметных областей информатики представлена в табл. 1.1.

Таблица 1.1

Структура предметной области информатики (1)

Иногда, помимо технической информатики (ее сфера функционирования – это техносфера, т.е. то, что создано человеком), выделяют также сферу физической информатики, которая изучает информационные процессы в естественной природной среде. В этом случае триада второго уровня дополняется четвертым элементом (табл. 1.2).

Главная » Сленг » Все что относится к информатике. Стоит ли учиться этому предмету? Двоичное кодирование информации