Потенциал Образовательный журнал
для старшеклассников и учителей

<< К разделам
Информатика
Алгоритмы
Теория информации
Теория программирования
Все статьи
Журнал
Подписка
Интернет-Журнал «Потенциал» External link mark
Авторам
Печатные номера
Полезные сайты
ЗФТШ External link mark
МЦНМО External link mark
Журнал "Квант" External link mark
"Открытый Колледж" External link mark
Союз образовательных сайтов External link mark
Интернет-портал "Абитуриент" External link mark
Другие ссылки...

WOlist.ru - каталог качественных сайтов Рунета Союз образовательных сайтов Rambler's Top100 Портал ВСЕОБУЧ. Все образование Москвы и регионов РФ.

Главная Подписка Архив Авторы Фотоальбом Подготовка в вуз Магазин

Информация и компьютер

Обложка книжки Роганов Евгений Александрович – кандидат физико-математических наук, заведующий кафедрой информационных систем и технологий Московского государственного индустриального университета, автор учебников «Основы информатики и программирования» и «Практическая информатика».

Тихомиров Николай Борисович — кандидат физико-математических наук, профессор кафедры функционального анализа и геометрии Тверского государственного университета.

Шелехов Александр Михайлович – доктор физико-математических наук, профессор кафедры функционального анализа и геометрии Тверского государственного университета.

Эта книжка используется как учебное пособие в Московском государственном индустриальном университете, но некоторые главы вполне доступны школьникам и являются хорошим введением в компьютерную науку.

Понятие информации играет в информатике столь же важную роль, как и понятие числа в математике. Информатика (computer science) изучает свойства информации, а также способы представления, накопления и обработки информации с помощью технических средств. Именно поэтому изучение теоретических основ информатики обычно начинают с обсуждения понятия информации. Хотя теоретическая информатика возникла довольно давно, свою сегодняшнюю значимость она приобрела за последние 10-20 лет. Основная причина этого явления – бурное развитие технологической базы и, прежде всего, компьютеров и сетей. Только широкое распространение высокопроизводительных ЭВМ, соединённых быстрыми каналами обмена информацией, позволило человечеству вступить в новую эпоху — эпоху информационных технологий. Здесь мы познакомимся с основными понятиями теоретической информатики, поговорим о компьютерном «железе» и компьютерных программах, обсудим основные возможности современных информационных технологий.

Человек и информация

Термин «информация» происходит от латинского слова informatio, означающего разъяснение, изложение, осведомлённость. Информацию мы передаём друг другу в устной и письменной форме, а также в форме жестов и знаков. Любую нужную информацию мы осмысливаем и на её основе делаем определённые умозаключения. Универсальное определение информации дать весьма затруднительно, хотя это понятие является одним из основных в современной науке. Его сложность, многоплановость, широта применения и быстрое развитие отражаются в постоянном появлении новых толкований терминов «информатика» и «информация». Имеется много определений информации, от наиболее общего, философского — «информация есть отражение реального мира» — до узкого, практического — «информация есть все сведения, являющиеся объектом хранения, передачи и преобразования». Термин «обработка информации» появился совсем недавно, хотя обрабатывать информацию люди начали ещё в древние времена. Тогда из поколения в поколение информация передавалась устно. Это были сведения о профессиональных навыках: приёмах охоты, обработке добычи, способах земледелия и т. п. Затем информацию стали фиксировать в виде графических образов окружающего мира. Первые наскальные рисунки, изображающие животных, растения и людей, появились примерно 20-30 тысяч лет назад. Со временем появилась письменность — более современный способ фиксирования и передачи информации. На чём только люди не писали! В Индии — на пальмовых листьях, в Вавилоне — на глиняных плитках, на Руси пользовались берестой. Письменность явилась новым шагом человечества в области создания средств хранения и передачи информации. Следующим революционным явлением в этой сфере стало изобретение печатного станка, благодаря которому появилась книга и, таким образом, стало возможным массовое тиражирование знаний, зафиксированных на материальном носителе. Возникли потоки книг, которые, сливаясь с потоками технической документации и многотомной справочной литературой, образовали океаны информации. Для сбора, переработки и распространения информации создавались издательства и типографии — родилась информационная промышленность. Газеты, журналы и другие издания, выпускаемые большими тиражами, зачастую, кроме полезной информации, обрушивали на человека огромное количество и ненужных, бесполезных сведений. Для обозначения таких лишних сведений придумали даже специальный термин — информационный шум. Помимо печати появились и другие средства массовой информации — радио и телевидение. В течение последних столетий государства постоянно воевали друг с другом, что требовало информации о военном потенциале противника. Её добывали, например, с помощью разведчиков. Со временем остро встал вопрос о защите информации от утечки в посторонние руки. Стали разрабатываться методы кодирования и способы быстрой и безопасной пересылки информации. Сейчас книга уже не отвечает возросшим требованиям общества, так как является неудобным, сложным, дорогим, а главное «медленным носителем информации. Компьютеры, являющиеся революционным изобретением XX века, предоставили не только новые носители информации, но и средства её обработки. В совокупности с линиями связи (проводная связь, радио, космическая и оптическая связь) ЭВМ делает доступной любую часть гигантского океана информации. Кодирование информации — это переход от одной формы представления информации к другой, более удобной для хранения, передачи или обработки. Поскольку компьютер может обрабатывать только информацию, представленную в числовой форме, то любая другая информация (звуки, изображения, показания приборов и т.д.), предназначенная для обработки на компьютере, должна быть преобразована в числовую форму. Важная проблема — оценка количества информации. Часто приходится слышать, что то или иное сообщение несёт мало информации или, наоборот, содержит исчерпывающую информацию. Разные люди, получившие одно и то же сообщение (например, прочитав статью в газете), по-разному оценивают количество содержащейся в нём информации. Тот, кто знал мало о предмете статьи, решит, что получил много информации; осведомлённый человек скажет, что информации не получил вовсе. При получении информации неопределённость по интересующему нас вопросу уменьшается. Если в результате получения сообщения будет достигнута полная ясность в данном вопросе (неопределённость исчезнет), то говорят, что была получена исчерпывающая информация. Напротив, если после получения сообщения неопределённость осталась прежней (сообщаемые сведения или уже были известны, или не относятся к делу), значит, существенной информации по данному вопросу получено не было. Существуют и вполне объективные, не зависящие от мнения конкретного человека, способы измерения информации. Если подбросить монету и проследить, какой стороной она упадёт, то мы получим определённую информацию. Обе стороны монеты «равноправны», поэтому одинаково вероятны выпадение как «орла», так и «решки». Получаемую информацию можно закодировать двумя цифрами — 0 и 1. Количество информации, которое можно закодировать двумя цифрами (ему соответствует опыт с двумя возможными исходами), называется битом. Результат извлечения «вслепую» из мешка одного из двух шариков разного цвета также оценивается одним битом информации. Название бит (bit) произошло от английских слов binary digit — двоичная цифра. В компьютере бит реализуется устройством, которое может находиться в двух состояниях, и кодируется физическим состоянием носителя информации: намагничено или нена-магничено, есть ток или его нет. При этом одно состояние принято обозначать цифрой 0, а другое — цифрой 1. Последовательностью битов можно закодировать текст, изображение, звук или какую-либо другую информацию. Такой метод представления информации называется двоичным кодированием (binary encoding). В информатике часто используется величина, равная восьми битам и называемая байтом (byte). Например, информация о состоянии группы из восьми выключателей, каждый из которых может быть включён или выключен, соответствует одному байту. Если бит позволяет выбрать один вариант из двух возможных, то байт, соответственно, один из 256 = 28. В ЭВМ каждый символ часто кодируется одним или двумя байтами, то есть восемью или шестнадцатью двоичными цифрами. Так, например, в широко распространённой кодировке Koi8-R буква «М» имеет код 11101101, буква «И» — код 11101001, а пробел — код 00100000. В последние годы происходит постепенный переход на двухбайтовую кодировку Unicode, в которой можно представить уже 216 = 65536 различных символов. Для измерения количества информации используют и более крупные единицы:

1 килобит (Кбит)= 1024 бита 1 килобайт (Кб)= 1024 байта
1 мегабит (Мбит)= 1024 килобита 1 мегабайт (Мб)= 1024 килобайта
1 гигабит (Гбит)= 1024 мегабита 1 гигабайт (Гб)= 1024 мегабайта
1 терабит (Тбит)= 1024 гигабита 1 терабайт (Тб)= 1024 гигабайта

Обратите внимание на тот факт, что в отличие, скажем, от килограмма, содержащего 1000 граммов, килобайт содержит 1024 = 210 байта!

Юмор

Задача 1. Книга содержит 400 страниц, на каждой странице 35 строк, в каждой строке 50 символов. Предполагая, что каждый символ требует для своего кодирования один байт, вычислите объём электронного представления этой книги в байтах. Можно ли её записать на обычную магнитную дискету ёмкостью 1,44 мегабайта?

Решение. Страница содержит 35 • 50 = 1750 байт информации. Полный объём информации в книге равен 400 • 1750 = 700 000 байт, что составляет примерно 683,6 килобайта. Таким образом, на дискету можно записать не одну, а даже две такие книги.

Задания

  1. Для создания электронной библиотеки администрация университета приобрела дисковый массив (несколько быстрых винчестеров) общим объёмом 0,6 терабайта. Сколько стеллажей с книгами заменит эта библиотека, если каждая из книг содержит 400 страниц по 35 строк, на каждой из которых по 50 символов, а стеллаж состоит из восьми полок по 25 книг на каждой?
  2. Результат каких из перечисленных ниже событий даёт информацию в объёме, не пре вышающем двух бит: а) бросание игральной кости; б) бросание монеты; в) бросание двух монет; г) выбор одной из сторон заданного треугольника; д) выбор одной из букв русского алфавита?

Представление информации в ЭВМ

Чаще всего информация на компьютере представлена в виде файлов (files). Именно файлы обычно используют и для передачи данных от программы к программе, и от одного компьютера к другому. Другими словами, файл — это хранилище данных. Кроме того, файл имеет имя и разнообразные атрибуты, важнейшие из которых — дата и время его создания, имя владельца и права доступа. С течением времени понятие файла менялось. В операционных системах первых больших ЭВМ файл являлся набором записей. Обычно все записи в файле были одного размера, чаще всего по 80 символов каждая. Операционные системы современных компьютеров предполагают, что файл — поименованная последовательность байтов, размещённых на каком-либо носителе информации. Файловая структура представляет собой систему хранения файлов на запоминающем устройстве, например, на диске. Файлы, как правило, организованы в каталоги (называемые также папками и директориями). Любой каталог может содержать произвольное число подкаталогов, в каждом из которых могут храниться файлы и другие каталоги. Все файлы условно можно разделить на две большие группы — текстовые и двоичные. Текстовые файлы предназначены исключительно для представления обычных (plain) текстов. Для хранения каждого символа в них отводится один или два байта, а кодирование выполняется с помощью специальных таблиц, в которых каждому символу соответствует определённое число. Основное достоинство подобного представления информации — её компактность и простота программ, предназначенных для работы с ней. Двоичные файлы не предназначены для непосредственного чтения человеком. С их помощью кодируют графические изображения, звук и большую часть документов, подготовленных с помощью современных офисных пакетов программ, в которые входят текстовые процессоры, средства для работы с электронными таблицами, программы для создания презентаций и некоторые другие. При просмотре содержимого двоичного файла без помощи специально предназначенных для этой цели программ вы обнаружите в нём лишь бессмысленное нагромождение непонятных символов. В ЭВМ используют двоичную систему, потому что она имеет ряд преимуществ перед другими:

  • для её реализации используются технические элементы с двумя возможными состояниями (есть ток в проводнике или нет, намагничен участок поверхности магнитного носителя информации или нет);
  • такое представление надёжно и помехоустойчиво;
  • для выполнения логических преобразований информации можно использовать аппарат булевой алгебры (см. десятую главу);
  • двоичная арифметика намного проще десятичной.
Так как любая информация на компьютере хранится в виде последовательности байтов, то есть представляет из себя набор двоичных чисел, то полезно более подробно познакомиться с двоичной системой счисления, выполнением арифметических операций над двоичными числами и методами перевода чисел из одной системы счисления в другую.
Таблица 1
Таблица 1
Арифметические действия, выполняемые в двоичной системе, подчиняются тем же правилам, что и в десятичной. Только в двоичной системе перенос единиц в старший разряд возникает чаще, чем в десятичной. Таблицы сложения и умножения в двоичной системе значительно проще, чем в десятичной (таблица 1).

Задача 2. Выполните умножение чисел 11012 и 1012 (это запись чисел 13 и 5 в двоичной системе счисления).

Решение Будем действовать вполне стандартно, выполняя умножение «столбиком». При умножении на единицу мы просто переписываем множитель 1101, сдвигая его влево на нужное число позиций, а умножение на ноль не требует никаких действий. При сложении получилось три переноса в более старший разряд. Итоговый результат 1000001 представляет собой двоичную запись числа 65. Как показывает этот пример, ЭВМ должна «знать» таблицы сложения и умножения и уметь выполнять сдвиг двоичного числа. Процессор любого современного компьютера выполняет все эти операции очень быстро.

Задача 3. Найдите частное от деления числа 100102 на 112 (в десятичной системе счисления это деление числа 18 на 3).

Решение.

Деление «уголком» выполняется так же, как и при использовании десятичной системы счисления. Кроме двоичной и десятичной систем счисления в информатике часто используют системы счисления с основаниями 8 и 16. Решение Причина выбора именно этих чисел весьма проста: для облегчения восприятия двоичного числа его разбивают на группы по три или четыре цифры в каждой. Для кодировки троек требуется восемь цифр, поэтому используют цифры от 0 до 7 (таблица 2). Для кодировки же четвёрок необходимо шестнадцать знаков; для этого берут 10 цифр десятичной системы и 6 букв латинского алфавита: А, В, С, D, Е, F, представляющих соответственно числа от 10 до 15 (таблица 3). Полученные системы, имеющие основания 8 и 16, называются, как мы знаем, восьмеричной и шестнадцатеричной.

Задача 4. Найдите запись десятичного числа 47 в двоичной, восьмеричной и шестнадцатеричной системах счисления. Таблица

Решение.

Чтобы записать число 47 в двоичной системе, делим его на 2 и выписываем получающиеся остатки. Аналогично поступаем и в двух других случаях — делим 47 на 8 и на 16. Таким образом, в двоичной, восьмеричной и шестнадцатеричной системах счисления число 47 записывается соответственно как 1011112, 578 и 2F16. Обратная операция перевода в десятичную систему выполняется гораздо проще, так как любое число х можно представить в виде:

x = a0 pn + a1 pn – 1 + ...an – 1 p1 + an p0, где a0, a1,... , an-1, an — цифры записи данного числа в системе счисления с основанием p

Например,

1011112=1 * 25 + 0 * 24 + 1 * 23 + 1 * 22 + 1 * 21 + 1 * 20 = 47

57028=5 * 83+7 * 82+0 * 81+2 * 80 = 2560+448+2 = 3010

4AF16=4 * 162+10 * 161+15 * 160=1024+160+15=1199

Таблица 3

0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1001 1100 1101 1110 1111
0 1 2 3 4 5 6 7 8 9 A B C D E F

Проще всего осуществляется перевод чисел из восьмеричной и шестнадцатеричной систем в двоичную: надо всего лишь заменить каждую из цифр числа на три или четыре двоичные цифры в соответствии с таблицами 2 и 3.

Несложно выполнить и обратное преобразование — перевести число из двоичной системы счисления в системы с основанием, равным степени двойки (8 или 16). Для того, чтобы целое число записать в системе счисления с основанием 2n (n = 3,4), нужно выполнить следующие действия:

  1. данное двоичное число разбить справа налево на группы по n цифр в каждой;
  2. если в самой левой группе окажется менее n разрядов, то дополнить её слева нулями до нужного числа разрядов;
  3. рассматривая каждую из групп как n - разрядное двоичное число, заменить её соответствующей цифрой в системе счисления с основанием 2n, используя таблицы 2 и 3.

Задача 5. Запишите в шестнадцатеричной и восьмеричной системах счисления число 1001111012

Решение. С учётом таблицы 3, имеем: 1001111012 = 100111101 = 000100111101 = 13D16. Пользуясь таблицей 2, получаем: 1001111012 = 100111101 = 4758.

В заключение расскажем о способах кодирования наиболее распространённых видов информации — числовой, текстовой, графической и звуковой. Мы рассмотрим этот вопрос только в самых общих чертах, оставляя в стороне методы представления другой мультимедийной информации (например, видеоинформации).

Начнём с кодирования чисел. Существуют два основных формата представления чисел в памяти компьютера. Один из них используется для кодирования целых чисел, второй (так называемое представление числа в формате с плавающей точкой) — для задания действительных чисел. Сразу отметим, что действительные числа задаются приближённо. Обычно для записи целого числа используют четыре байта, что позволяет задать 232 « 4,3 миллиарда чисел. Самый старший (левый) бит используется для представления знака: минус кодируется единицей, а плюс — нулём.

В первые десятилетия существования ЭВМ тексты кодировали описанным в предыдущем параграфе способом, представляя каждый символ одним байтом. Вскоре, однако, люди начали работать с документами, содержащими символы различных шрифтов, цветов и размеров, а также математические формулы, таблицы и рисунки. Для этих целей были разработаны более сложные способы кодирования.

Все создаваемые, обрабатываемые или просматриваемые с помощью компьютера изображения можно разделить на две большие части — растровую и векторную графику. Растровые изображения представляют собой решётку точек (подобную клетчатой бумаге), называемых пикселами (pixel, от английских слов picture element). Код пиксела содержит информации о его цвете. Для чёрно-белого изображения (без полутонов) пиксел может принимать только два значения: белый и чёрный (светится — не светится), а для его кодирования достаточно одного бита памяти: 1 — белый, 0 — чёрный. На цветном дисплее пиксел может иметь различную окраску, поэтому одного бита на пиксел недостаточно. Палитра из единичек и нулей

Для кодирования четырёхцветного изображения требуется уже два бита на пиксел, например: 00 — чёрный, 10 — зелёный, 01 — красный, 11 — коричневый.

На RGB-мониторах всё разнообразие цветов получается сочетанием трёх базовых — красного (Red), зелёного (Green) и синего (Blue), из которых можно получить восемь основных комбинаций, перечисленных в таблице 1. Для того, чтобы иметь возможность управлять интенсивностью (яркостью) свечения базовых цветов, надо увеличивать количество различных вариантов их сочетаний, порождающих разнообразные оттенки. Число различных цветов k и количество битов для их кодировки n связаны между собой простой формулой: 2n = k. В частности, при кодировании цвета пиксела одним байтом можно задать 28 = 256 различных цветов, двумя байтами — 216 = 65536 цветов, тремя — более миллиона 224).

В противоположность растровой графике векторное изображение многослойно. Каждый элемент векторного изображения — отрезок, кривая линия или фрагмент текста — располагается в своём собственном слое, пикселы которого устанавливаются независимо от других слоев, и описывается с помощью специального языка (математических уравнений линий, дуг, окружностей и т.д.). Сложные объекты (ломаные линии, различные геометрические фигуры) представляются в виде совокупности элементарных графических объектов. Векторное изображение может изменять свои размеры без потери качества, в то время как при увеличении растрового изображения возрастает его зернистость.

Завершим это краткое введение рассмотрением проблем кодирования звука. Из курса физики вам известно, что звук — это колебания воздуха. Если преобразовать звук в электрический сигнал (например, с помощью микрофона), мы увидим плавно изменяющееся с течением времени напряжение. Для компьютерной обработки такой (аналоговый) сигнал нужно каким-то образом преобразовать в последовательность двоичных чисел. Обычно это делается следующим образом. Будем измерять электрическое напряжение в микрофоне через равные промежутки времени и записывать полученные значения в память компьютера. Этот процесс называется дискретизацией (или оцифровкой), а устройство, выполняющее его — аналого-цифровым преобразователем (АЦП). Для того, чтобы воспроизвести закодированный таким образом звук, нужно выполнить обратное преобразование (для него служит цифро-аналоговый преобразователь — ЦАП), а затем сгладить получившийся ступенчатый сигнал. Чем выше частота дискретизации (количество измерений в секунду) и чем больше разрядов отводится для кодирования, тем точнее будет представлен звук. Но при этом увеличивается и размер звукового файла. Поэтому в зависимости от характера звука, требований, предъявляемых к его качеству и к объёму занимаемой памяти, выбирают некоторые компромиссные значения. Описанный способ кодирования звуковой информации достаточно универсален, он позволяет представлять любой звук и преобразовывать его самыми разными способами. Но бывают случаи, когда выгодней действовать по-иному.

Человек издавна использует довольно компактный способ представления (кодировки) музыки — нотную запись, в которой специальными символами указывается высота звука. Фактически, её можно считать алгоритмом для музыканта, записанным на особом формальном языке. Более двадцати лет назад ведущие производители компьютеров и музыкальных синтезаторов разработали систему кодов, основанную на нотной записи, которая получила название MIDI. Хотя эта система кодирования позволяет работать только с инструментальной музыкой, она имеет неоспоримые преимущества: чрезвычайно компактная запись, естественность представления (MIDI-редактор позволяет работать с музыкой в виде обычных нот), простота изменения темпа и тональности мелодии. Заметим, что существуют и другие форматы записи музыки. Среди них следует отметить формат МРЗ, позволяющий очень компактно и качественно кодировать музыку. При этом на стандартный CDROM помещается около 200 музыкальных композиций (на аудио-компакт — всего 18-20). Одна песня занимает примерно 3,5 Мб, что позволяет пользователям сети Интернет легко обмениваться музыкальными композициями. Чуть менее распространён пока более новый (и лучший по ряду характеристик) формат OGG, схожий во многом с форматом МРЗ. Это свободный формат, в отличие от коммерческого МРЗ.

Задания

  1. Для представления каких видов информации из ниже перечисленных обычно используют текстовый (а не двоичный) формат файла: а) исходный текст программы на каком-либо языке программирования; б) простой текст, не содержащий никаких элементов форматирования; в) растровое графическое изображение; г) звук?
  2. Найдите произведение чисел 100011102 и 111110012 и проверьте полученный результат в десятичной системе счисления.
  3. Запишите числа 27, 89 и 124 в двоичной, восьмеричной и шестнадцатеричной системах счисления.
  4. Запишите в десятичной системе счисления числа 1216, 7BE16, A08F?16.

© Журнал "Потенциал", 2005-2017. Все права защищены. Воспроизведение материалов сайта и журнала "Потенциал" в любом виде, полностью или частично, допускается только с письменного разрешения редакции.
Отзывы и пожелания шлите почтой.
Подготовка к ЕГЭ
ЕГЭ по математике
login