Использование диаграмм для анализа данных  

Использование диаграмм для анализа данных

Диаграммы можно использовать не только для визуализации данных, но и для их анализа. При подборе оптимальных значений параметров можно найти исходное значение, которое, будучи использовано в формуле, приведет к нужному результату. Значения, отображаемые на диаграмме, можно изменять путем перетаскивания маркеров данных и с помощью подбора параметров, полу­ченных из формул. Когда при перетаскивании маркера данных его значение изменяется, автома­тически изменяется и исходное значение на листе.

Чтобы изменить значения, полученные из формул ячеек листа, в плоских гистограммах, линейчатых, круговых и кольцевых диаграммах, графиках, точечных и пузырьковых диаграммах, перетащите маркер данных в диаграмме. Для этого выделите щелчком мыши ряд данных, значе­ния которого следует изменить. Затем еще раз щелкните мышью, не меняя положение указателя. Для линейчатых диаграмм и гистограмм перетащите с помощью мыши верхний центральный маркер выделения. Для круговых и кольцевых диаграмм перетащите с помощью мыши наиболь­ший маркер выделения на внешней границе маркера данных. При этом автоматически будут изме­нены исходные данные в таблице. Если значение маркера данных получено из формулы, появится диалоговое окно Подбор параметра(рис. 2.30).

Рис.2.30. Диалоговое окно Подбор параметра

Чтобы найти значение ячейки путем изменения значения только одной другой ячейки, щелк­ните ячейку, значение которой нужно изменить. Ссылка на эту ячейку отобразится в поле Изменяя значение ячейки. При этом в поле Установить в ячейке отображается ссылка на ячейку, содержа­щую формулу, а в поле Значение – требуемая величина. При подборе можно изменять только одну ячейку. Фактически Excel выполняет операции, аналогичные тем, какие производятся после выбора команды Поиск решения в меню Сервис.

СИСТЕМА УПРАВЛЕНИЯ БАЗАМИ ДАННЫХ MICROSOFT ACCESS

Основные понятия и определения теории баз данных

Значительная часть пользователей, приобретая компьютер, осваивает операции именно с текстовыми файлами. На первом этапе компьютер обычно используют в качестве удобной и «интеллектуальной» пишущей машинки. В этом случае используется примитивная информаци­онная система, которая состоит из следующих элементов:

ü текстового редактора как инструмента манипулирования текстами;

ü группы текстовых файлов как объекта обработки.

На следующем этапе многие используют текстовый файл как некую амбарную книгу, куда легко можно заносить разнообразную «списочную» информацию, например, рецепты, телефонные номера знакомых, каталоги своей видеотеки, фонотеки, адреса и названия организаций и т.д. Способ представления и размещения информации в таких «амбарных» книгах обычно придумы­вает сам пользователь.



Создавая базы данных, мы стремимся обеспечить себе возможность, во-первых, упорядо­чивать информацию по различным признакам (например, по фамилиям), а во-вторых, быстро извлекать выборки с произвольным сочетанием признаков (например, фамилии друзей, родив­шихся в летние месяцы). Организация данных в текстовом редакторе не позволит ни того, ни другого, потому что упорядочить информацию в текстовом файле значительно сложнее, чем даже в картонной коробке.

Чтобы компьютер мог безошибочно искать и систематизировать данные, надо, прежде всего, выработать и соблюдать при записи данных некоторые правила (соглашения) о способах пред­ставления информации. Для того чтобы осуществлять поиск нужной информации, преобра­зовывать информацию по какому-либо признаку, а также выполнять другие манипуляции с данными, необходимо информацию структурировать.

Электронные картотеки на материальных носителях, в которых данные структурированы таким образом, чтобы их могли использовать различные пользователи и программы, получили название банк данных.

Банк данных – современная форма хранения и доступа к информации. Это система специ­альным образом организованных данных, программных, технических, языковых, организационно-методических средств, предназначенных для обеспечения централизованного накопления и коллективного многоцелевого использования данных.

Компонентами банка данных являются:



ü база данных (БД);

ü система управления базой данных (СУБД);

ü вычислительная система (операционная система и технические средства);

ü администратор базы данных;

ü обслуживающий персонал;

ü конечные пользователи.

База данных– это совокупность структурированных сведений о конкретных объектах реаль­ного мира в какой-либо предметной области или разделе предметной области. Например, база данных по вузам (высшее образование), база данных по лекарственным препаратам (медицина), база данных по автомобилям (ГИБДД), база данных по стройматериалам (склад) и т.п.

СУБД – это комплекс языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями.

Администратор БД – это лицо, отвечающее за выработку требований к БД во время ее проектирования, реализацию БД в процессе создания, эффективное использование и сопровожде­ние БД в процессе эксплуатации.

Обслуживающий персонал – это программисты и системные аналитики, которые пишут прикладные программы обработки данных, определяют логическую структуру БД.

Конечные пользователи – люди, которые вводят, извлекают и используют данные.

Виды структур данных

Ядром любой базы данных является модель данных, которая представляет собой структуру данных, соглашения о способах их представления и операций манипулирования ими. Модель данных представляет собой формализованное описание объектов предметной области и взаимо­связей между ними.

Различают три основных типа моделей данных:

ü иерархическая,

ü сетевая,

ü реляционная.

Иерархическая структура представляет собой совокупность элементов, в которой данные одного уровня подчинены данным другого уровня, а связи между элементами образуют древовид­ную структуру. В такой структуре исходные элементы порождают другие элементы, причем эти элементы в свою очередь порождают следующие элементы и т.д. Существенно то, что каждый порожденный элемент имеет только одного «родителя». В качестве примера иерархической струк­туры (рис. 3.1) приведена организация хранения информации о музыкальных альбомах группы «Ace of Base». Группа «Ace of Base» может быть подчиненной для объектов более высокого уровня иерархии, например страны, стиля или носителя.

Рис. 3.1. Пример иерархической организации данных

Примером иерархической базы данных может служить генеалогическое древо вашей семьи.

Несмотря на то, что в атрибутах, описывающих песню, нет названия альбома, глядя на дерево, по линиям связи можно определить принадлежность альбома группе. Из данной иерархической структуры можно узнать:

ü в каком альбоме больше песен;

ü число альбомов, выпущенных группой;

ü есть ли в альбомах одинаковые песни и т.д.

Существуют и более сложные – сетевые – структуры, в которых каждый порожденный элемент может иметь более одного порождающего элемента. Сетевая модель данных состоит из набора соответствующих связей. На формирование связи особых ограничений не накладывается.

Пример схемы простейшей сетевой БД показан на рис. 3.2. Типы связей здесь обозначены надписями на соединяющих линиях.

Рис. 3.2. Пример сетевой организации данных

И сетевые и иерархические структуры можно свести к простым двумерным таблицам.

Наиболее удобным и для пользователя, и для компьютера является представление данных в виде двумерной таблицы – подавляющее большинство современных информационных систем работает именно с такими таблицами. Базы данных, которые состоят из двумерных таблиц, назы­ваются реляционными(по-английски «relation» – отношение). Основная идея реляционного подхода состоит в том, чтобы представить произвольную структуру данных в виде простой двумерной таблицы.

Примером реализации реляционной модели данных может быть таблица с информацией об учащихся (табл. 3.1).

Таблица 3.1

Информация об учащихся

Код Фамилия Имя Отчество Год рождения Школа Класс
Иванникова Анна Ивановна
Баранова Ирина Алексеевна
Корнилова Ольга Владимировна
Воробьев Алексей Петрович
Воробьев Алексей Иванович
Воробьев Олег Григорьевич
Скоркин Александр Евгеньевич
Володина Анна Алексеевна

Как видно из приведенного примера, реляционная таблица обладает следующими свойствами:

ü каждая строка таблицы – один элемент данных (сведения об одном учащемся);

ü все столбцы в таблице однородные, т.е. все элементы в столбце имеют одинаковый тип и длину (например, в столбце Имя отображаются имена учащихся символьного типа длиной не более определенного количества символов);

üодинаковые строки в таблице не допускаются (запись о каждом учащемся делается только один раз);

üпорядок следования строк и столбцов в таблице может быть произвольным (запись об учащемся в таблицу делается при поступлении в школу).

Основные структурные элементы реляционной базы данных:

1. В реляционных БД любые совокупности данных представляются в виде двумерных таблиц (отношений), подобных описанному выше списку учащихся. При этом каждая таблица состоит из фиксированного числа столбцов и некоторого (переменного) количества строк. Описание столб­цов принято называть макетом таблицыилисхемойотношения.

2. Каждый столбец таблицы представляет поле – элементарную единицу логической организа­ции данных, которая соответствует неделимой единице информации – реквизиту объекта данных (например, фамилия учащегося, год рождения).

Для описания поля используются характеристики:

ü имя поля (атрибут), например, Код, Фамилия.

ü тип поля, например, числовой, текстовый;

ü дополнительные характеристики (длина поля, формат, точность).

3. Каждая строка таблицы называется записью(кортеж). Запись – строка таблицы, логически объединяющая все поля, описывающие один объект данных, например, все поля в первой строке табл. 3.1 описывают данные об учащейся Иванниковой Анне Ивановне, 1984 года рождения, обучающейся в школе № 1 в 9 классе, код учащегося 1.

В отличие от количества полей (столбцов) в таблице, количество записей в процессе эксплуа­тации БД может как угодно меняться (от нуля до миллионов). Количество полей, их имена и типы тоже можно изменить, но это уже особая операция, которая называется изменением макета таблицы.

В структуре записи указываются поля, значения которых являются первичным ключом, кото­рые идентифицируют экземпляр записи.Первичный ключ – это поле или минимальный набор полей, однозначно определяющих каждую строку таблицы. Первичные ключи используются в целях: идентификации строк в таблице; ускорения работы со строками таблицы; связывания таблиц. Примером такого простого ключа (см. табл. 3.1) является поле Код, значение которого однозначно определяет один объект таблицы – одного учащегося, так как в таблице нет двух уча­щихся с одинаковым кодом.

4. Каждое поле может входить в несколько таблиц. Например, код учащегося может входить в табл. 3.2, которая хранит информацию об адресах и оценках.

Таблица 3.2

Связанная таблица. Связь «один-к-одному»

Код Адрес Телефон Word Excel Access
Центральная 11-5 51-17-22
Солнечная 8-117 51-18-22
Сиреневый 7-16 51-19-22
Центральная 14-81 51-20-22
Сиреневый 7-16 51-21-22
Солнечная 2-121 51-22-22
Школьная 5-34 51-23-22
Центральная 30-7 51-24-22

В табл. 3.1 и 3.2 поле Код однозначно определяет запись. Поле Код является первичным ключом для этих таблиц. Каждая запись в табл. 3.1 и табл. 3.2 связаны между собой полем Код. Такая связь называется «один-к-одному».

Может существовать связь другого рода.

В табл. 3.3 первичным ключом является поле Школа. Это поле идентифицирует запись в таблице и не может повторяться. В табл. 3.1 номер школы может повторяться многократно.
Табл. 3.1 и 3.3 также связаны между собой и такая связь называется «один-ко-многим».

Таблица 3.3

Связанная таблица. Связь «один-к-многим»

Школа Директор
Верзаков С.А.
Белоусов А.И.
Масалова В.А.
Новикова Е.В.
Зачесова Т.П.

Ключи обычно используют для исключения дублирования значений в ключевых полях (атри­бутах), упорядочения записей. ускорения работы с записями, организации связывания таблиц.

Если первичный ключ состоит из одного поля, он называется простым, если из нескольких полей – составным ключом. Вторичный ключ – это такое поле, значение которого может повто­ряться в нескольких записях, т.е. он не является уникальным. Если по значению первичного ключа может быть найден один-единственный экземпляр записи, то по вторичному ключу – несколько записей.

Достоинства реляционной модели:

ü Простота и доступность для понимания конечным пользователем. Единственной информа­ционной конструкцией является таблица.

ü При проектировании реляционных БД применяются строгие правила, базирующиеся на математическом аппарате.

ü Полная независимость данных. При изменении структуры реляционной БД изменения, которые требуется произвести в прикладных программах, минимальны.

ü Для построения запросов и написания прикладных программ нет необходимости знания конкретной организации БД во внешней памяти.

Недостатки реляционной модели:

ü По сравнению с другими моделями реляционная модель имеет более низкую скорость доступа и требует большего объема внешней памяти.

ü Появление большого количества таблиц в результате логического проектирования затруд­няет понимание структуры данных.

ü Далеко не всегда предметную область можно представить в виде совокупности таблиц.

Для преодоления недостатков, присущих реляционной модели, в настоящее время разви­ваются постреляционная, многомерная и объектно-ориентированная модели. Эти модели в той или иной степени опираются на реляционную модель. Но реляционная модель и коммерческие продукты, основанные на этой модели, доминируют при построении экономических ИС.


1752797028892229.html
1752812169368876.html
    PR.RU™