Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по информатике.doc
Скачиваний:
61
Добавлен:
23.09.2019
Размер:
3.2 Mб
Скачать

3.7.7. Простой отчет.

Наконец, последний вид отчетов, создаваемых с помощью Мастера, – это простой отчет. Если требуется быстро сформировать отчет в один столбец, в котором будут представлены все поля записи данных конкретной таблицы или запроса, следует выбрать этот вид отчета.

Создать простой отчет можно с помощью единственного щелчка мышью на кнопке инструмента ПРОСТОЙ ОТЧЕТ. Эта кнопка располагается на панели инструментов базы данных или открытой таблицы и запроса. При этом таблица или запрос не обязательно должны быть открыты. Достаточно выделить нужную таблицу или запрос на вкладке таблиц или запросов окна базы данных и нажать соответствующую кнопку.

Access автоматически сформирует простой отчет на основе открытой или выделенной таблицы или запроса, не задавая вопросов. Впоследствии можно, если нужно, отредактировать отчет. Для этого надо будет открыть отчет в режиме конструирования и внести изменения в его макет.

Особенности работы с текстовыми базами данных.

Текстовыми базами данных называются базы данных, объектами хранения в которых являются тексты. Под текстом понимаются неструктури­рованные данные, построенные из строк.

Проблемно ориентированные текстовые БД используются в разных областях медицины, юриспруденции, научно-технической информации, делопроизводства и др. Они хранят и обрабатывают огромные массивы постоянно увеличивающейся текстовой информации.

Системы обработки текстовой информации отличаются от систем обработки структурированных данных, имеющих фиксированный формат записи, в первую очередь типами хранимых данных.

Текстовые БД могут содержать различные тексты и документы, например тексты законов, библиографические описания, книги, рефераты, статьи и др.

Пакеты прикладных программ, предназначенные для ввода, обработки, поиска и обновления текстов, называют информационно-поисковой системой (ИПС).

В отличие от систем обработки структурированных данных ИПС, предназначенные для работы с текстом, имеют более гибкую стратегию поиска, т.е. поиск может проводиться по тексту либо по заданному описанию интересующей нас темы, а найденные документы должны частично либо полностью соответствовать сформулированному запросу. При поиске же структурированной информации, осуществляемом СУБД, запрос, принимаемый к исполнению, может быть сформулирован только в терминах определенного формального языка, а данные, выдаваемые на запрос при структурированном поиске, полностью соответствуют сформулированному запросу.

Перечень задач концептуального проектирования текстовой БД:

1. Анализ информационных интересов пользователей к данной предметной области.

2. Определение источников формирования БД.

3. Выбор архитектуры БД.

4. Разработка языка описания документов.

К анализу информационных интересов пользователей относится изучение информационных потребностей, информационных запросов, собственно потребителей информации. При анализе информационных интересов используются следующие методы:

– Социологические. Основываются на анкетировании и интервьюи­ровании.

– Наукометрические. Основываются на анализе информационных потоков, которые представляют собой формальные каналы научных коммуникаций: отчеты по НИР, журналы, книги, каталоги, реферативные журналы и обзоры, связь с автоматизированными информационными системами и т.д.

– Математико-статистические. К этим методам относятся методы ранговых распределений, методы построения выборочных совокупнос­тей, корреляционный анализ, факторный анализ.

Все методы могут быть взаимосвязаны в единую методику, создание которой определяется предметной областью и интеллектом проектировщика. В конечном итоге вырабатывается механизм тематического распределения информации.

На основе анализа запросов и анализа информационных потоков принимается решение об источниках формирования БД, при этом рассматриваются следующие варианты:

1. Проектирование политематической текстовой БД из имеющихся БД.

2. Проектирование текстовой БД из первичных документов.

Архитектура БД выбирается исходя из интересов пользователей, вида документа, объема памяти ЭВМ.

Язык описания документа выбирается исходя из удобства интерфейса пользователя и приемлемой стоимости поиска.

На примере информационной системы «Кодекс» рассмотрим устройство и особенности работы с текстовыми базами данных.

База данных системы «Кодекс» представляет собой электронную юридическую библиотеку, содержащую полные тексты законодательных и нормативных актов Российской Федерации, документов региональных органов государственной власти, международных соглашений и других правовых и информационных материалов.

Структура базы данных.

На физическом уровне база данных “Кодекс” представляет собой совокупность томов, подключенных к программному комплексу для работы. Том - это специальный файл, который содержит в себе объекты текстовой базы данных (разделы, документы, ссылки, элементы классификаторов, комментарии и т.п.). Каждый том базы данных характеризуется набором атрибутов, среди которых: наименование тома, номер обновления, описание структуры и др.

На логическом уровне (с точки зрения представления пользователя) базу данных “Кодекс” можно рассматривать как совокупность информационных (тематических) разделов.

Разделы могут иметь различную структуру данных, но все они логически связаны между собой, что позволяет говорить о едином информационном пространстве при работе с базой данных. Это выражается в наличии сквозного поиска по всем разделам и возможности быстрого перехода из раздела в раздел по гипертекстовым ссылкам.

В каждом тематическом разделе можно выделить две информационных области: область тематического справочника и область текстовых объектов.

Особой частью базы данных является область папок пользователя, В папках содержатся необходимые выборки материалов (документов, тематик, справок, консультаций и т.п.) и закладки в текстах материалов базы данных.

Поиск информации в базе данных.

Информационная система “Кодекс” содержит многообразные возможности поиска. К любой информации, находящейся в базе данных, существует несколько способов доступа. В зависимости от ситуации и от стоящей проблемы можно выбрать наиболее оптимальный путь поиска.

Рассмотрим более подробно некоторые возможности поиска.

Тематический (проблемный) поиск.

Тематический поиск рекомендуется в следующих случаях:

– пользователю необходимо получить список документов определенной тематической направленности;

– пользователь нечетко представляет проблему или ее границы и нужно полистать и просмотреть наименования тематических рубрик, а потом выбрать соответствующий список документов;

– пользователю необходимо просмотреть тематический комментарий по какой-либо теме.

Работа с тематическими комментариями очень проста: пользователь, передвигаясь по наименованиям тематических рубрик и, выбрав нужную, раскрывает её, просматривая дальше подразделы (подрубрики) выбранной тематики и т.д.

Перед началом тематического поиска следует выбрать группу разделов базы данных, в которых будет производиться поиск, загрузить страничку (информационное окно с перечнем разделов) данной группы и войти в какой-либо раздел.

В зависимости от состава базы данных, установленной на компьютере, меню Поиск будет содержать соответствующие команды выбора групп разделов (например, ЗАКОНОДАТЕЛЬСТВО, ПОМОЩНИК БУХГАЛТЕРА, КОНСУЛЬТА­ЦИИ..., СЛОВАРИ).

Приблизительный контекстный поиск.

Приблизительный контекстный поиск может быть рекомендован в следующих случаях:

– пользователь затрудняется точно сформулировать запрос;

– пользователь неточно помнит термины, которыми характеризуется интересующая его проблема;

– пользователь хочет получить в результате поиска максимум документов (материалов), пусть даже отдаленно относящихся к интересующей его проблеме.

По результатам поиска система выстраивает найденные документы по степени их близости к контексту заданного запроса.

Каждому документу присваивается “вес”. Документы с наибольшим “весом” имеют большую вероятность содержать полезную информацию и будут располагаться вверху списка. По мере движения вниз “вес” документов и соответственно вероятность содержания полезной информации – убывает. Работая со списком документов, полученных по результатам приблизительного поиска, надо отдавать отчет в том, что список не является абсолютно правильным: среди важных документов в нем будут представлены несущественные и случайные документы. Но даже несущественный документ может вывести на основные (главные) документы, соответствующие запросу (например, при переходе по гипертекстовой ссылке).

Особенности формирования запросов при приблизительном контекстном поиске. Запрос должен быть направлен на смысловое содержание документа, а не содержать вопрос о самом документе. Например, запрос «документы, принятые налоговой инспекцией по Москве» составлен неверно. Пример правильного запроса «льготы по налогу на прибыль для малых предприятий»

Составляя и вводя поисковую фразу (запрос), не надо задумываться о том, является ли какое-либо слово в данной фразе “шумовым” Шумовые слова - это часто встречающиеся, неинформативные слова (предлоги, местоимения, частицы, наиболее часто употребляемые сокращения). В целях уменьшения объема базы данных они не включаются в индексы, и контекстный поиск по ним невозможен. Система автоматически отбросит шумовые слова и те, которые не встречаются в базе данных. В запросе можно не использовать знаки препинания. Например, если пользователя интересует вопрос: “Как определяется выслуга лет для офицеров Вооруженных сил, увольняющихся в запас”, следует ввести в строке запроса поисковую фразу “выслуга лет офицеров Вооруженных сил увольняющихся в запас”.

Контекстный поиск.

Контекстный поиск - поиск по текстам документов (комментариев). Производится при выборе условия поиска «Поиск по тексту». Это самый мощный поиск в системе.

При вводе поисковой фразы система дает предупреждение о «шумовых словах», используемых в запросе. Такие слова выделяются цветом, появляется предупреждающее сообщение, и при поиске они будут отброшены. Кроме этого при вводе запроса автоматически подключается словарь (тезаурус) словоформ, что, с одной стороны, позволяет упростить процесс составления (ввода) поисковой фразы (пользователь выбирает предлагаемые системой слова, заведомо содержащиеся в базе данных), а с другой стороны, система сразу выделит во введенной поисковой фразе слова, которых нет в текстах базы данных.

Алгоритм контекстного поиска следующий:

– в слове (словах поисковой цепочки) выделяется основа (в каждом слове отбрасываются окончания);

– порядок слов в поисковой фразе не важен, слова фразы объединяются по принципу логического “И”;

– система воспринимает группу слов, заключенных в кавычки, как задание найти тексты, в которых искомые слова находятся рядом (составляют фразу);

    • в поисковой фразе не пропускаются “шумовые слова”. В поисковой фразе контекстного поиска возможно использование чисел и буквенно-цифровых последовательностей (номера документов, химические формулы и т.п.). Допустимыми символами для таких последователь­ностей являются буквы русского и латинского языка, дефис, наклонная и обратная черта (“\” и “/”).