Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский политехнический университет Петра Великого (бывш. СПбГПУ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

TA1_2.DOC

Скачиваний:

Добавлен:

02.11.2018

Размер:

444.42 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 1716 17 > Следующая >>>

Определение.

Функция f называется функцией отказов и задается следующим образом:

Т.е. f( j ) равна максимальному s, такому, для которого x₁…x_s – суффикс цепочки x₁…x_j,

Пример.

Пусть y = aabbaab. Функция f принимает значения :

Например, f(6) = 2, так как aa  самый длинный собственный префикс цепочки aabbaa, который является ее суффиксом.

Алгоритм 6.1a.

Вход. Слово x длины n, цепочка str длины m.

Выход. Значение переменной FOUND = True, если слово x содержится в строке str,

FOUND = False в противном случае.

Для вычисления функции отказов используется алгоритм 6.1б.

FOUND = False;

r = 1;

k = 0;

while (!Found && r  m - n)

begin

while (x [ k+1] == str [ k + r ] && k < n) k++;

if ( k == n ) FOUND = True;

else

if ( k == 0) r++;

else

begin

r += k ;

k = f (k - 1);

end;

Сложность алгоритма O(m+n). Так как движение по строке только вперед.

Алгоритм 6.1б. Вычисление функции отказов.

Вход. Цепочка-образ x = x₁ … x_n, n  1.

Выход. Функция отказов f для x.

begin

f(1) = 0;

for j = 2 to n

begin

i = f(j – 1);

while (x[ i ]  x[ i+1] && i > 0) do i = f (i);

if (x[i]  x[i+1] && i==0) then f(j) = 0;

else f(j) = i+1;

end;

end

Теорема 6.2.

Алгоритм 6.1.Б вычисляет f за o(n) шагов.
Алгоритм 6.1.а работает за O(n + m) шагов.



1. Строки алгоритма “i = f(j–1);” и “ if (x[i]x[i+1]&& i==0) then f(j) = 0;” имеют фиксированную сложность. Сложность while-оператора пропорциональна числу уменьшений значения i оператором i = f (i). Единственный способ увеличить i  это присвоить f(j) = i+1, затем увеличить j на единицу в цикле и положить i = f(j – 1). Так как вначале i = 0, а строка ” else f(j) = i+1; ” выполняется не более n-1 раз, то while-оператор не может выполняться более n раз. Поэтому строка “ while (x[ i ]  x[ i+1] && i > 0) do i = f (i);” требует O(n) времени. Остальная часть алгоритма имеет сложность O(n), и поэтому весь алгоритм тратит O(n) времени.

2. С помощью аналогичных рассуждений можно доказать, что при обработке входной цепочки str срока “ while (x [k+1] == str [k+r]&& k < n) k++;” алгоритма 6.1.а выполнится не более 2m раз. Поэтому можно узнать, является ли x подцепочкой str, проследив изменение переменной k. Для этого надо лишь знать значения функции отказов на x. По пункту 1 значения функции f можно найти за время O(n). Следовательно, узнать, является ли x подцепочкой цепочки str, можно за время O(n + m), не зависящее от размера алфавита.



Теорема 6.3.

Пусть необходимо распознать вхождение сразу k цепочек x₁,…,x_k.

Алгоритмом 6.1. вычисляет f за O( (n_k+m))   + km.

6.1. Текстовая компрессия.

Алгоритмы:

RLE.
Huffman.
Арифметический.
Дельта-кодирование (DPCM/ADRM).
LZ.
LZW.
(LZ/LZW+2) / 3.

Алгоритм LZ и LZW

Алгоритм данного класса заменяет последовательность символов из кодируемого потока данных на адрес соответствующей строки в словаре.

Чтобы избежать дополнительного прохода по кодируемому файлу для составления словаря и не передавать отдельно словарь, эти алгоритмы динамически формируют словарь из уже обработанного текста.

Алгоритм LZW в процессе упаковки создает словарь, в котором вместе с каждой строкой хранятся и все ее префиксы. При упаковке из текста выбирается самая длинная строка, встречающаяся в словаре, и заменяется своим номером.

Схема LZW

а) Кодирование

Инициализация словаря

Установка текущей позиции в начале текста.

Пока весь текст не записан, выделить наиболее длинную, начинающуюся с

текущей позиции, подстроку S, для которой есть соответствие в словаре.

Записать в архив номер позиции P найденной в словаре подстроки.

Посмотреть следующий за подстрокой в тексте символ k, занести в словарь

подстроку sk . Продвинуть текущую позицию, чтобы она указывала на символ k.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1516 / 1716 17 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
18.09.201946.78 Кб2Svyazi_s_obshestvennostyu_kak_otrasl_znania (1)...docx
#
16.04.201552.22 Кб37Syntactic_Stylistic_Devices.doc
#
29.10.2018102.91 Кб6system1.doc
#
16.04.2015845.82 Кб167T2-3_Lekcija_-_ESEH_RF.doc
#
16.04.2015258.53 Кб37T2-4_Lekcija_-_Osnovy_postroenija_TfOP.docx
#
02.11.2018444.42 Кб9TA1_2.DOC
#
10.09.201975.26 Кб5Taxatsia_kursovoy.doc
#
16.04.2015345.18 Кб7Tema_1_1.pdf
#
24.09.201933.2 Кб3Temy_po_anglyskomu_9_klass_1.docx
#
16.04.2015648.35 Кб13Teormekh_glava1 (1).docx
#
16.04.2015642.36 Кб17Teormekh_glava1_1.docx

Определение.

Алгоритм 6.1a.

Алгоритм 6.1б. Вычисление функции отказов.

Теорема 6.2.

Алгоритм 6.1.Б вычисляет f за o(n) шагов.