Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Python_самоучитель.pdf
Скачиваний:
1296
Добавлен:
29.03.2015
Размер:
835.6 Кб
Скачать

Ревизия: 226 Глава 7. Строки

§7.6. Строки нельзя изменить

Для изменения символа в строке логично было бы использовать оператор индексирования ([]) слева от знака присваивания. Например:

greeting = "Hello, world!"

 

greeting[0] = 'J'

# ERROR!

print greeting

 

Но вместо ожидаемого вывода Jello, world!, этот код генерирует исключение:

TypeError: object doesn't support item assignment.

Это означает, что строки в Питоне не могут быть изменены частично – строковый тип эту операцию не предусматривает. Лучшее, что можно сделать – это создать новую строку, которая является измененным оригиналом:

greeting = "Hello, world!" newGreeting = 'J' + greeting[1:] print newGreeting

Данное решение состоит в том, что бы сцепить новый символ со срезом строки greeting. Этот оператор не оказывает эффекта на начальную строку.

Упражнение. Напишите программу, заменяющую 5-й (если начинать считать почеловечески, т.е. с единицы) символ строки Hello, world! на восклицательный знак.

§7.7. Функция find

Рассмотрим такую функцию: def find(str, ch): index = 0

while index < len(str): if str[index] == ch:

return index index = index + 1

return -1

Что она делает? В некоторым смысле функция find() противоположна оператору индексирования []. Отличие состоит в том, что вместо того, чтобы извлекать из строки символ по его индексу, она возвращает индекс первого вхождения символа в строке. Если символ не найден, то функция возвращает -1.

Это первый пример использования инструкции return внутри цикла. Если условие str[index] == ch, то функция возвращает значение немедленно, прерывая цикл преждевременно.

Если символ не появился в строке, то программа выходит из цикла «в штатном режиме» и возвращает -1.

Упражнение. Измените код функции find() так, чтобы требовался третий параметр – индекс в строке, начиная с которого должен производиться поиск. Не

77

Ревизия: 226

Глава 7. Строки

 

 

 

забудьте про обработку ситуаций с некорректными и предельными значениями этого параметра (например, когда указанный индекс выходит за диапазон допустимых значений).

§7.8. Циклы и счётчики

Следующая программа считает количество символов, встречающихся в строке: fruit = "banana"

count = 0

for char in fruit: if char == 'a':

count = count + 1 print count

Программа демонстрирует интересный пример использования циклов. Переменная count инициализируется со значением 0 и затем инкрементируется16 каждый раз когда символ a найден. Когда происходит выход из цикла, переменная count содержит результат – количество символов a. Переменные, в которых сохраняется количество элементов в процессе их перебора, удовлетворяющих некоторому условию, называют счетчиками.

Упражнение. Создайте на основе кода примера функцию countLetters и обобщите ее так, чтобы она принимала строку и искомый символ в качестве параметров.

Упражнение. Перепишите эту функцию так, чтобы вместо просмотра строки использовать версию функции find с тремя параметрами, которую вы написали

выполняя упражнение из предыдущего параграфа.

§7.9. Модуль string

Модуль string содержит полезные функции, заметно упрощающие работу со строками. Как обычно, необходимо сначала импортировать модуль до его использования:

>>> import string

Модуль string включает функцию find(), которая делает то же самое, что и функция, написанная нами. Это распространенная ситуация в области программирования: прежде чем «изобретать велосипед», иногда стоит поискать готовые решения – всегда есть вероятность, что кто-то уже сталкивался с похожей задачей и решил ее лучше нас. К тому же разбираясь в чужом коде можно многому научиться.

Итак, для вызова функции из модуля, мы должны указать имя модуля и имя функции, используя точку в качестве разделителя:

>>>fruit = "banana"

>>>index = string.find(fruit, "a")

16Инкрементировать – увеличивать значение чего-либо на единицу; декрементировать – уменьшать значение на единицу.

78

Ревизия: 226

Глава 7. Строки

 

 

 

>>> print index 1

Такой способ вызова помогает избежать конфликтов (и семантических ошибок, которые могут стать их следствием) между именами встроенных или написанных нами функций и именами функций, импортированных из модулей. Используя точку в качестве разделителя, мы можем указать какую версию find() хотим использовать.

В подтверждение мысли об «изобретении велосипеда», стоит заметить, что функция string.find() является более общим решением, чем наш вариант. Во-первых, может

искать подстроки, не только символы:

>>> string.find("banana", "na") 2

Также имеется возможность задать дополнительный аргумент, который будет определять индекс с которого надо начинать:

>>> string.find("banana", "na", 3) 4

Или может потребоваться пара дополнительных аргументов, которые определяют диапазон индексов:

>>> string.find("bob", "b", 1, 2) -1

В последнем примере, поиск оказался неудачным, потому что символ b не входит в диапазон индексов от 1 до 2 (не включая 2).

Упражнение. Выведите на экран справку по модулю string и ознакомьтесь со справочной информацией следующих функций:

1.capitalize()

2.capwords()

3.count()

4.find()

5.lower()

6.replace()

7.upper() Поэкспериментируйте с ними.

§7.10. Классификация символов

Иногда возникает потребность проверить регистр символа или выяснить не является ли он цифрой. Модуль string предоставляет несколько специальных предопределенных

переменных, которые могут быть полезны для этих целей.

Строка string.lowercase содержит все строчные символы. Аналогично в переменной string.uppercase хранятся все заглавные буквы. Попробуйте следущие примеры и посмотрите, какой результат выдаст интерпретатор:

>>>print string.lowercase

>>>print string.uppercase

79

Ревизия: 226

Глава 7. Строки

 

 

 

>>> print string.digits

Мы можем использовать эти переменные и функцию find() для классифицирования символов. Например, если find(lowercase, ch) возвращает результат, отличный от -1, то символ ch должен быть строчным.

def isLower(ch):

return string.find(string.lowercase, ch) != -1

Так же мы можем использовать оператор in, котрый определяет, входит ли символ в строку или нет:

def isLower(ch):

return ch in string.lowercase

Альтернативой этому является оператор сравнения следующего вида: def isLower(ch):

return 'a' <= ch <= 'z'

Если ch между a и z, то это строчной символ.

Упражнение. Какая версия isLower() будет самой быстрой? Какие еще причины, помимо скорости, Вы можете привести для предпочтения одного другому?

Другая переменная, предопределенная в модуле string, содержит все пробельные (непечатаемые) символы, включая пробел, табуляцию ("\t") и символы возврата каретки ("\r") и новой строки ("\n") :

>>> print string.whitespace

Как мы заметили в §6.6, пробельные символы перемещают курсор без печати чеголибо: они создают пустое пространство между видимыми символами.

§7.11. Строки unicode

80

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]