Строковые методы

Введение

Примеры

  • 21

    Изменение заглавной буквы строки

    Тип строки Python предоставляет множество функций, которые влияют на использование заглавных букв в строке. Они включают :

    • str.casefold
    • str.upper
    • str.lower
    • str.capitalize
    • str.title
    • str.swapcase

    С юникод строк (по умолчанию в Python 3), эти операции не являются 1: 1 отображения или обратимым. Большинство из этих операций предназначены для отображения, а не нормализации.


    str.casefold()

    str.casefold создает строчную строку, которая подходит для случая нечувствительных сравнений. Это более агрессивный , чем str.lower и может изменить строки, которые уже находятся в нижнем регистре или вызывают строки , чтобы расти в длину, и не предназначена для отображения.

     "XßΣ".casefold()
    # 'xssσ'
    
    "XßΣ".lower()
    # 'xßς'
    
     

    Преобразования, которые происходят в рамках casefolding, определяются Консорциумом Unicode в файле CaseFolding.txt на их веб-сайте.


    str.upper()

    str.upper принимает каждый символ в строке и преобразует его в верхнем регистре эквивалента, например:

     "This is a 'string'.".upper()
    # "THIS IS A 'STRING'."
    
     

    str.lower()

    str.lower делает обратное; он берет каждый символ в строке и преобразует его в строчный эквивалент:

     "This IS a 'string'.".lower()
    # "this is a 'string'."
    
     

    str.capitalize()

    str.capitalize возвращает заглавную версию строки, то есть, он делает первый символ имеет верхний регистр , а остальные нижние:

     "this Is A 'String'.".capitalize() # Capitalizes the first character and lowercases all others
    # "This is a 'string'."
    
     

    str.title()

    str.title возвращает название обсаженной версии строки, то есть, каждая буква в начале слова производится в верхнем регистре , а все остальные сделаны в нижнем регистре:

     "this Is a 'String'".title()
    # "This Is A 'String'"
    
     

    str.swapcase()

    str.swapcase возвращает новый объект строки , в которой все строчные символы поменяны местами в верхний регистр и все символы верхнего регистра в нижний:

     "this iS A STRiNG".swapcase() #Swaps case of each character
    # "THIS Is a strIng"
    
     

    Использование в качестве str методов класса

    Следует отметить , что эти методы могут быть названы либо на струнных объектов (как показано выше) или как метод класса от str класса (с явным вызовом str.upper и т.д.)

     str.upper("This is a 'string'")
    # "THIS IS A 'STRING'"
    
     

    Это особенно полезно при применении одного из этих методов для многих строк сразу, скажем, на map функции.

     map(str.upper,["These","are","some","'strings'"])
    # ['THESE', 'ARE', 'SOME', "'STRINGS'"]
    
     
  • 5

    Разбить строку на основе разделителя на список строк

    str.split(sep=None, maxsplit=-1)

    str.split принимает строку и возвращает список подстрок исходной строки. Поведение отличается в зависимости от того sep предусмотрен или опущен аргумент.

    Если sep не предусмотрен, или нет None , то происходит расщепление везде , где есть пробела. Однако начальные и конечные пробелы игнорируются, и несколько последовательных пробельных символов обрабатываются так же, как один пробельный символ:

     >>> "This is a sentence.".split()
    ['This', 'is', 'a', 'sentence.']
    
    >>> " This is    a sentence.  ".split()
    ['This', 'is', 'a', 'sentence.']
    
    >>> "            ".split()
    []
    
     

    sep параметр может быть использован для определения строки разделителей. Исходная строка разделяется там, где встречается строка-разделитель, а сам разделитель отбрасывается. Несколько последовательных разделители не обрабатываются так же , как однократный, а вызвать пустые строки , которые будут созданы.

     >>> "This is a sentence.".split(' ')
    ['This', 'is', 'a', 'sentence.']
    
    >>> "Earth,Stars,Sun,Moon".split(',')
    ['Earth', 'Stars', 'Sun', 'Moon']
    
    >>> " This is    a sentence.  ".split(' ')
    ['', 'This', 'is', '', '', '', 'a', 'sentence.', '', '']
    
    >>> "This is a sentence.".split('e')
    ['This is a s', 'nt', 'nc', '.']
    
    >>> "This is a sentence.".split('en')
    ['This is a s', 't', 'ce.']
    
     

    По умолчанию заключается в разделении на каждом появлении разделителя, однако maxsplit параметр ограничивает количество расщеплений , которые происходят. Значение по умолчанию -1 означает , что нет предела:

     >>> "This is a sentence.".split('e', maxsplit=0)
    ['This is a sentence.']
    
    >>> "This is a sentence.".split('e', maxsplit=1)
    ['This is a s', 'ntence.']
    
    >>> "This is a sentence.".split('e', maxsplit=2)
    ['This is a s', 'nt', 'nce.']
    
    >>> "This is a sentence.".split('e', maxsplit=-1)
    ['This is a s', 'nt', 'nc', '.']
    
     

    str.rsplit(sep=None, maxsplit=-1)

    str.rsplit ( «правый раскол») отличается от str.split ( «левый сплит») , когда maxsplit указано. Расщепление начинается в конце строки, а не в начале:

     >>> "This is a sentence.".rsplit('e', maxsplit=1)
    ['This is a sentenc', '.']
    
    >>> "This is a sentence.".rsplit('e', maxsplit=2)
    ['This is a sent', 'nc', '.']
    
     

    Примечание: Python определяет максимальное число разделений , выполняемых, в то время как большинство других языков программирования указать максимальное количество подстрок созданных. Это может создать путаницу при переносе или сравнении кода.

  • 5

    Заменить все вхождения одной подстроки другой подстрокой

    Пайтона str типа также есть метод для замены вхождений одной подстроки с другой подстроки в заданной строке. Для более сложных случаев можно использовать re.sub .


    str.replace(old, new[, count]) :

    str.replace принимает два аргумента , old и new , содержащий old подстроку , которая должна быть заменена на new подстроку. Необязательный аргумент count определяет число замен , чтобы быть:

    Например, для того , чтобы заменить 'foo' с 'spam' в следующей строке, мы можем назвать str.replace с old = 'foo' и new = 'spam' :

     >>> "Make sure to foo your sentence.".replace('foo', 'spam')
    "Make sure to spam your sentence."
    
     

    Если данная строка содержит несколько примеров , которые соответствуют old аргументу, все вхождения заменяются значением подаваемого в new :

     >>> "It can foo multiple examples of foo if you want.".replace('foo', 'spam')
    "It can spam multiple examples of spam if you want."
    
     

    если, конечно, мы не поставляем значение для count . В этом случае count вхождения собираются заменяются:

     >>> """It can foo multiple examples of foo if you want, \
    ... or you can limit the foo with the third argument.""".replace('foo', 'spam', 1)
    'It can spam multiple examples of foo if you want, or you can limit the foo with the third argument.'
    
    
    
     
  • 9

    str.format и f-strings: форматировать значения в строку

    Python обеспечивает интерполяцию строки и функциональность форматирования через str.format функции, введенной в версии 2.6 и F-строк , введенных в версии 3.6.

    Даны следующие переменные:

     i = 10
    f = 1.5
    s = "foo"
    l = ['a', 1, 2]
    d = {'a': 1, 2: 'foo'}
    
     

    Следующие утверждения все эквивалентны

     "10 1.5 foo ['a', 1, 2] {'a': 1, 2: 'foo'}"
     

     >>> "{} {} {} {} {}".format(i, f, s, l, d)
    
    >>> str.format("{} {} {} {} {}", i, f, s, l, d)
    
    >>> "{0} {1} {2} {3} {4}".format(i, f, s, l, d)
    
    >>> "{0:d} {1:0.1f} {2} {3!r} {4!r}".format(i, f, s, l, d)
    
    >>> "{i:d} {f:0.1f} {s} {l!r} {d!r}".format(i=i, f=f, s=s, l=l, d=d)
     

     >>> f"{i} {f} {s} {l} {d}"
    
    >>> f"{i:d} {f:0.1f} {s} {l!r} {d!r}"
    
     

    Для справки, Python также поддерживает классификаторы в стиле C для форматирования строк. Примеры , приведенные ниже, эквивалентны тем , которые выше, но str.format вариантов являются предпочтительными из - за преимущества в гибкости, последовательности обозначений и расширяемости:

     "%d %0.1f %s %r %r" % (i, f, s, l, d)
    
    "%(i)d %(f)0.1f %(s)s %(l)r %(d)r" % dict(i=i, f=f, s=s, l=l, d=d)
    
     

    Скобки используются для интерполяции в str.format также может быть пронумерована для уменьшения дублирования при форматировании строк. Например, следующее эквивалентно:

     "I am from Australia. I love cupcakes from Australia!"
     

     >>> "I am from {}. I love cupcakes from {}!".format("Australia", "Australia")
    
    >>> "I am from {0}. I love cupcakes from {0}!".format("Australia")
    
     

    В то время как официальная документация питона, как обычно, достаточно тщательно, pyformat.info имеет большой набор примеров с подробными объяснениями.

    Кроме того, { и } символы могут быть экранированы с помощью двойных скобок:

     "{'a': 5, 'b': 6}"
     

     >>> "{{'{}': {}, '{}': {}}}".format("a", 5, "b", 6)
    
    >>> f"{{'{'a'}': {5}, '{'b'}': {6}}"
    
     

    См Строка форматирования для получения дополнительной информации. str.format() был предложен в PEP 3101 и F-строк в PEP 498 .

  • 3

    Подсчет количества появлений подстроки в строке

    Один метод доступен для подсчета количества вхождений подстроки в другой строки, str.count .


    str.count(sub[, start[, end]])

    str.count возвращает int , указывающее количество неперекрывающихся вхождений подстрок sub в другой строке. Необязательные аргументы start и end указывают на начало и конец , в котором поиск будет происходить. По умолчанию start = 0 и end = len(str) означает всю строку будет искать:

     >>> s = "She sells seashells by the seashore."
    >>> s.count("sh")
    2
    >>> s.count("se")
    3
    >>> s.count("sea")
    2
    >>> s.count("seashells")
    1
    
     

    Задавая различные значения для start , end , мы можем получить более локализованный поиск и сосчитать, например, если start равно 13 призыва к:

     >>> s.count("sea", start)
    1
    
     

    эквивалентно:

     >>> t = s[start:]
    >>> t.count("sea")
    1 
  • 2

    Проверьте начальный и конечный символы строки

    Для того , чтобы проверить начало и окончание данной строки в Python, можно использовать методы str.startswith() и str.endswith() .


    str.startswith(prefix[, start[, end]])

    Как следует это имя, str.startswith используется для проверки , начинается ли заданная строка с заданными символами в prefix .

     >>> s = "This is a test string"
    >>> s.startswith("T")
    True
    >>> s.startswith("Thi")
    True
    >>> s.startswith("thi")  
    False
    
     

    Необязательные аргументы start и end указать начальную и конечную точки , из которых тестирование будет начать и закончить. В следующем примере, указав начальное значение 2 наша строка будет просматриваться с позиции 2 , а затем:

     >>> s.startswith("is", 2)
    True
    
     

    Это дает True , так как s[2] == 'i' и s[3] == 's' .

    Вы можете также использовать tuple , чтобы проверить , если он начинается с какой - либо из набора строк

     >>> s.startswith(('This', 'That'))
    True
    >>> s.startswith(('ab', 'bc'))
    False
    
     

    str.endswith(prefix[, start[, end]])

    str.endswith точно похож на str.startswith с той лишь разницей, что он ищет окончание символов и не начиная символов. Например, чтобы проверить, заканчивается ли строка полной остановкой, можно написать:

     >>> s = "this ends in a full stop."
    >>> s.endswith('.')
    True
    >>> s.endswith('!')
    False
    
     

    как и с startswith более одного символа может использоваться как окончание последовательности:

     >>> s.endswith('stop.')
    True
    >>> s.endswith('Stop.')
    False
    
     

    Вы можете также использовать tuple , чтобы проверить , если он заканчивается любой из набора строк

     >>> s.endswith(('.', 'something'))
    True
    >>> s.endswith(('ab', 'bc'))
    False 
  • 5

    Проверка того, из чего состоит строка

    Пайтона str тип также имеет целый ряд методов , которые могут быть использованы для оценки содержимого строки. Это str.isalpha , str.isdigit , str.isalnum , str.isspace . Капитализация может быть проверена с str.isupper , str.islower и str.istitle .


    str.isalpha

    str.isalpha не принимает никаких аргументов и возвращает True , если все символы в данной строке являются буквенными, например:

     >>> "Hello World".isalpha()  # contains a space
    False
    >>> "Hello2World".isalpha()  # contains a number
    False
    >>> "HelloWorld!".isalpha()  # contains punctuation
    False
    >>> "HelloWorld".isalpha()
    True
    
     

    В краевой случае пустая строка вычисляет значение False при использовании "".isalpha() .


    str.isupper , str.islower , str.istitle

    Эти методы проверяют использование заглавных букв в заданной строке.

    str.isupper это метод , который возвращает True , если все символы в данной строке в верхнем регистре и False иначе.

     >>> "HeLLO WORLD".isupper()
    False
    >>> "HELLO WORLD".isupper()
    True
    >>> "".isupper()
    False
    
     

    С другой стороны , str.islower это метод , который возвращает True , если все символы в данной строке в нижнем регистре и False иначе.

     >>> "Hello world".islower()
    False
    >>> "hello world".islower()
    True
    >>> "".islower()
    False
    
     

    str.istitle возвращает True , если данная строка названия обсаженное; то есть каждое слово начинается с заглавной буквы, за которой следуют строчные буквы.

     >>> "hello world".istitle()
    False
    >>> "Hello world".istitle()
    False
    >>> "Hello World".istitle()
    True
    >>> "".istitle()
    False
    
     

    str.isdecimal , str.isdigit , str.isnumeric

    str.isdecimal возвращает строка , является ли последовательность десятичных цифр, пригодная для представления десятичного числа.

    str.isdigit включает в себя цифру не в форме , подходящей для представления десятичного числа, такие , как надстрочные цифры.

    str.isnumeric включает в себя любые числовые значения, даже если не цифры, такие как значения вне диапазона 0-9.

                 isdecimal    isdigit   isnumeric
    
    12345        True        True       True
    ១2߃໔5        True        True       True
    ①²³?₅       False       True       True
    ⑩⒓          False       False      True
    Five         False       False      False
    
     

    Байтовые строки ( bytes в Python 3, str в Python 2), поддерживает только isdigit , который проверяет только основные ASCII цифр.

    Как str.isalpha пустая строка вычисляет значение False .


    str.isalnum

    Это сочетание str.isalpha и str.isnumeric , в частности , он имеет значение True , если все символы в данной строке являются буквенно - цифровыми, то есть они состоят из буквенных или цифровых символов:

     >>> "Hello2World".isalnum()
    True
    >>> "HelloWorld".isalnum()
    True
    >>> "2016".isalnum()
    True
    >>> "Hello World".isalnum()  # contains whitespace
    False
    
     

    str.isspace

    Возвращает True , если строка содержит только пробельные символы.

     >>> "\t\r\n".isspace()
    True
    >>> " ".isspace()
    True
    
     

    Иногда строка выглядит «пустой», но мы не знаем, так ли это, потому что она содержит только пробелы или вообще не содержит символов

     >>> "".isspace()
    False
    
     

    Чтобы покрыть этот случай нам нужен дополнительный тест

     >>> my_str = ''
    >>> my_str.isspace()
    False
    >>> my_str.isspace() or not my_str
    True
    
     

    Но самый короткий путь , чтобы проверить , если строка пуста или содержит только пробельные символы, чтобы использовать strip (без аргументов она удаляет все начальные и конечные пробельные символы)

     >>> not my_str.strip()
    True
    
    
     
  • 14

    str.translate: перевод символов в строке

    Python поддерживает translate метод на str типа , который позволяет указать таблицу преобразования (используется для замены), а также любые символы , которые должны быть удалены в процессе.

     str.translate(table[, deletechars]) 
    параметр Описание
    table Это таблица поиска, которая определяет отображение от одного символа к другому.
    deletechars Список символов, которые должны быть удалены из строки.

    maketrans метод ( str.maketrans в Python 3 и string.maketrans в Python 2) позволяет создать таблицу перевода.

     >>> translation_table = str.maketrans("aeiou", "12345")
    >>> my_string = "This is a string!"
    >>> translated = my_string.translate(translation_table)
    'Th3s 3s 1 str3ng!'
    
     

    translate метод возвращает строку , которая является переведенной копией исходной строки.


    Вы можете установить table аргумент None , если требуется только для удаления символов.

     >>> 'this syntax is very useful'.translate(None, 'aeiou')
    'ths syntx s vry sfl' 
  • 5

    Удаление нежелательных начальных / конечных символов из строки

    Три метода при условии , что предлагают возможность раздеться начальные и конечные символы из строки: str.strip , str.rstrip и str.lstrip . Все три метода имеют одинаковую подпись, и все три возвращают новый строковый объект с удаленными нежелательными символами.


    str.strip([chars])

    str.strip действует на заданной строки и удаляет (полоски) или каких - либо ведущих задних символов , содержащихся в аргументе chars ; если chars не входит в комплект или нет None , все пробельные символы удаляются по умолчанию. Например:

     >>> "    a line with leading and trailing space     ".strip() 
    'a line with leading and trailing space'
    
     

    Если chars поставляются, все символы , содержащиеся в нем, удаляются из строки, которая возвращается. Например:

     >>> ">>> a Python prompt".strip('> ')  # strips '>' character and space character 
    'a Python prompt'
    
     

    str.rstrip([chars]) и str.lstrip([chars])

    Эти методы имеют ту же семантику и аргументы с str.strip() , их отличие заключается в том направлении , откуда они начинаются. str.rstrip() начинается с конца строки в то время как str.lstrip() расщепляется с начала строки.

    Например, при использовании str.rstrip :

     >>> "     spacious string      ".rstrip()
    '     spacious string'
    
     

    В то время как, используя str.lstrip :

     >>> "     spacious string      ".rstrip()
    'spacious string      ' 
  • 3

    Сравнение строк без учета регистра

    Сравнение строки без учета регистра кажется чем-то тривиальным, но это не так. В этом разделе рассматриваются только строки Unicode (по умолчанию в Python 3). Обратите внимание, что Python 2 может иметь незначительные недостатки по сравнению с Python 3 - более поздняя обработка юникода гораздо более полная.

    Первое, на что следует обратить внимание, это то, что преобразования с удалением регистра в юникоде не являются тривиальными. Существует текст , для которого text.lower() != text.upper().lower() , Например, "ß" :

     >>> "ß".lower()
    'ß'
    
    >>> "ß".upper().lower()
    'ss'
    
     

    Но предположим, что вы хотели регистронезависмо сравнивать "BUSSE" и "Buße" . Черт возьми, вы , вероятно , также хотят , чтобы сравнить "BUSSE" и "BUẞE" равный - это новая форма капитала. Рекомендуемый способ заключается в использовании casefold :

     >>> help(str.casefold)
    """
    Help on method_descriptor:
    
    casefold(...)
          S.casefold() -> str
    
         Return a version of S suitable for caseless comparisons.
    """
     

    Не просто использовать lower . Если casefold не доступен, делая .upper().lower() помогает (но только немного).

    Тогда вы должны рассмотреть акценты. Если визуализатор шрифт хорошо, вы , вероятно , думаете , "ê" == "ê" - но это не так :

     >>> "ê" == "ê"
    False
    
     

    Это потому что они на самом деле

     >>> import unicodedata
    
    >>> [unicodedata.name(char) for char in "ê"]
    ['LATIN SMALL LETTER E WITH CIRCUMFLEX']
    
    >>> [unicodedata.name(char) for char in "ê"]
    ['LATIN SMALL LETTER E', 'COMBINING CIRCUMFLEX ACCENT']
    
     

    Самый простой способ справиться с этим unicodedata.normalize . Вы , вероятно , хотите использовать NFKD нормализации, но не стесняйтесь проверить документацию. Тогда один

     >>> unicodedata.normalize("NFKD", "ê") == unicodedata.normalize("NFKD", "ê")
    True
    
     

    Чтобы закончить, здесь это выражается в функциях:

     import unicodedata
    
    def normalize_caseless(text):
        return unicodedata.normalize("NFKD", text.casefold())
    
    def caseless_equal(left, right):
        return normalize_caseless(left) == normalize_caseless(right) 
  • 4

    Объединить список строк в одну строку

    Строка может быть использована в качестве разделителя , чтобы присоединиться к списку строк вместе в одну строку с помощью join() метод. Например, вы можете создать строку, где каждый элемент в списке разделен пробелом.

     >>> " ".join(["once","upon","a","time"])
    "once upon a time"
    
     

    В следующем примере строковые элементы разделяются тремя дефисами.

     >>> "---".join(["once", "upon", "a", "time"])
    "once---upon---a---time" 
  • 6

    Полезные константы строкового модуля

    Пайтона string модуль предоставляет константы для операций , связанных строк. Для того, чтобы использовать их, импортировать string модуля:

     >>> import string
    
     

    string.ascii_letters :

    Стечение ascii_lowercase и ascii_uppercase :

     >>> string.ascii_letters
    'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'
    
     

    string.ascii_lowercase :

    Содержит все символы нижнего регистра ASCII:

     >>> string.ascii_lowercase
    'abcdefghijklmnopqrstuvwxyz'
    
     

    string.ascii_uppercase :

    Содержит все символы ASCII в верхнем регистре:

     >>> string.ascii_uppercase
    'ABCDEFGHIJKLMNOPQRSTUVWXYZ'
    
     

    string.digits :

    Содержит все десятичные цифры:

     >>> string.digits
    '0123456789'
    
     

    string.hexdigits :

    Содержит все шестнадцатеричные символы:

     >>> string.hexdigits
    '0123456789abcdefABCDEF'
    
     

    string.octaldigits :

    Содержит все восьмеричные символы:

     >>> string.octaldigits
    '01234567'
    
     

    string.punctuation :

    Содержит все символы , которые считаются знаки препинания в C локали:

     >>> string.punctuation
    '!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'
    
     

    string.whitespace :

    Содержит все символы ASCII, которые считаются пробелами:

     >>> string.whitespace
    ' \t\n\r\x0b\x0c'
    
     

    В режиме сценария, print(string.whitespace) напечатает фактические символы, используйте str , чтобы получить вернулся выше строка.


    string.printable :

    Содержит все символы, которые считаются печатными; сочетание string.digits , string.ascii_letters , string.punctuation и string.whitespace .

     >>> string.printable
    '0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~ \t\n\r\x0b\x0c' 
  • 5

    Сторнирование строки

    Строка может реверсировать с использованием встроенных в reversed() функции, которая принимает строку и возвращает итератор в обратном порядке.

     >>> reversed('hello')
    <reversed object at 0x0000000000000000>
    >>> [char for char in reversed('hello')]
    ['o', 'l', 'l', 'e', 'h']
    
     

    reversed() могут быть обернуты в вызове ''.join() , чтобы сделать строку из итератора.

     >>> ''.join(reversed('hello'))
    'olleh'
    
     

    В то время как с использованием reversed() может быть более удобными для чтения для непосвященных пользователей Python, используя расширенную нарезку с шагом -1 быстрее и более кратким. Вот, попробуйте реализовать это как функцию:

     >>> def reversed_string(main_string):
    ...     return main_string[::-1]
    ...
    >>> reversed_string('hello')
    'olleh'
    
    
     
  • 2

    Обоснуйте строки

    Python предоставляет функции для выравнивания строк, позволяя заполнять текст, чтобы упростить выравнивание различных строк.

    Ниже приведен пример str.ljust и str.rjust :

     interstates_lengths = {
        5: (1381, 2222),
        19: (63, 102),
        40: (2555, 4112),
        93: (189,305),
    }
    for road, length in interstates_lengths.items():
        miles,kms = length
        print('{} -> {} mi. ({} km.)'.format(str(road).rjust(4), str(miles).ljust(4), str(kms).ljust(4)))
     

    40 -> 2555 миль (4112 км.) 19 -> 63 миль. (102 км.) 5 -> 1381 миль. (2222 км.) 93 -> 189 миль. (305 км.)

    ljust и rjust очень похожи. Оба имеют width параметр и необязательный fillchar параметр. Любая строка , создаваемая эти функции, по крайней мере до тех пор , как width параметр , который был передан в функцию. Если строка длиннее , чем width alread, она не усекается. fillchar аргумент, который по умолчанию используется символ пробела ' ' должен быть один символ, а не multicharacter строка.

    ljust функция подушечки конца строки она называется на с fillchar до тех пор, пока width длиной символов. rjust функция подушечки начала строки в подобной манере. Таким образом, l и r в названиях этих функций относятся к стороне , что исходная строка, а не fillchar , расположена в выходной строке.

  • 1

    Преобразование между str или байтовыми данными и символами юникода

    Содержимое файлов и сетевых сообщений может представлять собой закодированные символы. Их часто нужно преобразовывать в юникод для правильного отображения.

    В Python 2 вам может потребоваться преобразовать данные str в символы Unicode. По умолчанию ( '' , "" и т.д.) является строкой ASCII, с любыми значениями за пределами диапазона ASCII отображается в виде уцелевших значений. Unicode строки u'' (или u"" и т.д.).

    # You get "© abc" encoded in UTF-8 from a file, network, or other data source
    
    s = '\xc2\xa9 abc'  # s is a byte array, not a string of characters
                        # Doesn't know the original was UTF-8
                        # Default form of string literals in Python 2
    s[0]                # '\xc2' - meaningless byte (without context such as an encoding)
    type(s)             # str - even though it's not a useful one w/o having a known encoding
    
    u = s.decode('utf-8')  # u'\xa9 abc'
                           # Now we have a Unicode string, which can be read as UTF-8 and printed properly
                           # In Python 2, Unicode string literals need a leading u
                           # str.decode converts a string which may contain escaped bytes to a Unicode string
    u[0]                # u'\xa9' - Unicode Character 'COPYRIGHT SIGN' (U+00A9) '©'
    type(u)             # unicode
    
    u.encode('utf-8')   # '\xc2\xa9 abc'
                        # unicode.encode produces a string with escaped bytes for non-ASCII characters
    
     

    В Python 3 вам может потребоваться преобразовать массивы байтов (называемые «байтовым литералом») в строки символов Unicode. По умолчанию теперь строка Unicode, и байтовой строки литералов теперь должны быть введены как b'' , b"" , и т.д. Байт буквальным будет возвращать True в isinstance(some_val, byte) , предполагая some_val быть строка , которая может быть закодированы в байтах.

    # You get from file or network "© abc" encoded in UTF-8
    
    s = b'\xc2\xa9 abc' # s is a byte array, not characters
                        # In Python 3, the default string literal is Unicode; byte array literals need a leading b
    s[0]                # b'\xc2' - meaningless byte (without context such as an encoding)
    type(s)             # bytes - now that byte arrays are explicit, Python can show that.
    
    u = s.decode('utf-8')  # '© abc' on a Unicode terminal
                           # bytes.decode converts a byte array to a string (which will, in Python 3, be Unicode)
    u[0]                # '\u00a9' - Unicode Character 'COPYRIGHT SIGN' (U+00A9) '©'
    type(u)             # str
                        # The default string literal in Python 3 is UTF-8 Unicode
    
    u.encode('utf-8')   # b'\xc2\xa9 abc'
                        # str.encode produces a byte array, showing ASCII-range bytes as unescaped characters.
    
    
  • 4

    Строка содержит

    Python делает его чрезвычайно интуитивным, чтобы проверить, содержит ли строка заданную подстроку. Просто используйте in операторе:

     >>> "foo" in "foo.baz.bar"
    True
    
     

    Примечание: тестирование пустой строки всегда будет приводить True :

     >>> "" in "test"
    True 

Синтаксис

Параметры

Примечания