понедельник, 3 июня 2013 г.

stringr — работаем со строками

Пакет stringr предоставляет нам ряд замечательных функций по работе со строками. Ниже представлен краткий обзор предлагаемого функционала.
  • fixed(string) — превращает передаваемый паттерн string в фиксированную строку; данная функция поможет ускорить скрипт поиска подстроки в случае, когда вам не нужна сила регулярных выражений
  • ignore.case(string) — игнорирование регистра в передаваемом паттерне
  • invert_match(loc) — инвертирование match-матрицы
  • perl(string) — используем Python-овский движок по работе с регулярными выражениями
  • str_c(..., sep = "", collapse = NULL) — конкатенация строк
  • str_count(string, pattern) — количество вхождений паттерна в строку
  • str_detect(string, pattern) — определяет наличие или отсутствие шаблона в строке
  • str_dup(string, times) — повторяет строку string ровно times раз
  • str_extract(string, pattern) — извлечение первой части строки, который соответствует паттерну
  • str_extract_all(string, pattern) — извлечение всех частей строки, который соответствует паттерну
  • str_length(string) — количество символов в строке
  • str_locate(string, pattern) — позиция первого вхождения паттерна в строку
  • str_locate_all(string, pattern) — позиции всех вхождений паттерна в строку
  • str_match(string, pattern) — извлечение первой группы, которая соответствует паттерну
  • str_match_all(string, pattern) — извлечение всех групп, которые соответствуют паттерну
  • str_pad(string, width, side = "left", pad = " ") — добавление к строке заданных символов с заданной стороны до достижения желаемой ширины
  • str_replace(string, pattern, replacement) — замена первого вхождения паттерна на заданную строку
  • str_replace_all(string, pattern, replacement) — замена всех вхождений паттерна на заданную строку
  • str_split(string, pattern, n = Inf) — разделение строки на некоторое число частей по указанному разделителю
  • str_split_fixed(string, pattern, n) — разделение строки на заданное число частей по указанному разделителю
  • str_sub(string, start = 1L, end = -1L) — получение подстроки
  • str_sub(string, start = 1L, end = -1L) <- value — замена подстроки
  • str_trim(string, side = "both") — исключение пробелов на концах строки
  • str_wrap(string, width = 80, indent = 0, exdent = 0) — оформляет строку в красиво отформатированный параграф
  • word(string, start = 1L, end = start, sep = fixed(" ")) — извлечение слова из предложения

Также можно почитать по теме строк: