87 Я хочу найти расположение символа в строке. Сказать: string = "the2quickbrownfoxeswere2tired" Я хочу, чтобы функция возвращала 4и 24- расположение символа 2s в string. regex string r Рикардо источник Зачем использовать регулярное выражение? Неужели у r есть .indexOf()что-то вроде? fge 1 Я в этом сомневаюсь. Разработчики были Nixers и предполагали, что все знают регулярное выражение. Обработка строк в R довольно запутанна. IRTFM Ответы: 115 Ты можешь использовать gregexpr gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired") [[1]] [1] 4 24 attr(,"match.length") [1] 1 1 attr(,"useBytes") [1] TRUE или, возможно, str_locate_allиз пакета, stringrкоторый является оболочкой ( начиная с версии 1.0)gregexpr stringi::stri_locate_allstringr library(stringr) str_locate_all(pattern ='2', "the2quickbrownfoxeswere2tired") [[1]] start end [1,] 4 4 [2,] 24 24 обратите внимание, что вы можете просто использовать stringi library(stringi) stri_locate_all(pattern = '2', "the2quickbrownfoxeswere2tired", fixed = TRUE) Другой вариант в базе Rбыл бы что-то вроде lapply(strsplit(x, ''), function(x) which(x == '2')) должен работать (учитывая вектор символов x) Mnel источник как мы можем извлечь целые числа из списков / объектов, возвращаемых вашими первыми тремя решениями? 3pitt, Используйте regexprвместо, gregexprчтобы легко получить целые числа. Или используйте unlistна выходе, как указано в другом ответе ниже. Арани 42 Вот еще одна простая альтернатива. > which(strsplit(string, "")[[1]]=="2") [1] 4 24 Джилбер Урбина источник Вы можете объяснить, что [[1]]делает? francoiskroll @francoiskroll, [[1]] представляет первый элемент списка. Prafulla 20 Вы можете сделать вывод только 4 и 24, используя unlist: unlist(gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired")) [1] 4 24 источник 2 найти позицию n-го вхождения str2 в str1 (тот же порядок параметров, что и Oracle SQL INSTR), возвращает 0, если не найден instr <- function(str1,str2,startpos=1,n=1){ aa=unlist(strsplit(substring(str1,startpos),str2)) if(length(aa) < n+1 ) return(0); return(sum(nchar(aa[1:n])) + startpos+(n-1)*nchar(str2) ) } instr('xxabcdefabdddfabx','ab') [1] 3 instr('xxabcdefabdddfabx','ab',1,3) [1] 15 instr('xxabcdefabdddfabx','xx',2,1) [1] 0 Абдельмонем Махмуд Амер источник 2 Чтобы найти только первые местоположения, используйте lapply()с min(): my_string <- c("test1", "test1test1", "test1test1test1") unlist(lapply(gregexpr(pattern = '1', my_string), min)) #> [1] 5 5 5 # or the readable tidyverse form my_string %>% gregexpr(pattern = '1') %>% lapply(min) %>% unlist() #> [1] 5 5 5 Чтобы найти только последние местоположения, используйте lapply()с max(): unlist(lapply(gregexpr(pattern = '1', my_string), max)) #> [1] 5 10 15 # or the readable tidyverse form my_string %>% gregexpr(pattern = '1') %>% lapply(max) %>% unlist() #> [1] 5 10 15 MS Berends источник 1 Вы также можете использовать grep: grep('2', strsplit(string, '')[[1]]) #4 24 AlexB источник
115 Ты можешь использовать gregexpr gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired") [[1]] [1] 4 24 attr(,"match.length") [1] 1 1 attr(,"useBytes") [1] TRUE или, возможно, str_locate_allиз пакета, stringrкоторый является оболочкой ( начиная с версии 1.0)gregexpr stringi::stri_locate_allstringr library(stringr) str_locate_all(pattern ='2', "the2quickbrownfoxeswere2tired") [[1]] start end [1,] 4 4 [2,] 24 24 обратите внимание, что вы можете просто использовать stringi library(stringi) stri_locate_all(pattern = '2', "the2quickbrownfoxeswere2tired", fixed = TRUE) Другой вариант в базе Rбыл бы что-то вроде lapply(strsplit(x, ''), function(x) which(x == '2')) должен работать (учитывая вектор символов x) Mnel источник как мы можем извлечь целые числа из списков / объектов, возвращаемых вашими первыми тремя решениями? 3pitt, Используйте regexprвместо, gregexprчтобы легко получить целые числа. Или используйте unlistна выходе, как указано в другом ответе ниже. Арани 42 Вот еще одна простая альтернатива. > which(strsplit(string, "")[[1]]=="2") [1] 4 24 Джилбер Урбина источник Вы можете объяснить, что [[1]]делает? francoiskroll @francoiskroll, [[1]] представляет первый элемент списка. Prafulla 20 Вы можете сделать вывод только 4 и 24, используя unlist: unlist(gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired")) [1] 4 24 источник 2 найти позицию n-го вхождения str2 в str1 (тот же порядок параметров, что и Oracle SQL INSTR), возвращает 0, если не найден instr <- function(str1,str2,startpos=1,n=1){ aa=unlist(strsplit(substring(str1,startpos),str2)) if(length(aa) < n+1 ) return(0); return(sum(nchar(aa[1:n])) + startpos+(n-1)*nchar(str2) ) } instr('xxabcdefabdddfabx','ab') [1] 3 instr('xxabcdefabdddfabx','ab',1,3) [1] 15 instr('xxabcdefabdddfabx','xx',2,1) [1] 0 Абдельмонем Махмуд Амер источник 2 Чтобы найти только первые местоположения, используйте lapply()с min(): my_string <- c("test1", "test1test1", "test1test1test1") unlist(lapply(gregexpr(pattern = '1', my_string), min)) #> [1] 5 5 5 # or the readable tidyverse form my_string %>% gregexpr(pattern = '1') %>% lapply(min) %>% unlist() #> [1] 5 5 5 Чтобы найти только последние местоположения, используйте lapply()с max(): unlist(lapply(gregexpr(pattern = '1', my_string), max)) #> [1] 5 10 15 # or the readable tidyverse form my_string %>% gregexpr(pattern = '1') %>% lapply(max) %>% unlist() #> [1] 5 10 15 MS Berends источник 1 Вы также можете использовать grep: grep('2', strsplit(string, '')[[1]]) #4 24 AlexB источник
42 Вот еще одна простая альтернатива. > which(strsplit(string, "")[[1]]=="2") [1] 4 24 Джилбер Урбина источник Вы можете объяснить, что [[1]]делает? francoiskroll @francoiskroll, [[1]] представляет первый элемент списка. Prafulla 20 Вы можете сделать вывод только 4 и 24, используя unlist: unlist(gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired")) [1] 4 24 источник 2 найти позицию n-го вхождения str2 в str1 (тот же порядок параметров, что и Oracle SQL INSTR), возвращает 0, если не найден instr <- function(str1,str2,startpos=1,n=1){ aa=unlist(strsplit(substring(str1,startpos),str2)) if(length(aa) < n+1 ) return(0); return(sum(nchar(aa[1:n])) + startpos+(n-1)*nchar(str2) ) } instr('xxabcdefabdddfabx','ab') [1] 3 instr('xxabcdefabdddfabx','ab',1,3) [1] 15 instr('xxabcdefabdddfabx','xx',2,1) [1] 0 Абдельмонем Махмуд Амер источник 2 Чтобы найти только первые местоположения, используйте lapply()с min(): my_string <- c("test1", "test1test1", "test1test1test1") unlist(lapply(gregexpr(pattern = '1', my_string), min)) #> [1] 5 5 5 # or the readable tidyverse form my_string %>% gregexpr(pattern = '1') %>% lapply(min) %>% unlist() #> [1] 5 5 5 Чтобы найти только последние местоположения, используйте lapply()с max(): unlist(lapply(gregexpr(pattern = '1', my_string), max)) #> [1] 5 10 15 # or the readable tidyverse form my_string %>% gregexpr(pattern = '1') %>% lapply(max) %>% unlist() #> [1] 5 10 15 MS Berends источник 1 Вы также можете использовать grep: grep('2', strsplit(string, '')[[1]]) #4 24 AlexB источник
20 Вы можете сделать вывод только 4 и 24, используя unlist: unlist(gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired")) [1] 4 24 источник
2 найти позицию n-го вхождения str2 в str1 (тот же порядок параметров, что и Oracle SQL INSTR), возвращает 0, если не найден instr <- function(str1,str2,startpos=1,n=1){ aa=unlist(strsplit(substring(str1,startpos),str2)) if(length(aa) < n+1 ) return(0); return(sum(nchar(aa[1:n])) + startpos+(n-1)*nchar(str2) ) } instr('xxabcdefabdddfabx','ab') [1] 3 instr('xxabcdefabdddfabx','ab',1,3) [1] 15 instr('xxabcdefabdddfabx','xx',2,1) [1] 0 Абдельмонем Махмуд Амер источник
2 Чтобы найти только первые местоположения, используйте lapply()с min(): my_string <- c("test1", "test1test1", "test1test1test1") unlist(lapply(gregexpr(pattern = '1', my_string), min)) #> [1] 5 5 5 # or the readable tidyverse form my_string %>% gregexpr(pattern = '1') %>% lapply(min) %>% unlist() #> [1] 5 5 5 Чтобы найти только последние местоположения, используйте lapply()с max(): unlist(lapply(gregexpr(pattern = '1', my_string), max)) #> [1] 5 10 15 # or the readable tidyverse form my_string %>% gregexpr(pattern = '1') %>% lapply(max) %>% unlist() #> [1] 5 10 15 MS Berends источник
.indexOf()
что-то вроде?Ответы:
Ты можешь использовать
gregexpr
gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired") [[1]] [1] 4 24 attr(,"match.length") [1] 1 1 attr(,"useBytes") [1] TRUE
или, возможно,
str_locate_all
из пакета,stringr
который является оболочкой ( начиная с версии 1.0)gregexpr
stringi::stri_locate_all
stringr
library(stringr) str_locate_all(pattern ='2', "the2quickbrownfoxeswere2tired") [[1]] start end [1,] 4 4 [2,] 24 24
обратите внимание, что вы можете просто использовать
stringi
library(stringi) stri_locate_all(pattern = '2', "the2quickbrownfoxeswere2tired", fixed = TRUE)
Другой вариант в базе
R
был бы что-то вродеlapply(strsplit(x, ''), function(x) which(x == '2'))
должен работать (учитывая вектор символов
x
)источник
regexpr
вместо,gregexpr
чтобы легко получить целые числа. Или используйтеunlist
на выходе, как указано в другом ответе ниже.Вот еще одна простая альтернатива.
> which(strsplit(string, "")[[1]]=="2") [1] 4 24
источник
[[1]]
делает?Вы можете сделать вывод только 4 и 24, используя unlist:
unlist(gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired")) [1] 4 24
источник
найти позицию n-го вхождения str2 в str1 (тот же порядок параметров, что и Oracle SQL INSTR), возвращает 0, если не найден
instr <- function(str1,str2,startpos=1,n=1){ aa=unlist(strsplit(substring(str1,startpos),str2)) if(length(aa) < n+1 ) return(0); return(sum(nchar(aa[1:n])) + startpos+(n-1)*nchar(str2) ) } instr('xxabcdefabdddfabx','ab') [1] 3 instr('xxabcdefabdddfabx','ab',1,3) [1] 15 instr('xxabcdefabdddfabx','xx',2,1) [1] 0
источник
Чтобы найти только первые местоположения, используйте
lapply()
сmin()
:my_string <- c("test1", "test1test1", "test1test1test1") unlist(lapply(gregexpr(pattern = '1', my_string), min)) #> [1] 5 5 5 # or the readable tidyverse form my_string %>% gregexpr(pattern = '1') %>% lapply(min) %>% unlist() #> [1] 5 5 5
Чтобы найти только последние местоположения, используйте
lapply()
сmax()
:unlist(lapply(gregexpr(pattern = '1', my_string), max)) #> [1] 5 10 15 # or the readable tidyverse form my_string %>% gregexpr(pattern = '1') %>% lapply(max) %>% unlist() #> [1] 5 10 15
источник
Вы также можете использовать
grep
:grep('2', strsplit(string, '')[[1]]) #4 24
источник