20

对于诸如 的字符串'12233322155552',通过删除重复项,我可以获得'1235'.

但我要保留的是'1232152'只删除连续的重复项。

4

9 回答 9

18
import re

# Only repeated numbers
answer = re.sub(r'(\d)\1+', r'\1', '12233322155552')

# Any repeated character
answer = re.sub(r'(.)\1+', r'\1', '12233322155552')
于 2012-07-16T06:01:58.833 回答
15

你可以用itertools,这是唯一的衬里

>>> s = '12233322155552'
>>> ''.join(i for i, _ in itertools.groupby(s))
'1232152'
于 2017-05-24T11:57:45.470 回答
11

微软/亚马逊求职面试题:这是伪代码,实际代码留作练习。

for each char in the string do:
   if the current char is equal to the next char:
      delete next char
   else
     continue

return string

作为更高级别,尝试(实际上不是实现):

for s in string:
  if s == s+1:  ## check until the end of the string
     delete s+1
于 2012-07-12T21:22:56.160 回答
7

提示:itertools 模块非常有用。特别是一个函数,itertools.groupby,在这里可能会派上用场:

itertools.groupby(iterable[, key])

创建一个从可迭代对象返回连续键和组的迭代器。键是计算每个元素的键值的函数。如果未指定或为 None,则 key 默认为标识函数并返回未更改的元素。通常,iterable 需要已经在相同的 key 函数上排序。

所以由于字符串是可迭代的,你可以做的是:

use groupby to collect neighbouring elements
extract the keys from the iterator returned by groupby
join the keys together

这一切都可以在一条干净的线上完成..

于 2012-07-12T21:33:23.797 回答
2

首先,您不能从 Python 中的字符串中删除任何内容(如果不清楚,请使用谷歌“Python 不可变字符串”)。

M 第一种方法是:

foo = '12233322155552'
bar = ''
for chr in foo:
    if bar == '' or chr != bar[len(bar)-1]:
        bar += chr

或者,使用上面的 itertools 提示:

''.join([ k[0] for k in groupby(a) ])
于 2012-07-12T23:49:41.833 回答
1

+1 为 groupby。即插即用,例如:

from itertools import groupby
def remove_dupes(arg):
    # create generator of distinct characters, ignore grouper objects
    unique = (i[0] for i in groupby(arg))
    return ''.join(unique)

在 Python 2.7.2 中为我做饭

于 2012-07-12T22:46:04.723 回答
1

这将是一种方式:

def fix(a):
    list = []

    for element in a:
        # fill the list if the list is empty
        if len(list) == 0:list.append(element)
        # check with the last element of the list
        if list[-1] != element:  list.append(element)

    print(''.join(list))    


a= 'GGGGiiiiniiiGinnaaaaaProtijayi'
fix(a)
# output => GiniGinaProtijayi
于 2018-04-20T16:18:57.270 回答
1
number = '12233322155552'
temp_list = []


for item in number:   
   if len(temp_list) == 0:
      temp_list.append(item)

   elif len(temp_list) > 0:
      if  temp_list[-1] != item:
          temp_list.append(item)

print(''.join(temp_list))
于 2017-02-19T14:05:36.680 回答
0
t = '12233322155552'
for i in t:
    dup = i+i
    t = re.sub(dup, i, t)

您可以获得最终输出为1232152

于 2012-07-16T05:28:57.550 回答