본문 바로가기

Algorithm

[Python] Kakao, 2021 카카오 블라인드 코딩 테스트, 신규 아이디 추천

1. 문제 설명

카카오에 입사한 신입 개발자 네오는 "카카오계정개발팀"에 배치되어 카캉오 서비스에 가입하는 유저들의 아이디를 생산하는 업무를 담당하게 되었습니다. "네오"에게 주어진 첫 업무는 새로 가입하는 유저들이 카카오 아이디 규칙에 맞지 않는 아이디를 입력했을 때, 입력된 아이디와 유사하면서 규칙에 맞는 아이디를 추천해주는 프로그램을 개발하는 것입니다. 카카오 아이디의 규칙은 아래와 같습니다.

  • 아이디의 길이는 3자 이상 15자 이하여야 합니다.
  • 아이디는 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.) 문자만 사용할 수 있습니다.
  • 단, 마침표(.)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다.

 

"네오"는 다음과 같이 7단계의 순차적인 처리 과정을 통해 신규 유저가 입력한 아이디가 카카오 아이디 규칙에 맞는지 검사하고 규칙에 맞지 않은 경우 규칙에 맞는 새로운 아이디를 추천해주려고 합니다. 신규 유저가 입력한 아이디가 new_id라고 한다면,

  • 1단계 : new_id의 모든 대문자를 대응되는 소문자로 치환합니다.
  • 2단계 : new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다.
  • 3단계 : new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다.
  • 4단계 : new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다.
  • 5단계 : new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다.
  • 6단계 : new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다. 만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다.
  • 7단계 : new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.

 

예를 들어, new_id 값이 "...!@BaT#*..y.abcdefghijklm" 라면, 위 7단계를 거치고 나면 new_id는 아래와 같이 변경됩니다.

  • 1단계 대문자 'B'와 'T'가 소문자 'b'와 't'로 바뀌었습니다.
    "...!@BaT#*..y.abcdefghijklm""...!@bat#*..y.abcdefghijklm"
  • 2단계 '!', '@', '#', '*' 문자가 제거되었습니다.
  • "...!@bat#*..y.abcdefghijklm""...bat..y.abcdefghijklm"
  • 3단계 '...'와 '..' 가 '.'로 바뀌었습니다.
    "...bat..y.abcdefghijklm"".bat.y.abcdefghijklm"
  • 4단계 아이디의 처음에 위치한 '.'가 제거되었습니다.
    ".bat.y.abcdefghijklm""bat.y.abcdefghijklm"
  • 5단계 아이디가 빈 문자열이 아니므로 변화가 없습니다.
    "bat.y.abcdefghijklm""bat.y.abcdefghijklm"
  • 6단계 아이디의 길이가 16자 이상이므로, 처음 15자를 제외한 나머지 문자들이 제거되었습니다.
    "bat.y.abcdefghijklm""bat.y.abcdefghi"
  • 7단계 아이디의 길이가 2자 이하가 아니므로 변화가 없습니다.
    "bat.y.abcdefghi""bat.y.abcdefghi"

 

따라서 신규 유저가 입력한 new_id가 "...!@BaT#*..y.abcdefghijklm"일 때, 네오의 프로그램이 추천하는 새로운 아이디는 "bat.y.abcdefghi" 입니다.

 

2. 문제

신규 유저가 입력한 아이디를 나타내는 new_id가 매개변수로 주어질 때, "네오"가 설계한 7단계의 처리 과정을 거친 후의 추천 아이디를 return 하도록 solution 함수를 완성해 주세요.

 

3. 제한사항

  • new_id는 길이 1 이상 1,000 이하인 문자열입니다.
  • new_id는 알파벳 대문자, 알파벳 소문자, 숫자, 특수문자로 구성되어 있습니다.
  • new_id에 나타날 수 있는 특수문자는 -_.~!@#$%^&*()=+[{]}:?,<>/ 로 한정됩니다.

 

4. 입출력 예시

no new_id result
예1 "...!@BaT#*..y.abcdefghijklm" "bat.y.abcdefghi"
예2 "z-+.^." "z--"
예3 "=.=" "aaa"
예4 "123_.def" "123_.def"
예5 "abcdefghijklmn.p" "abcdefghijklmn"

 

5. 문제 풀이

저는 문제를 풀 때 기본에 충실하여 코드를 작성하였습니다. 먼저 조건 중 소문자 알파벳과 사용 가능한 기호, 0부터 9까지의 숫자를 flag 리스트 변수에 담아놓았습니다.

  • 1단계 : lower()함수를 사용하여 입력받은 new_id를 소문자로 변환해주었습니다.
  • 2단계 : 이어서 new_id 문자열을 리스트로 변환, 리스트를 집합으로 변환하여 중복을 제거하였고, 반복문을 통해 집합의 요소가 flag에 포함되어 있지 않을 경우 replace()함수를 통해 빈 값으로 변환해주었습니다.
  • 3단계 : 마침표의 연속성을 파악하기 위해 point_cnt라는 변수를 0으로 초기화하였고, new_id의 문자열을 반복하면서 마침표가 반복됨에 따라 point_cnt가 증가하고, 그 외에는 point_cnt만큼 반복되는 마침표를 빈 값으로 변환해주었습니다.
  • 4단계 : new_id의 길이가 0이 아니면서 첫 글자가 마침표일 경우에는 마침표인 첫 문자를 제거해주고, 마찬가지로 마지막 글자가 마침표일 때에는 마지막 문자를 제거해주었습니다.
  • 5단계 : 이렇게 가공한 new_id의 길이가 0인 경우, aaa를 반환하도록 하고, 길이가 16이상인 경우에는 처음부터 15개 까지의 문자를 반환하도록 하였습니다. 만약, 15글자 중 마지막 문자가 마침표인 경우 이를 제거해주도록 하였습니다. 또한, 길이가 2이하일 경우에는 총 문자수가 3이 되도록 마지막 문자를 반복하여 붙여주도록 하였습니다.
def solution(new_id):

    flags = [
        "a", "b", "c", "d", "e", "f", "g",
        "h", "i", "j", "k", "l", "m", "n",
        "o", "p", "q", "r", "s", "t", "u",
        "v", "w", "x", "y", "z",
        "-", "_", "."
    ] + [str(x) for x in range(0, 10)]

    # 1단계
    new_id = new_id.lower()

    # 2단계
    for flag in set(list(new_id)):

        if flag not in flags:
            new_id = new_id.replace(flag, "")

    # 3단계
    point_cnt = 0
    for flag in new_id:

        if flag == ".":
            point_cnt += 1

            if point_cnt > 1:
                new_id = new_id.replace("."*point_cnt, ".")
                point_cnt = 0

    # 4단계
    if (len(new_id)) and (new_id[0] == "."):
        new_id = new_id[1:]
    if (len(new_id)) and (new_id[-1] == "."):
        new_id = new_id[:-1]

    # 5단계
    if len(new_id) == 0:
        new_id = "a"*3
    elif len(new_id) >= 16:
        new_id = new_id[:15]
        if new_id[-1] == ".":
            new_id = new_id[:-1]
    elif len(new_id) <= 2:
        new_id = new_id + new_id[-1] * (3-len(new_id))

    return new_id

다른 참여자의 답안 중 아래 코드가 가장 인상 깊었습니다. 정규표현식을 사용한 방법이며, 확실히 제가 작성한 코드에 비해 간결하고도 효율적인 코드입니다.

import re

def solution(new_id):
    st = new_id
    st = st.lower()
    st = re.sub('[^a-z0-9\-_.]', '', st)
    st = re.sub('\.+', '.', st)
    st = re.sub('^[.]|[.]$', '', st)
    st = 'a' if len(st) == 0 else st[:15]
    st = re.sub('^[.]|[.]$', '', st)
    st = st if len(st) > 2 else st + "".join([st[-1] for i in range(3-len(st))])
    return st