본문 바로가기
강좌/PCCE 기출문제(파이썬)

[PCCE 기출문제][파이썬] 10. 데이터 분석

by Moons0827 2024. 8. 29.
반응형

문제는 아래 주소에서 풀어볼 수 있습니다.

코딩테스트 연습 - [PCCE 기출문제] 10번 / 데이터 분석 | 프로그래머스 스쿨 (programmers.co.kr)

 

프로그래머스

코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.

programmers.co.kr


문 제

AI 엔지니어인 현식이는 데이터를 분석하는 작업을 진행하고 있습니다. 데이터는 ["코드 번호(code)", "제조일(date)", "최대 수량(maximum)", "현재 수량(remain)"]으로 구성되어 있으며 현식이는 이 데이터들 중 조건을 만족하는 데이터만 뽑아서 정렬하려 합니다.

예를 들어 다음과 같이 데이터가 주어진다면

data = [[1, 20300104, 100, 80], [2, 20300804, 847, 37], [3, 20300401, 10, 8]]

이 데이터는 다음 표처럼 나타낼 수 있습니다.

주어진 데이터 중 "제조일이 20300501 이전인 물건들을 현재 수량이 적은 순서"로 정렬해야 한다면 조건에 맞게 가공된 데이터는 다음과 같습니다.

data = [[3,20300401,10,8],[1,20300104,100,80]]


정렬한 데이터들이 담긴 이차원 정수 리스트 data와 어떤 정보를 기준으로 데이터를 뽑아낼지를 의미하는 문자열 ext, 뽑아낼 정보의 기준값을 나타내는 정수 val_ext, 정보를 정렬할 기준이 되는 문자열 sort_by가 주어집니다.

data에서 ext 값이 val_ext보다 작은 데이터만 뽑은 후, sort_by에 해당하는 값을 기준으로 오름차순으로 정렬하여 return 하도록 solution 함수를 완성해 주세요. 단, 조건을 만족하는 데이터는 항상 한 개 이상 존재합니다.


제한 사항

  • 1 ≤ data의 길이 ≤ 500
    • data[i]의 원소는 [코드 번호(code), 제조일(date), 최대 수량(maximum), 현재 수량(remain)] 형태입니다.
    • 1 ≤ 코드 번호≤ 100,000
    • 20000101 ≤ 제조일≤ 29991231
    • data[i][1]은 yyyymmdd 형태의 값을 가지며, 올바른 날짜만 주어집니다. (yyyy : 연도, mm : 월, dd : 일)
    • 1 ≤ 최대 수량≤ 10,000
    • 1 ≤ 현재 수량≤ 최대 수량
  • ext와 sort_by의 값은 다음 중 한 가지를 가집니다.
    • "code", "date", "maximum", "remain"
    • 순서대로 코드 번호, 제조일, 최대 수량, 현재 수량을 의미합니다.
  • val_ext는 ext에 따라 올바른 범위의 숫자로 주어집니다.
  • 정렬 기준에 해당하는 값이 서로 같은 경우는 없습니다.

입출력 예


주어진 코드

def solution(data, ext, val_ext, sort_by):
    answer = [[]]
    return answer

정 답

def solution(data, ext, val_ext, sort_by):
    column_index = {
        "code" : 0,
        "date" : 1,
        "maximum" : 2,
        "remain" : 3
    }
    
    ext_index = column_index[ext]
    filtered_data = [row for row in data if row[ext_index] < val_ext]
    
    sort_index = column_index[sort_by]
    sorted_data = sorted(filtered_data, key = lambda x: x[sort_index])
    
    return sorted_data

해 설

먼저 문제의 수행 조건을 살펴봐야 합니다.

1. 데이터에서 특정 열(ext)의 값이 주어진 기준(val_ext)보다 작은 항목들만 필터링합니다.

2. 필터링된 데이터를 다른 특정 열(sort_by)의 값을 기준으로 오름차순 정렬합니다.

3. 정렬된 데이터를 반환합니다.


1. 1줄: 함수를 정의합니다.

2. 2~7줄: 사전(dictionary)을 정의합니다. 사전은 각 열의 이름과 그 열이 데이터에서 나타내는 순서를 매핑합니다. code는 인덱스 0, date는 인덱스 1, maximum은 인덱스 2, remain은 인덱스 3에 매핑됩니다.

3. 9줄: 매개변수 ext로 전달된 열 이름을 사용하여, 해당 열이 데이터에서 몇 번째 열인지 찾고, 그 인덱스를 ext_index 변수에 저장합니다.

4. 10줄: 리스트 컴프리헨션(list comprehension)을 사용하여 데이터를 필터링합니다.

더보기

리스트 컴프리헨션(List Comprehension) : 파이썬에서 리스트를 간결하게 생성할 수 있는 방법


new_list = [expression for item in iterable if condition]

expression: 새로 생성될 리스트의 각 요소를 정의합니다.
item: 반복 가능한 객체(iterable)의 각 요소를 가리킵니다.
iterable: 리스트, 문자열, 또는 다른 반복 가능한 객체입니다.
condition (선택적): 각 요소가 condition을 만족하는 경우에만 new_list에 포함됩니다.


 

데이터 data에서 각 행(row)을 검사하여, ext_index 위치의 값이 val_ext보다 작은 행들만 선택하여 filtered_data라는 새로운 리스트에 저장합니다.

5. 12줄: sort_by로 전달된 열 이름에 해당하는 열의 인덱스를 sort_index 변수에 저장합니다.

6. 13줄: 필터링된 데이터를 정렬합니다.
sorted 함수를 사용해 filtered_data 리스트를 sort_index 위치의 값을 기준으로 정렬하며, 이때 key 인수로 람다 함수(lambda x: x[sort_index])를 사용하여 각 행에서 정렬에 사용할 값을 선택합니다.

더보기

 sorted 함수: 파이썬에서 주어진 반복가능한 객체를 정렬된 리스트로 반환하는 내장 함수

 

sorted(iterable, key=None, reverse=False)
 
  • iterable: 정렬할 데이터가 들어있는 반복 가능한 객체(리스트, 튜플, 문자열 등).
  • key (선택적): 정렬 기준이 되는 함수를 지정합니다. 이 함수는 각 요소에 적용되어 그 결과를 기준으로 정렬이 수행됩니다. 기본값은 None이며, 이 경우 기본적인 요소 값 자체가 정렬 기준이 됩니다.
  • reverse (선택적): 정렬 순서를 결정합니다. False이면 오름차순(기본값), True이면 내림차순으로 정렬됩니다.
 

 

더보기

lambda x: x[sort_index]는 입력으로 주어진 리스트에서 sort_index 번째 요소를 반환하는 람다 함수

7. 15줄: 데이터를 반환합니다.

반응형

댓글