Post

상품을 구매한 회원 비율 구하기 (프로그래머스 SQL kit)

복수의 테이블을 각각 집계하여 지표를 계산하는 문제다. 프로그래머스 SQL kit 난이도 중 가장 높은 문제(5점)이며, 재밌게 푼 기억이 있어 기록한다.

문제 설명

다음은 어느 의류 쇼핑몰에 가입한 회원 정보를 담은 USER_INFO 테이블과 온라인 상품 판매 정보를 담은 ONLINE_SALE 테이블 입니다. USER_INFO 테이블은 아래와 같은 구조로 되어있으며 USER_IDGENDERAGEJOINED는 각각 회원 ID, 성별, 나이, 가입일을 나타냅니다.

Column nameTypeNullable
USER_IDINTEGERFALSE
GENDERTINYINT(1)TRUE
AGEINTEGERTRUE
JOINEDDATEFALSE

GENDER 컬럼은 비어있거나 0 또는 1의 값을 가지며 0인 경우 남자를, 1인 경우는 여자를 나타냅니다.

ONLINE_SALE 테이블은 아래와 같은 구조로 되어있으며 ONLINE_SALE_IDUSER_IDPRODUCT_IDSALES_AMOUNTSALES_DATE는 각각 온라인 상품 판매 ID, 회원 ID, 상품 ID, 판매량, 판매일을 나타냅니다.

Column nameTypeNullable
ONLINE_SALE_IDINTEGERFALSE
USER_IDINTEGERFALSE
PRODUCT_IDINTEGERFALSE
SALES_AMOUNTINTEGERFALSE
SALES_DATEDATEFALSE

동일한 날짜, 회원 ID, 상품 ID 조합에 대해서는 하나의 판매 데이터만 존재합니다.


A. 문제

USER_INFO 테이블과 ONLINE_SALE 테이블에서 2021년에 가입한 전체 회원들 중 상품을 구매한 회원수와 상품을 구매한 회원의 비율(=2021년에 가입한 회원 중 상품을 구매한 회원수 / 2021년에 가입한 전체 회원 수)을 년, 월 별로 출력하는 SQL문을 작성해주세요. 상품을 구매한 회원의 비율은 소수점 두번째자리에서 반올림하고, 전체 결과는 년을 기준으로 오름차순 정렬해주시고 년이 같다면 월을 기준으로 오름차순 정렬해주세요.


B. 예시

예를 들어 USER_INFO 테이블이 다음과 같고

USER_IDGENDERAGEJOINED
11262021-06-01
2NULLNULL2021-06-25
30NULL2021-06-30
40312021-07-03
51252022-01-09
61332022-02-14

ONLINE_SALE 이 다음과 같다면

ONLINE_SALE_IDUSER_IDPRODUCT_IDSALES_AMOUNTSALES_DATE
115412022-01-01
21322022-01-25
343412022-01-30
4625332022-02-03
523122022-02-09
653512022-02-14
755712022-02-18

2021년에 가입한 회원은 USER_ID가 1, 2, 3, 4 인 회원들로 총 4명 입니다. ONLINE_SALE 테이블에서 해당 회원들에 대한 판매 데이터는 다음과 같습니다.

ONLINE_SALE_IDUSER_IDPRODUCT_IDSALES_AMOUNTSALES_DATE
115412022-01-01
21322022-01-25
343412022-01-30
523122022-02-09

그러므로 년, 월 별로 상품을 구매한 회원수와 상품을 구매한 회원의 비율을 구하고 결과를 정렬하면 다음과 같아야 합니다.

YEARMONTHPUCHASED_USERSPUCHASED_RATIO
2022120.5
2022210.3

풀이

  • 아래 두 그룹을 생성하여 조인한 후, 비율을 구해야 한다.
    • 고정된 2021년 가입자 총 수
    • 2021년 가입자 중 년-월 별 구매자 수 (중복 제거 only 구매자 수)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
SELECT
	sales.year, sales.month, sales.purchased_users
	,round(sales.purchased_users / users.total, 1) AS purchased_ratio
FROM (
	SELECT year(o.sales_date) AS year, month(o.sales_date) AS month
		,count(DISTINCT o.user_id) AS purchased_users
	FROM online_sale o
	RIGHT JOIN user_info u ON u.user_id = o.user_id AND year(u.joined) = 2021
	GROUP BY date_format(sales_date, "%Y-%m")) sales
JOIN (
	SELECT 2022 AS year, count(user_id) AS total
	FROM user_info
	WHERE year(joined) = 2021) users ON users.year = sales.year
ORDER BY
	year,month
This post is licensed under CC BY 4.0 by the author.