인풋과 아웃풋 비중과 방향 설정
지식이 전무한 상태에서 콘텐츠를 생산할 수는 없다. 쥐어짜듯 만들어낸 콘텐츠는 나와 타인 모두에게 가치 없는, 흔한 네이버 블로그 포스팅과 다를 바 없을 것이다. 최근 이재용 회계사의 EO 콘텐츠를 보면서, 그가 인풋과 아웃풋의 비율을 항상 고려한다는 점이 인상적이었다. 자신의 전문성을 기반으로 콘텐츠를 만들고 인플루언서가 된 이재용은 내가 생각하는 ...
지식이 전무한 상태에서 콘텐츠를 생산할 수는 없다. 쥐어짜듯 만들어낸 콘텐츠는 나와 타인 모두에게 가치 없는, 흔한 네이버 블로그 포스팅과 다를 바 없을 것이다. 최근 이재용 회계사의 EO 콘텐츠를 보면서, 그가 인풋과 아웃풋의 비율을 항상 고려한다는 점이 인상적이었다. 자신의 전문성을 기반으로 콘텐츠를 만들고 인플루언서가 된 이재용은 내가 생각하는 ...
모든 데이터 분석가는 포커 선수가 되어야 한다. 포커는 불완전 정보 게임이다. 항상 부족한 정보 속에서 확률적 사고를 바탕으로 의사결정을 내려야 한다. 폴드할 것인가? 콜할 것인가? 아니면 레이즈할 것인가? 아웃츠와 팟 오즈, 상대의 핸드 레인지를 고려한 선택이 의사결정의 핵심이다. 심지어 프리플랍에서도 승률 계산과 전략 수립, 그리고 실행까지 마무...
X2E의 숙명.. 확률형 보상 지급 X2E 서비스에서 일하다보니 확률을 통한 보상 지급이 필수적이다. 현재로서는 기획자가 구간별로 최소, 최대 값을 정한 뒤, 발생 변수의 수를 조정하여 구간별 확률과 총 기대값을 시뮬레이션하는 방식의 “때려 넣기” 모델을 활용하고 있다. 물론 기대값은 의도한 값에 수렴하니 소기의 목적은 달성하고 있달까. 다만 이런...
크게 어려웠던 문제는 아니지만, 최근에 공부했던 내용을 활용해 풀이했기에 인상 깊었던 문제라 기록한다. 영업 시간 내에 발생한 이벤트를 24시간 기준의 데이터셋으로 변형해야 하는 문제로, 요즘 postgreSQL -> mySQL로 번역중인 책’SQL로 시작하는 데이터분석’에서 공부한 재귀적 함수를 활용하여 희소테이블을 생성할 수 있었다. 문제 ...
복수의 테이블을 각각 집계하여 지표를 계산하는 문제다. 프로그래머스 SQL kit 난이도 중 가장 높은 문제(5점)이며, 재밌게 푼 기억이 있어 기록한다. 문제 설명 다음은 어느 의류 쇼핑몰에 가입한 회원 정보를 담은 USER_INFO 테이블과 온라인 상품 판매 정보를 담은 ONLINE_SALE 테이블 입니다. USER_INFO 테이블은 아래와 같은...
PostgreSQL로 작성된 서적인 OREILLY의 ‘SQL로 시작하는 데이터 분석’을 MySQL로 변환하며 스터디한 내용. 시계열 분석 파트의 데이터 테이블 정리 쿼리가 실행될 테이블 형태는 아래와 같다. A. Table Scheme sales_month naics_code kind_f_busine...
카플란 마이어 하드코딩 이번 예제에서는 강아지 보호소를 예시로 사용한다. 강아지 보호소에는 새로운 강아지가 입소하고, 입양되어 퇴소하는 사건이 발생한다. 따라서 강아지가 보호소에 남아있는 기간을 생존기간으로, 입양되어 퇴소하는 사건을 위험으로 간주한다. 데이터 셋 구성 가상의 강아지 보호소 데이터 구성은 아래와 같다. start : 보호소 입...
로그순위 검정 (Log-Rank test) 개념 두개 이상의 그룹간의 생존율의 차이가 유의미한지 알기 위한 방법이다. 두 그룹간의 총괄적인 비교를 위해 아래와 같은 가설을 설정한다. $H_0 : S_1(t) = S_2(t) \text{ for all t}$ $H_1 : S_1(t) \neq S_2(t) \text{ for all t}$...
생존분석이란 생존분석은 자료가 절단되는 Cencoring을 고려하며 Time to Event에 대해 분석하기 위한 분석 방법이다. 이는 Linear Regression, t-test, Logistic Regression등의 통계 방법으로는 해결할 수 없다. 생존분석의 목적은 아래와 같다. User의 Time to Event를 예측한다. 둘 이...
스타벅스 옆에는 항상 이디야가 있다? 이디야는 스타벅스 근처에 매장을 내며 낙수효과를 노리는 전략을 운용한다고 한다. 이디야측은 부정하지만, 데이터로 검증된 사례이다. 그럼 스타벅스 주변에 어떤식으로 이디야가 포진해있을까? 이를 확인하기 위해 태블로를 활용하여 시각화 자료를 제작해보자. 목표 대시보드 via GIPHY 구성 데이터셋은 아래와 같이...