SQL 복습
·
DataEngineering
1. SUM( COLUMN )  노노 COUNT( COLUMN) 2. WHERE 'CAT' IN ANIMAL_TYPE OR 'DOG' IN ANIMAL_TYPE그냥 구문 자체가 편한듯? 'CAT' IN ANIMAL_TYPE 'DOG' IN ANIMAL_TYPE  3. SELECT MIN(DATETIME) AS 시간  AS '시간' 노노 그냥 시간
SQL 오답노트 : FROM 에 alias, mod
·
DataEngineering
https://www.hackerrank.com/challenges/weather-observation-station-3/problem?isFullScreen=true Weather Observation Station 3 | HackerRankQuery a list of unique CITY names with even ID numbers.www.hackerrank.com 1.FROM ~ AS  FROM STATION AS ST (X) FROM STATION ST(O) 2. MODE, MOD & ==, = MODE(ID, 2) == 0 (X)MOD(ID, 2) = 0 (O)  3. SELECT문에 함수 넣기 SELECT COUNT(DISTINCT(CITY)) 4. rownum & WHERE( 서브쿼리 )..
데이터에서 문제 해결까지 - PM 간단 체험
·
PM/S.C.C - Essence
올리브영 데이터를 수집하여 리뷰데이터를 통해  문제점을 파악하고 해결방안 모색. 그러나 해당 문제가 회사 측에서 봤을 때 과연 문제라고 할 수 있을지에 대한 의문 발생.  사측의 입장에서 과연 작은 side effect까지 고려할 필요가 있을까? 매출에 심대한 타격이 없고 실험 상 유의미한 문제가 없고 대부분의 사용자에게 좋은 경험을 도출 할 수 있다면 소수의 불편은 감수할만하다. 그것이 비록 의도적일 지라도 말이다.(다크패턴)  타겟으로 삼는 사용자의 분포에서 벗어난 사람들의  손해는 사측에선 크게 신경쓰지 않는다. 타겟으로 삼는 사용자에게 이득만 가져다 줄 수 있다면 필연적인 손실은 짊어지고 진행한다.  또한 부정적인 데이터만 보면 마치 전체가 다 틀린 것 처럼 느껴진다는 말을 실제로 느껴봤다.(편향..
이커머스에서 고객 여정 단계와 데이터, 그리고 PM의 역할
·
PM/S.C.C - Essence
1. 주요 사용자 여정 1) 사용자 여정이란?(1) 사용자가 제품이나 서비스를 인지하고 구매하며, 이후까지의 모든 단계를 포함하는 프로세스.(2) 일반적으로 이커머스에서의 사용자 여정은 다음과 같이 구성. 인지사용자가 광고, 검색, 소셜 미디어 등을 통해 제품이나 서비스를 처음 알게 되는 단계고려사용자가 웹사이트나 앱을 방문하여 제품 정보를 탐색하고 비교하는 단계장바구니사용자가 제품을 장바구니에 담고 구매를 고려하는 단계구매사용자가 원하는 제품을 선택하고 결제하는 단계사후 서비스제품 사용 후 리뷰 작성, 고객 서비스 이용, 반품 또는 교환 등의 활동이 이루어지는 단계(3) 이러한 사용자 여정을 시각적으로 표현한 것을 고객 여정 지도라고 함. 2) 고객 여정 지도의 활용(1) 퍼널 분석(funnel ana..
이커머스 분야에서의 PM
·
PM/S.C.C - Essence
1. 내가 조사한 PM 직무의 핵심은?"비즈니스 관점에서 기획으로 문제를 풀어내는 직무. 이때, 문제의 발견 및 결과 확인을 데이터를 통해 실행한다.문제 발견 및 문제 정의(가설 설정) -> 문제 해결 기획 -> 리소스 분배 -> 프로세스 체크 -> 결과 확인 -> 지속적 모니터링문제 해결을 위한 여러 직무와의 커뮤니케이션 능력문제 해결을 위한 우선순위 결정 및 프로세스 절차 기한 모니터링  2. "다른 도메인의 PM과 공통점/차이점은?" 2 - 1. 공통점목표 설정 및 목표 달성을 위한 전략 기획목표 달성을 위한 우선순위 결정 및 리소스 배치다양한 직무와의 의사소통 능력 및 리딩 능력지표 모니터링실험 설계 및 결과를 통한 개선  2 - 2. 차이점(이커머스 PM을 기준으로)도메인 특화 지식이커머스 PM..
표본 분산에 대한 분포와 조건 (feat. 카이제곱분포)
·
Statistics
계속 헷갈리고 잊어먹어서 정리. 표본 분포에서 표본 분산에 대한 분포인 카이제곱분포를 사용하려면 일단 Random Sample들이 정규분포에 대한 i.i.d가 만족되어야 한다. 따라서 표본 분산을 통해서 카이제곱분포를 사용하는 경우, 각 표본들이 정규분포를 따르는지 무조건 체크해봐야 된다. 표본 평균이 아니라!! 표본 자체가 정규분포를 따라야됨. n이 30이상이고 어쩌고 상관 없다. 이건 표본 평균(CLT)에 대해 다룰때.  1. 모집단이 정규분포를 따라야 함 모집단 X가 평균 μ, 분산 σ2를 갖는 정규분포 N(μ,σ2)를 따라야 한다. 이는 카이제곱 분포의 성질이 정규분포에서 파생되기 때문. 2. 독립적이고 동일한 분포의 표본 정규분포를 따르는 모집단으로부터 크기가 n인 표본이 독립적이고 동일한 분포..
데이터 리터러시 - 성공 확률이 0.5 vs 100번 시도해서 50번 성공??
·
Statistics/Fundamental
(어려움, 헷갈림 주의!!!!!!!) 성공확률이 0.5이면 이 확률 값이 100번 시도해서 50번 성공할 확률과 같다고 할 수 있을까? 이 둘은 엄연히 다르다.  (1) 성공확률이 0.5  성공 확률이 0.5라는 것은, 한 번 시도했을 때 성공할 확률이 0.5라는 것을 의미한다.이것은 단일 시행에서의 성공 가능성을 나타내며, 이항분포에서 특정 성공 횟수를 가지는 확률과는 다르다.    (2) 100번 시도해서 50번 성공 100번 시도해서 정확히 50번 성공할 확률은 이항분포를 따르며, 이는 성공 확률 p에 따라 달라진다. 예를 들어 X ~ Bin(100, 0.5) 일 때, P(X = 50) =0.08...이다. 다만, 이때의 기대값은 50번이 맞다.  즉, 성공 확률이 0.5일 때 100번 던지면 성공..
데이터 리터러시 - 기대값의 활용
·
Statistics/Fundamental
확률변수 X 가 정해지고  확률변수가 가지는 값에 대한 확률 P(X = x)가 정해지면 기댓값을 생각해 볼 수 있다.   기댓값이라는 것은 결국 X가 가질 수 있는 값이 확정적이지 않기 때문에 X가 가장 가질 것 같은 값이 어떤 값인지를 나타내는 것이라고 할 수 있다.   가령 확률변수 X가 "성공확률이 0.6일 때, 성공할 때까지 시도한 횟수"라고 한다면,(즉, X~Geo(0.6). X가 기하분포를 따르고 확률은 0.6 ) X의 기대되는 값. 즉, 성공할 때까지 시도할 횟수로 가장 기대되는 값이 1/0.6 = 1.67 정도 된다.   이때, 시도할 때마다 비용이 100만원이라고 가정해 보자.  그렇다면 성공할 때까지 대략 1.67 * 100만원 = 167만 원이 된다.    여기서 성공했을 시 기대 수..
HardConcentrator
'분류 전체보기' 카테고리의 글 목록 (4 Page)