분류 전체보기(95)
-
1-2. OOTP(Out of the Park Baseball) 데이터 분석 주제 선정
야구 경기의 목적은 무엇일까. 승리다. 야구를 위한 모든 것은 승리를 위해 존재한다. 인생을 살다보면 승리할 때만 있지 않고 패배할 때도 교훈을 얻는 경우도 많다. 그래도 교훈을 얻으려고 일부러 패배하지는 않는다. 야구 게임도 결국 승리를 하기 위해서 한다. 물론 게임이니까 여러가지 방식으로 즐기기 위해 꼭 승리만을 목적으로 플레이하진 않지만 뭐니뭐니 해도 게임은 이겨야 맛이 난다. 승리를 하고 우승을 할 때의 쾌감이 야구 게임을 하는 이유이다. 그럼 야구 게임 데이터 분석도 무엇을 위해 해야 할지는 어렵지 않게 알 수 있다. 어떻게 하면 승리를 하고 우승을 할까. OOTP를 많이 하진 않았고 초보라 아직 게임에서 월드시리즈 우승을 해보지 못했다. 그렇다 보니 우승을 한 번은 꼭 하고 싶다. 데이터 분석..
2026.02.11 -
1-1. OOTP(Out of the Park Baseball) 데이터 수집
데이터 분석을 하기 위해 반드시 필요한 건 데이터이다. 이게 무슨 당연한 얘기인가 싶다. 당연하게 있어야 하는게 없다고 생각이 드니 시작을 할 수가 없었다. 만약 내가 현재 어느 회사의 데이터 분석가라면 회사의 데이터가 있을테니 데이터 분석을 위한 첫걸음은 내딛을 수 있다. 개인으로서 데이터 분석을 하려 하니 먼저 부딪치는 문제가 데이터를 어디서 구할까 였다. 사실 믿는 구석은 있었다. 바로 OOTP 이다. OOTP는 직접 단장/감독이 되어 야구팀을 운영하는 야구 시뮬레이션 게임이다. 야구판 FM이라고나 할까. 야구를 좋아하는 사람으로서 무척이나 재밌게 한 게임이었다. 스토브리그때 선수와 계약을 하고 감독으로서 라인업을 구성하고 시즌을 운영하며 나만의 야구팀을 만들어 나간다는 느낌을 주기에는 충분한 게임..
2026.02.11 -
0. 절대 하지 않을 데이터 분석
'이거 꼭 해야지' 라고 써 놓는다면 쓸 때부터 굉장히 제한된다고 한다. 꼭 해야 될 것은 현실적으로 생각하게 되기 때문이다. 그래서 절대 이야기로 쓰지 않을 목록을 만들고 아무 얘기나 적어 놓는다고 한다. 쓰다보니 쓰지 못할 이유가 없다고 느낀다. 본인도 항상 뭔가를 할 때 꼭 해야 될 것은 계획을 세우고 머리 속으로 준비만 하다가 끝난다. '이거 아직 모르는데', '내가 이걸 할 수 있을까', '조금만 더 알아보고 하자'. '이게 과연 최선일까'. 수만가지 생각이 든다. 적으면서도 벌써 지친다. 잃을게 없다는 생각이다. 잘할 이유도 없고 못한다고 자책할 이유도 없다. 그냥 조금이라도 하는게 낫다. 그래서 남은 인생동안 꽤 많은 시간을 할 것 같은 여러 주제에 대한 데이터 분석을 대충 하려고 한다...
2026.02.11 -
[SQL] 대장균의 크기에 따라 분류하기 2
문제 개념PERCENT_RANK(PARTION BY 컬럼1 ORDER BY 컬럼2)컬럼1 내에서 컬럼2의 퍼센트값을 출력함.RANK : 그룹에서 값의 순위ROW_NUMBER : 1부터 중복을 허용하지 않은 유일한 순서 값을 할당 정답SELECT ID, CASE WHEN PERCENT_RANK() OVER (ORDER BY SIZE_OF_COLONY DESC)
2024.05.06 -
[SQL] 연도별 대장균 크기의 편차 구하기
문제 개념JOIN문의 ON에서도 컬럼에서 함수를 쓸 수 있다.다른 방법으로 풀 때 WINDOW함수를 쓰면 효율적이다.(아래 블로그 글 참조)https://moonpiechoi.tistory.com/128 [SQL] 윈도우 함수 (WINDOW FUNCTION)WINDOW FUNCTION 개요 행과 행 간의 관계를 쉽게 정의하기 위해 만든 함수가 윈도우 함수다. 윈도우 함수는 분석 함수나 순위 함수로도 알려져 있다. 윈도우 함수는 기존에 사용하던 집계 함수도 있moonpiechoi.tistory.com 정답WITH MS AS ( SELECT YEAR(DIFFERENTIATION_DATE) AS YEAR, MAX(SIZE_OF_COLONY) AS MAX_SIZE FRO..
2024.05.05 -
[SQL] 조건에 맞는 개발자 구하기(프로그래머스)
문제 개념비트연산자 C# 과 Python의 코드를 합하면 이진법으로 1010000000 이고 개발자의 SKILL_CODE와 각 자리마다 비트연산(&)을 하여 0이 아니면 C#이나 Python 스킬을 보유했다고 알 수 있다. 정답SELECT ID, EMAIL, FIRST_NAME, LAST_NAMEFROM DEVELOPERSWHERE SKILL_CODE & ( SELECT SUM(CODE) FROM SKILLCODES WHERE NAME IN ('C#', 'Python')) != 0ORDER BY ID
2024.05.05