코드카타
SELECT
substring(product_code,1,2) as CATEGORY,
count(*) as products
FROM Product
group by 1
order by product_code
카테고리별 상품 개수를 세는 문제였는데
처음에 case문 써야 하나 착각을 했는데
포인트는 결국 서브스트링문을 쓰고 그 다음 컬럼으로 카운트를 사용하면
결국 서브스트링문에 맞는 집계를 하게 된다
팀 과제
우리가 보고 싶은 결과물
| 출판사명 | 평균 스코어 | 총 리뷰 수
- 1000개 이상 | 장르 | +) 책당 평균 리뷰 수 | | --- | --- | --- | --- | --- | | | | | | | | | | | | |
- 출판사당 평균 책을 얼마나 냈는지
- 출판사별’’
- 평균 스코어
- 장르별 출판사 추천
- 장르별 리뷰 많은, 인기 출판사 보기
- 출판사별 장르별 평균 별점, 리뷰 수
- CTAS (Create table as select) https://jh-tr.tistory.com/121
- CREATE TABLE final_result AS SELECT * FROM team_a a JOIN team_b b on a.출판사명 = b.출판사명
- CTE(Common Table Expression) = WITH 문 or window function() 임시 테이블을 만들어서 그걸 가져다 쓰는 것 Ex) ranking, 집계 함수 빠르게 계산한 걸 가져다 쓰고 싶어서
- WITH와 subqueary의 차이
- 쿼리 안의 쿼리라서 다른 데서 쓰기가 힘든데 with는 더 쉽게 사용하기 위해서
- 가독성을 위해서
- WITH와 subqueary의 차이
- https://moonpiechoi.tistory.com/128 꼭 한 번 읽어보기!! 확률과 통계 관련 할 수 있음.
- 기본 조건
- 출판사명 - Null, 공백
- 분석 결과
- 출판사별 1000개 이상의 리뷰를 갖고 있는 출판사는 61개
- 출판사별 장르가 어떻게 나오는지 확인하고, 기준을 해도 될지 말지 그에 따른 리뷰 갯수
- 61개 출판사를 모두 장르를 체크하거나 하는 게 오래 걸린다 → 10개 정도로 추려서 2번을 진행하는 게 좋겠음. (윤환, 소정, 정재)
- 별점 평균과 그에 따른 리뷰 요약/텍스트 카운팅 (재민, 세희)
- 리뷰
- 2,3번 쿼리 합치기 → 장르별 출판사 top3 정해보기
- Top3를 통해 소비자 장르별 출판사 추천을 통해 출판사측 광고 제안
- 한 출판사에서 평점 좋고 리뷰 많은 책 top 10
- 한 출판사에서 평점은 높은데 리뷰가 많이 없음 부정적인 or 긍정적인 키워드 찾아서 하기
- 리뷰는 좋은데 평점은 낮음 → 부정적인 키워드 골라서 하기
튜터님 추천 책
데이터 분석을 위한 SQL(좀 더 심화) https://m.yes24.com/goods/detail/59411396
SQL 쿡북(초보자용) https://m.yes24.com/goods/detail/106207663
일정
- 발표자 다르면 내용이랑 이런 것들 상관없다.
- 쿼리 - 화
- 분석 - 수
- PPT - 수
- 영상녹화 - 목