카테고리 없음

TIL_20250520 화 코드 카타, 팀 과제

elya0919 2025. 5. 20. 21:11
코드카타 

 

SELECT 
substring(product_code,1,2) as CATEGORY,
count(*) as products
FROM Product
group by 1
order by product_code

 

카테고리별 상품 개수를 세는 문제였는데 

처음에 case문 써야 하나 착각을 했는데

 

포인트는 결국 서브스트링문을 쓰고 그 다음 컬럼으로 카운트를 사용하면

결국 서브스트링문에 맞는 집계를 하게 된다 

 

팀 과제

우리가 보고 싶은 결과물

| 출판사명 | 평균 스코어 | 총 리뷰 수

  • 1000개 이상 | 장르 | +) 책당 평균 리뷰 수 | | --- | --- | --- | --- | --- | | | | | | | | | | | | |
  • 출판사당 평균 책을 얼마나 냈는지
  • 출판사별’’
    • 평균 스코어
  • 장르별 출판사 추천
    • 장르별 리뷰 많은, 인기 출판사 보기
    • 출판사별 장르별 평균 별점, 리뷰 수
    • CTAS (Create table as select) https://jh-tr.tistory.com/121
    • CREATE TABLE final_result AS SELECT * FROM team_a a JOIN team_b b on a.출판사명 = b.출판사명
    • CTE(Common Table Expression) = WITH 문 or window function() 임시 테이블을 만들어서 그걸 가져다 쓰는 것 Ex) ranking, 집계 함수 빠르게 계산한 걸 가져다 쓰고 싶어서
      • WITH와 subqueary의 차이
        • 쿼리 안의 쿼리라서 다른 데서 쓰기가 힘든데 with는 더 쉽게 사용하기 위해서
        • 가독성을 위해서
    • https://moonpiechoi.tistory.com/128 꼭 한 번 읽어보기!! 확률과 통계 관련 할 수 있음.
  • 기본 조건
    • 출판사명 - Null, 공백
  • 분석 결과
    1. 출판사별 1000개 이상의 리뷰를 갖고 있는 출판사는 61개
    2. 출판사별 장르가 어떻게 나오는지 확인하고, 기준을 해도 될지 말지 그에 따른 리뷰 갯수
      1. 61개 출판사를 모두 장르를 체크하거나 하는 게 오래 걸린다 → 10개 정도로 추려서 2번을 진행하는 게 좋겠음. (윤환, 소정, 정재)
    3. 별점 평균과 그에 따른 리뷰 요약/텍스트 카운팅 (재민, 세희)
      1. 리뷰
    4. 2,3번 쿼리 합치기 → 장르별 출판사 top3 정해보기
    5. Top3를 통해 소비자 장르별 출판사 추천을 통해 출판사측 광고 제안
    6. 한 출판사에서 평점 좋고 리뷰 많은 책 top 10
      1. 한 출판사에서 평점은 높은데 리뷰가 많이 없음 부정적인 or 긍정적인 키워드 찾아서 하기
      2. 리뷰는 좋은데 평점은 낮음 → 부정적인 키워드 골라서 하기

튜터님 추천 책

데이터 분석을 위한 SQL(좀 더 심화) https://m.yes24.com/goods/detail/59411396

SQL 쿡북(초보자용) https://m.yes24.com/goods/detail/106207663

일정

  • 발표자 다르면 내용이랑 이런 것들 상관없다.
  • 쿼리 - 화
  • 분석 - 수
  • PPT - 수
  • 영상녹화 - 목