<aside> 🗒️ “특화프로젝트 - 빅데이터 : 추천” 주제에 대한 설명
</aside>
2023.02.27(월) @Sangbin
공통프로젝트와 큰 틀에서 보면 다르지 않음.

CBF, CF
다양한 관점이란, 데이터를 제공해주면, (맛집 데이터) 더해서 공공데이터나 유로데이터, 크롤링도 가능한데, 참고로 크롤링은 주의가 필요.
아무 데이터 막 썼다가 저작권 걸려서 싸피가 대외적으로 사용할 수 없는 프로젝트가 될 수 있음. 포트폴리오도 공격받을 수 있음.
크롤링 관련해서는 저작권 관련해서 반드시 담담 컨설턴트님과 상의 필요. 인스타 크롤링했다가 롤백시킨 경우 있음.

프로젝트 상세내용

서브 3은 응용임. 성능 관련이 많음. 명세 성능쪽으로 추천이 아무래도 데이터 사이즈가 크고 알고리즘 복잡도가 높아 연산속도가 느림.
클러스터링이라는 게 있는 프로세스 개선을 하고…
포트폴리오 측면에서는 추천하는 기술 중 하나임
명세서를 따라가면 이렇게 가는데, 꼭 이걸 따를 필요는 진짜 없음. 중간에 ci cd 넣ㅇ서 릴리즈 관리도 가능


테스트 자동화 자체도 적은 편

데이터 시각화를 통해 쌓인 데이터를 통계화해서 읽는 방법을 학습하게 됨

CBF, CF 알고리즘 학습, 유사도 계산 => 아웃풋을 더 주려는 것. 유사도는 1~0 사이 스코어(벡터값)으로 나오는데 이걸 통해 유저에게 어떤 값을 제공해서 만족시킬 것인가 고민 필요
하이브리드 추천 시스템 = CBF + CF CF는 콜드 스타트? 유저 경험 베이스로 추천하는데, 없는 상태에서 시작하면 안돼서 CBF를 같이 사용하게 됨. 근데 대부분의 팀들이 여기까지는 공통적으로 구현하는 듯. 그 아래 클러스터링, 성능 최적화 등은 팀내 방향성 따라 다름