Skip to content
김다은 edited this page Feb 8, 2023 · 16 revisions

학습 데이터 설명

오늘의집 - '집들이' 글

image

  • 오늘의집에서는 '집들이'이라는 카테고리에 오늘의집 유저들이 각자 꾸민 집을 소개하는 글이 있습니다.

'집들이' 글 - '상품 모아보기'

image

  • 각 '집들이' 글에는 집을 꾸미는데 사용한 아이템들을 한 데 모아둔 페이지가 있습니다.

학습 데이터 채택

image

  • '집들이' 글을 작성한 유저 : '집들이'에 포함된 아이템들
  • '집들이'에 포함된 아이템들은, '집들이' 글을 작성한 유저가 구매한 아이템들입니다.
  • 따라서 이 아이템들을 오늘의집 유저가 선호하는 아이템으로 간주할 수 있습니다.

추론 데이터 설명

선호 집들이 선택 과정: 나만의집 서비스 회원 가입

image

  • 회원가입 시 선호하는 집들이 이미지를 선택합니다.

신규 유저 선호 아이템 구성: 나만의집 유저 초기 데이터 구성

image

  • 나만의집 서비스의 신규 유저가 회원가입 시 선택한 '집들이' 글에 포함된 아이템들을 '초기 선호 데이터'로 구성합니다.
  • 따라서, 첫 추천 아이템들은 '초기 선호 데이터'를 기반으로 생성됩니다.

'좋아요'를 통한 정밀한 추천

image

  • 나만의집 서비스 유저가 선호하는 아이템이 있으면 '좋아요'를 눌러서, 유저의 선호 아이템으로 추가합니다!
  • 유저가 아이템들의 좋아요를 많이 누를수록 더 정밀한 추천이 가능해집니다!

초기 모델 - LightGCN

LightGCN이란?

  • LightGCN은 NGCF(Neural Graph Collaborative Filtering)이라는 그래프 기반 CF(Collaborative Filtering) 모델을 경량화해서 성능을 높인 모델입니다.
  • 간단히 이야기해서, 유저 - 아이템 관계로만 구성된 그래프 구조를 활용해서 유저의 선호 아이템을 포착하는 모델입니다.

LightGCN을 도입하려 했던 이유

  • LightGCN 모델은 학습 파라미터가 적어 추론 속도가 빠르다는 장점을 가지고 있습니다. 따라서, 빠른 학습 속도가 필요한 저희의 서비스에 적합할 것이라고 판단하였습니다.

non user-free model을 user-free하게 사용하


LightGCN의 실패 이유

  • 하지만 저희가 수집한 데이터는 99.9599%로 매우 높은 sparsity를 가지고 있었기에,

모델 선정 기준

image

  • 따라서 최종 모델을 선정하기 전, 4가지 모델 선정 기준을 설정했습니다.
  1. Personalized: 유저의 취향을 반영해 추천을 해주어야하므로, 개인화가 가능해야합니다.
  2. User Free: 신규 유저에 대응할 수 있어야하므로 아이템 구성만을 입력으로 받는 user-free해야합니다.
  3. Extremely Sparse Data: 매우 sparse한 데이터도 학습할 수 있어야 합니다.
  4. Fast Inference: 추론 속도가 빨라, 서비스 제공에 문제가 없어야 합니다.
  • 이런 네 가지 기준에 부합하는 모델로 Multi-DAE 모델을 선정하였습니다.

모델 소개 - Multi-Denoising Auto Encoder (Multi-DAE)

image

모델 성능 및 평가

Clone this wiki locally