Search

8. Datasets, Evaluation Metrics and Applications

8.1. Datasets

GNN 기반의 recommendation systems에 사용된 dataset들만 소개. (일반적인 RecSys에서 사용되는 dataset은 여기서 소개 X)
Search
Name
Data info
Task
Miscellaneous
User-item rating pair: timestamp, movie의 attribute, tag, user demographic feature와 함께 제공됨.
User-Item CF
KG-based Rec
총 3가지 scale: MovieLens-100K, MovieLens-1M, MovieLens-20M
Reviews (ratings, text, helpfullness votes), product metadata (description, category, price, brand, image feature), link (also viewed / also bought graph)
User-Item CF
Sequential Rec
Category에 따라 sub-dataset으로 구분될 수 있음. (Amazon-Books, Amazon-Electronics 등)
User check-in 정보
User-Item CF
POI
User check-in 정보, User간 social relationship 정보.
User-Item CF
POI
Sequential Rec
Stream of user clicks on e-commerce website within 6 months
시간 순서대로 정리된 transactional data
Session-based Rec
6개월 간의 user browsing activity
Musician listening 정보 (2,000명의 user와 artist attribute)
Sequential Rec
Social Rec
KG-based Rec
User의 rating, item review User 간 directed trust relationship.
Social Rec
1M rating of books, attributes of books (title, author, ..)
KG-based Rec

8.2. Evaluation Metrics

HR: 추천된 item 중에 1개 이상 click 한 user의 비율
HR@K=1UuUI(RK(u)T(u)>0)\text{HR}@K = \frac{1}{|\mathcal{U}|}\sum_{u \in \mathcal{U}}I(|R^K(u) \cap T(u)| > 0)
RK(u)R^K(u): top-KK 개의 추천된 item set
T(u)T(u): groud truth
II: indicator function
Precision, Recall, F1
Precision@K(u)=RK(u)T(u)K\text{Precision}@K(u) = \frac{|R^K(u) \cap T(u)|}{K}
Recall@K(u)=RK(u)T(u)T(u)\text{Recall}@K(u) = \frac{|R^K(u) \cap T(u)|}{|T(u)|}
F1@K(u)=2×Precision@K(u)×Recall@K(u)Precision@K(u)+Recall@K(u)\text{F1}@K(u) = \frac{2 \times \text{Precision}@K(u) \times \text{Recall}@K(u)}{\text{Precision}@K(u) + \text{Recall}@K(u)}
NDCG: ranking position에 따라 맞게 추천된 item의 contribution을 구분한다.
NDCG@K=1UuUk=1KI(RkK(u)T(u))log(k+1)k=1K1log(k+1)\text{NDCG}@K = \frac{1}{|\mathcal{U}|}\sum_{u \in \mathcal{U}} \frac{\sum^K_{k=1}\frac{I(R^K_k(u) \in T(u))}{\log (k+1)}}{\sum^K_{k=1}\frac{1}{\log(k+1)}}
MAP: average precision over users
MAP@K=1UuUk=1KI(RkK(u)T(u))Precision@k(u)K\text{MAP}@K = \frac{1}{|\mathcal{U}|}\sum_{u \in \mathcal{U}} \sum^K_{k=1}\frac{I(R^K_k(u) \in T(u)) \text{Precision}@k(u)}{K}
AUC: Click된 item을 click 되지 않은 item 보다 model이 더 높게 rank할 확률.
AUC(u)=iT(u)jI\T(u)I(r^i>r^j)T(u)I\T(u)\text{AUC}(u) = \frac{\sum_{i \in T(u)} \sum_{j \in \mathcal{I}\backslash T(u)} I(\hat{r}_i > \hat{r}_j)}{|T(u)||\mathcal{I}\backslash T(u)|}

8.3. Applications

GNN 기반의 추천 모델이 산업에서 사용될 수 있는 분야
E-commerce platform에서 상품 추천 또는 광고
IntentGC: user-item interaction 정보와 knowledge graph 정보를 GCN으로 모두 사용하고, Alibaba platform에 deploy 되었음.
Content 추천: 뉴스, 글 추천
DANSER: user-article interaction과 social relationship 정보를 활용해 실제 article 추천 시스템인 WeChat Top Story에 적용됨.
App 추천
GraphSAIL: App Store에 deploy 됨.
Image 추천
PinSage: Pinterest에 deploy 됨.