본문 바로가기

papers

Exploration in Recommender Systems

by Minmin Chen (Google Research, CA)

Recsys 2021 

 

저자는 추천시스템에서 탐색의 역할(roles of exploration)을 세가지로 나눴다.

이 세가지를 공략하면 더 나은 시스템을 구축할 수 있다는 의미일듯하다.

ABSTRACT

1) system exploration: 희소한 피드백에 대한 불확실성 해소

2) user exploration: 유저들에게 새로운 것들을 제공

3) online exploration: 리얼타임으로 유저들의 피드백을 반영하도록 하는 것

1 SYSTEM EXPLORATION

System exploration에서는 유저가 시스템에 활동한 데이터(logged data)를 기반으로

추천시스템이 만들어지기 때문에 대부분의 콘텐츠들이 유저에게 제공되지 않는 다는점을 지적한다.

 

생성된지 얼마 안되거나 반응이 적은 데이터라면 좋은 콘텐츠일지라도 추천이 되지 않을 수도 있다.

data scarcity에서 오는 모델의 불명확함을 제거해 모델의 성능을 높이려는 노력이 필요하다. 

 

bandits 기법은

classic multi-arm bandits 부터 linear contextual bandits, neural bandits 까지 있다.

user-content 공간에서 불명확함을 측정하고 예측의 불확실함과 예측된 값을 고려하기 위해 추천할 콘텐츠를 고른다.

 

다만 탐색의 전략보다 모델탐색의 결과를 어떻게 측정할 것인지가 더 어려운 문제이다. 

A/B 테스트의 경우 fresh하고 참신한 콘텐츠를 포착하는데 도움이되지만 단기적으로는 사용자 경험을 낮추기도 한다.

2 USER EXPLORATION

User exploration에서는 개인화나 추천에서 정확도가 사용자 경험에 기여하였다. 

그렇지만 장기적인 관점에서 사용자 경험에는 악영향을 미치기도한다.

알려지지 않은 사용자의 니즈를 파악하고 제공하는 것을 User exploration이라고 한다.

 

RL 기반의 추천시스템의 품질 측정하기 위해 a set of metrics를 제안했다. (어떤??)

offline 측정에 실시간 실험을 통해 수억의 사람에게 제공하는 industrial 추천 플랫폼에서

장기적인 이득이 되도록 실험을 했다. (구체적인 내용은 없는 자랑?)

3 ONLINE EXPLORATION

Online exploration에서는 유저의 피드백에 대한 latency를 줄여

대규모 추천시스템에서의 실시간에 가까운 서빙 시간을 제공하는 것을 주요한 문제로 삼는듯하다.

 

이 논문은 reference 포함 3장으로 굉장히 짧다.

이 논문은 저자가 구글 리서치 / 박사과정동안 연구하면서 고도화된 추천시스템을 만들기 위해서

세가지 관점에서 시스템을 공략해야 한다는 것을 경험에 기반해 제시한다는 의미가 있을듯하다.

 

더 실질적인 내용은 없는듯하여 아쉬움이 남는다.