if(카카오) 2020을 통해 컨퍼런스를 시청하고있습니다.
그 중 머신러닝을 이용한 카카오 재팬- 픽코마의 추천 시스템을 소개해주시는 영상을 보았습니다.
홈추천 - 홈화면에서 유저에게 개인화 된 에게 추천
뷰와인드(?) 추천 - 한 작품(웹툰)을 완주했을때, 그 작품과 비슷한 작품을 추천
그리고 팝업 추천을 중점적으로 소개해 주셨습니다.
팝업 추천이란? -> 팝업 형태로 작품을 노출 시켜주는 시스템이다.
팝업 추천 사용 이유 -> 사업 전략적 측면에서 특정 작품의 소비를 늘리기 위해서 팝업 추천을 통한 노출 횟수를 증가
하지만, 팝업 추천에 문제점으로
유저의 동선을 가로막는 문제가 있기때문에 노출 빈도가 많아지면 유저에게 피로감을 주게되어
결과적으로, 서비스 사용 경험의 악화로 이어질 가능성이 있다고 하셨습니다.
따라서 , 이러한 문제를 해결하기 위해서 12시간에 딱 한 번 노출 되도록 빈도를 제한하였다고 합니다.
그렇다면 딱 한 번의 노출인 만큼
제 생각에는 가장 Critical하게 유저에게 노출의 효과(팝업 노출을 통한 팝업 클릭)가 가장 좋을 때를 어떻게 정하였을까? 궁금했습니다.
Alex 머신러닝 엔지니어 분께서는, 팝업 노출 시점이 열람을 멈추고 나가려고 할 때로 정하였다고 하셨습니다.
왜냐하면 재미가 없어서 or 다 보았기 때문에 이제 새로운 작품을 발견에 대한 니즈가 열려있는 상태이므로
작품탐색 또는 발견의 니즈를 충족시킬수 있도록 팝업 노출을 통해 기회를 제공할 수 있다고 합니다.
팝업 추천의 목표
1) 2개 이상 작품 동시 소비 유도
-> ( 딱 한 개의 작품을 열람하는 유저가 많았기 때문에, 유저가 더 많은 작품을 소비하도록 목표 설정)
2) 아직 잘 알려지지 않은 작품의 첫 열람 증대
3) 추천의 자동화
다양한 팝업 추천의 목표가 있지만 추천의 자동화를 살펴보면,
주로 사용자 로그를 사용하는 추천 알고리즘의 특성 상
유저의 열람이 많이 되어서 로그가 많이 발생하는 작품일 수록,
기존의 추천 구좌를 통해서 서비스 노출 기회가 많아졌다고 합니다.
하지만,
인기있는 작품이외의 신작(열람이 적어 로그 발생이 작은 작품)과 같이 유저에게 잘 알려지지 않은 경우에는
애초에 열람이 잘되지 않기때문에
노출이 잘 되지 않는 문제가 발생하였다고 합니다.
따라서 이러한 신작( + 잘 알려지지 않은 작품)에 대해서
팝업 노출을 통해 유저에게 초기 노출을 증가시켜 준다면
자연스럽게 추천 루프에 편입되어서 추천 노출이 활성화가 가능해졌다고 합니다.
이를 통해 기존에 운영진들이 수동으로 운영(시간, 비용, 정확도의 문제점, 그리고 운영확대에 걸림돌)하였던 것을
머신러닝을 통해 추천의 자동화가 가능해졌다고 합니다!
어떻게 추천할 것인가?
개인화 추천 vs 연관 추천
기준(유저 vs 작품의 연관성)에 따른 두 가지 추천 방식을 가지고 추천 진행
steps
1) 팝업 풀에 있는 아이템 중 유저의 취향에 비슷한 작품을 추천
2) 실무진으로부터 팝업 노출 전 열람하던 작품과 비슷한 작품을 추천하면 좋겠다는 feedback
ex) 코믹 만화를 보던 중, 로맨스 만화 추천등의 괴리감을 줄이기 위해서
3) 팝업 노출을 연관 추천 방식으로 구현해야하는 문제임을 인식
4) 개인화(취향) vs 연관(현재의 맥락 )
답이 나오지 않아 둘다 실행해보았다고 합니다!
방법은 A / B 테스트, 어떤 모델 사용해야하나?
-> Matrix Factorization모델 선택
하나의 행렬을 두개의 작은 행렬로 분해하는 방식.
유저에 따른 작품의 상호작용(열람)을 행렬화한 데이터를 제작(user - item matrix)
유저가 아직 모든 작품을 보지 않았기 때문에 행렬에는 많은 빈 칸이 존재하였고,
이 빈 칸을 채우는 , 다시말해서 유저가 아직 열람하지 않은 작품 중에서 어떤 작품을 가장 좋아할지를 예측해야함.
따라서 user-item matrix (m x n)를
1) user matrix (m x k) 와 item matrix (k x n)로 분해
2) 두 행렬의 곱이 기존 user-item행렬의 값에 근사(approximately)하게 된다면,
-> 기존에 비어져있던 칸들에 대해서도 예측할 수 있을 거라는 가정을 세움
-> user vector와 item vector를 곱한 값이 user가 해당 작품을 얼마나 좋아하는지 나타내게 된다면,
user와 item을 동일한 latent space에 맵핑할 수 있음.
-> 이 특징을 이용하여 임의의 이용자- 작품 혹은 작품- 작품 사이의 관계를 코사인유사도를 통해 수치화 할 수 있음
이러한 이유로 개인화/연관 추천 로직 모두 구현가능하다고 가정하였기 때문에 Matrix Factorization모델을 선택하셨다고 합니다.
이를 통해 제가 느낀점은 문제에 대한 solution을 찾기위해
문제에 대해 접근하고 모델링을 할 때, 그 문제에 제일 잘 맞는 알고리즘모델을 적용해야한다고 느꼈습니다.
그러면 어떻게 최적의 알고리즘을 찾는가? 에 대한 답은..
끊임없이 많은 논문을 읽고, 적용된 사례를 찾아보고, 지식을 많이 쌓아야 한다고 다시한번 느꼈습니다.
저는 이번 학기 인공지능개론 이라는 수업을 수강하고 있습니다.
교수님께서 수업시간 중에 하신 말씀이
과거부터 지금까지 수많은 ai 알고리즘이 개발이 되어 왔고 지금도 계속해서 개발이 되고있는 상황에서
마주한 문제에 대한 최적의 method를 찾는것이 능력이라고 배웠습니다.
지금 느낀대로 많은 모델을 구현해보고 경험해보며 제 것으로 익히도록 노력해야겠습니다!
'Make the Learning Curve > Conference' 카테고리의 다른 글
2021 삼성SDS 랜선 멘토링 후기 ( + 후기 책 선물) (0) | 2021.02.18 |
---|---|
[if (카카오) 2020] 카카오내비는어떻게 경험을 바꾸는가 / Review (0) | 2021.02.01 |
if (kakao) 2020 - 카카오페이 DevOps의통합과 자동화에 관한 이야기 - 리뷰 (0) | 2020.11.19 |
Naver Deview 2020 참가신청 (0) | 2020.11.19 |
댓글