티스토리 뷰

  1. 추천 시스템
  2. 추천 시스템의 역사
  3. 추천 시스템의 종류
  4. 검색 시스템과 추천 시스템
  5. 정리

 


1. 추천 시스템

정의 : 여러 후보 가운데 가치 있는 것을 선정해서 의사 결정을 지원하는 시스템

  • 여러 후보 가운데 가치 있는 것을 선정한다.
    • 가치를 선정하는 방법에 따라 다양한 추천 알고리즘이 제안
      • 열람 횟수가 많은 상위 10개의 인기 아이템을 선택하는 방법
      • 사용자가 과거에 구입한 것과 유사한 것을 선택하는 방법 등
    • 각 알고리즘은 계산은 빠르지만 예측도가 떨어지거나, 축적된 데이터 양이 충분해야 예측 정확도를 높일 수 있는 등 장단점이 다양하기 때문에 비즈니스 목적에 맞춰 알고리즘을 적절하게 선택해서 사용해야 한다.
  • 의사결정을 지원한다는 것은 선택한 아이템을 사용자가 실제로 열람 또는 구입하도록 제시하는 것이 중요하다는 것
    • 아이템을 어떤 단계로, 어떻게 사용자에게 도달하도록 할지 설계하는 것

 


2. 추천 시스템의 역사

1990년대 인터넷의 발전과 함께 다양한 것이 정보화되고 거기에 접근할 수 있게 되며 여러 후보 가운데 가치 있는 것을 선정하는 기술이 중요해짐

  • 골드버그 : Collaborative Filtering을 사용한 메일 스코어링을 이용해 날로 늘어가는 전자 메일 중에서 유익한 메일을 선별(1992)
  • 아마존 전자상거래 사이트에서 추천 시스템을 활용하여 사용자에게 원하는 상품을 제공
  • 2006년 넷플릭스가 추천 알고리즘 경쟁 대회를 개최했으며, 이 대회에서의 대규모 데이터셋이 공개되며 이를 계기로 학계나 업계에서 대규모 데이터에 대한 예측 정확도를 효율적으로 높일 수 있는 추천 시스템 연구가 가속
  • 2007년 The ACM Conferenece on Recommender System 국제회의가 첫 개최

 


3. 추천 시스템의 종류

추천 시스템은 입력, 프로세스, 출력의 3요소로 정리할 수 있다.

1) 입력(데이터 입력)

  • contents
    • user contents : 나이, 성별, 주소 등 프로필 정보와 선호하는 카테고리나 가격대 처럼 설문으로 수집하는 정보
    • item contents: 카테고리, 상품 설명문, 발매일, 가격, 제작자 등
    • 콘텐츠 정보를 이용하는 추천을 내용 기반 필터링(contents based filtering이라고 한다.)
    • 신규 사용자나 신규 아이템은 행동 이력 데이터가 없으므로 콘텐츠 정보를 사용한 내용 기반 필터링으로 추천하는 경우가 많음 (Cold Start 문제)
  • interaction
    • 사용자가 서비스 안에서 행동한 이력 데이터로 열람, 구입, 북마크 평가 등
    • 데이터가 실시간으로 업데이트 되므로 인터랙션 데이터를 사용한 협조 필터링이 사용자의 기호를 더 반영하여 클릭이나 구입을 유도할 수 있는 추천 방법

 

2) 프로세스(추천설계)

  • 개요추천(개인화 없음)
    • 신규 아이템순, 낮은 가격순, 높은 인기순 등
    • 업종에 따라서는 개인화를 적용한 것보다 클릭률이나 구매율이 높은 경우가 있음
      • 미디어에서는 정보의 신규성이 중요하므로 신규 정보순
      • 모두가 보고 있는 정보를 보고 싶다는 욕구가 높은 도메인에서는 인기순
  • 연관 아이템 추천
    • 아이템 사이의 유사도를 사용
    • 내용 기반 필터링 방법
      • 아이템 설명문이나 카테고리 정보 등 콘텐츠 정보를 기반으로 설계
    • 협조 필터링 방법
      • 사용자 행동 이력을 기반으로 함께 확인하기 좋은 아이템을 유사한 것으로 설계
      • 내용 기반 필터링에서의 카테고리나 키워드로 표현할 수 없는 아이템의 분위기나 컨셉을 유사도에 반영하는 경우도 있음
    • 비슷한 아이템일 가능성이 높을때 유사도가 높다고 판단하는 관점 VS 함께 구입될 만한 아이템일 가능성이 높을 때 유사도가 높다고 판단하는 관점
    • 해리포터 문제 : 특정 시기에 많은 사람이 해리 포터 서적을 다른 아이템과 함께 구입함에 따라 모든 아이템의 추천 아이템으로 항상 해리포터가 추천 (인기 아이템의 영향을 제거 필요 )
  • 개인화 추천
    • contents based
      • 나이나 거주지 등의 프로필 정보를 기반으로 그에 맞는 아이템 그룹을 설계
    • interection based
      • 협조 필터링 등의 방법을 사용해 사용자의 과거 행동 이력으로부터 추천 아이템을 계산
        • 이중에 열람 이력을 그대로 표시하는 추천은 구현 비용이 적은 효과적인 방법
        • ex) 동영상이나 음악사이트, 전자상거래 사이트 등
    • contents and interection based
      • 열람 이력과 연관 아이템 추천 구조의 조합
        • 사용자가 마지막에 열람한 아이템과 비슷한 아이템 그룹을 연관 아이템 추천 구조로 추출해 이들을 메일로 전송
        • 연관 아이템 추천 구조를 하나만 가지고 있어도 되므로 운용하기 쉽고 간단하게 개인화 할 수 있음

 

3) 출력(추천 결과 제시)

좋은 추천 아이템을 설계해도 제시 방법이 나쁘면 사용자의 행동을 이끌어낼 수 없다.

  • 웹 사이트에서 제시, 메일 발송, 우편으로 추천 아이템 쿠폰 전송
  • 추천 이유를 곁들이거나 적절한 시점을 예측

 


4. 검색 시스템과 추천 시스템

  • 검색시스템
    • 다양한 문장이 디지털화 됨에 따라 개발된, 키워드를 입력해서 원하는 문장을 찾아내는 기술
    • 웹 사이트 검색에 사용되는 방법으로 구글 창업자가 발명했으며 페이지 랭크라 불리는 알고리즘이 많이 알려져 있음
    • 문장의 단어 정보뿐만 아니라 웹 사이트의 페이지 사이에 존재하는 링크 정보를 사용해 중요한 링크가 더 많이 모인 웹 사이트일 수록 중요도가 높다고 판단
  • 검색 시스템과 추천 시스템 비교검색 시스템 추천 시스템
      검색 시스템 추천 시스템
    사용자가 미리 마음에 드는 아이템을 파악하고 있는가? 파악하고 있는 경우가 많음 파악하고 있지 않은 경우가 많음
    키워드(쿼리) 입력 입력 있음 입력 없음
    연관 아이템 추천 방법 입력된 검색 키워드로 사용자 의도 추측 사용자 프로필이나 과거 행동으로 추측
    사용자의 자세 능동적 수동적
    개인화 개인화하지 않는 경우가 많지만 최근에는 개인화 서비스가 증가하고 있음 개인화하는 경우가 많음
    • 검색과 추천은 한쪽만 조합해서는 충분하지 않으며 서로 협력할 필요가 있다.
    • 검색과 추천 사용 비중은 서비스에 따라 다르기 때문에 비즈니스 모델이나 사용자 경험 설계에 따라 다르다.
      • 넷플릭스에서는 추천 시스템을 경유한 시청이 80%
      • 아마존에서는 추천 시스템을 경유한 매출이 35%
    • 최근에는 검색 결과를 개인화하는 서비스나 연구가 늘고 있다.
      • 구글에서는 사용자의 프로필 정보나 과거 행동 이력으로 검색 결과를 개인화

 

5. 정리

추천 시스템을 조합할 때는 사용자 경험과 비즈니스 가치를 명확히 설계한 후 비즈니스의 목적에 맞춰 적절한 추천 시스템을 도입하는 것이 중요.

 

 

 

출처 : Oreilly 추천 시스템 입문

공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함