Top 37 콘텐츠 기반 필터링 The 84 New Answer

You are looking for information, articles, knowledge about the topic nail salons open on sunday near me 콘텐츠 기반 필터링 on Google, you do not find the information you need! Here are the best content compiled and compiled by the https://toplist.cazzette.com team, along with other related topics such as: 콘텐츠 기반 필터링 콘텐츠 기반 필터링 파이썬, 콘텐츠 기반 필터링 협업 필터링, 콘텐츠 기반 필터링 딥러닝, 콘텐츠 기반 필터링 구현, 콘텐츠 기반 필터링 추천, 콘텐츠 기반 필터링 예제, 콘텐츠 기반 필터링 단점, Content-based filtering


[토크ON세미나] 추천시스템 분석 입문하기 2강 – 컨텐츠 기반 모델 (유사도 함수, TF-IDF) | T아카데미
[토크ON세미나] 추천시스템 분석 입문하기 2강 – 컨텐츠 기반 모델 (유사도 함수, TF-IDF) | T아카데미


카카오 AI추천 : 카카오의 콘텐츠 기반 필터링 (Content-based Filtering in Kakao) – tech.kakao.com

  • Article author: tech.kakao.com
  • Reviews from users: 12915 ⭐ Ratings
  • Top rated: 4.9 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 카카오 AI추천 : 카카오의 콘텐츠 기반 필터링 (Content-based Filtering in Kakao) – tech.kakao.com 콘텐츠 기반 필터링은 아래 그림에 표현된 것과 같이, 사용자가 소비한 아이템에 대해 아이템의 내용(content)이 비슷하거나 특별한 관계가 있는 다른 … …
  • Most searched keywords: Whether you are looking for 카카오 AI추천 : 카카오의 콘텐츠 기반 필터링 (Content-based Filtering in Kakao) – tech.kakao.com 콘텐츠 기반 필터링은 아래 그림에 표현된 것과 같이, 사용자가 소비한 아이템에 대해 아이템의 내용(content)이 비슷하거나 특별한 관계가 있는 다른 …
  • Table of Contents:

콘텐츠 기반 필터링

카카오웹툰에서의 콘텐츠 기반 필터링

마치며

About Tech

About Channels

Family Sites

카카오 AI추천 : 카카오의 콘텐츠 기반 필터링 (Content-based Filtering in Kakao) – tech.kakao.com
카카오 AI추천 : 카카오의 콘텐츠 기반 필터링 (Content-based Filtering in Kakao) – tech.kakao.com

Read More

추천 시스템 – 컨텐츠 기반 필터링이란? (CBF)

  • Article author: western-sky.tistory.com
  • Reviews from users: 6874 ⭐ Ratings
  • Top rated: 4.5 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 추천 시스템 – 컨텐츠 기반 필터링이란? (CBF) 컨텐츠 기반 필터링은 ‘내용(Content)’에 알맞는 아이템을 추천해주는 것입니다. 유저 X가 아이템 Y를 구매했다면, Y와 비슷한 아이템을 추천해주는 … …
  • Most searched keywords: Whether you are looking for 추천 시스템 – 컨텐츠 기반 필터링이란? (CBF) 컨텐츠 기반 필터링은 ‘내용(Content)’에 알맞는 아이템을 추천해주는 것입니다. 유저 X가 아이템 Y를 구매했다면, Y와 비슷한 아이템을 추천해주는 … 코로나로 인해 오프라인보다는 온라인 구매가 더 많아지고 있습니다. 온라인 마켓의 장점은 ‘시간과 공간’에 제한되지 않는다는 것 같습니다. 문을 열고 닫는 시간도, 물건을 진열한 매장도 필요 없으니까요. 또..Today I Learned
  • Table of Contents:

1 컨텐츠 기반 필터링

2 컨텐츠 기반 필터링의 장점

3 컨텐츠 기반 필터링의 단점

티스토리툴바

추천 시스템 - 컨텐츠 기반 필터링이란? (CBF)
추천 시스템 – 컨텐츠 기반 필터링이란? (CBF)

Read More

[추천시스템] 3) 컨텐츠 기반 필터링(Contents-based Filtering) :: 오늘 할 일: 끝내주게 숨쉬기

  • Article author: abluesnake.tistory.com
  • Reviews from users: 30237 ⭐ Ratings
  • Top rated: 4.2 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about [추천시스템] 3) 컨텐츠 기반 필터링(Contents-based Filtering) :: 오늘 할 일: 끝내주게 숨쉬기 아이템에 대한 프로필 데이터를 이용해 과거에 사용자가 좋아했던 아이템과 비슷한 유형의 아이템을 추천하는 시스템을 컨텐츠 기반 필터링이라고 … …
  • Most searched keywords: Whether you are looking for [추천시스템] 3) 컨텐츠 기반 필터링(Contents-based Filtering) :: 오늘 할 일: 끝내주게 숨쉬기 아이템에 대한 프로필 데이터를 이용해 과거에 사용자가 좋아했던 아이템과 비슷한 유형의 아이템을 추천하는 시스템을 컨텐츠 기반 필터링이라고 … 지난 추천시스템 2편에서는 추천시스템을 구축하기 위해 필요한 데이터의 종류와 대표적인 추천알고리즘을 간단하게 알아보았습니다. 본 포스팅에서는 널리 쓰이는 추천시스템 중 하나인 컨텐츠 기반 필터링에 대..
  • Table of Contents:

컨텐츠 기반 필터링(Contents-based Filtering)

컨텐츠 기반 필터링의 분석 절차

컨텐츠 기반 필터링의 장단점

유사 컨텐츠를 찾는 방법

TAG

관련글 관련글 더보기

인기포스트

티스토리툴바

[추천시스템] 3) 컨텐츠 기반 필터링(Contents-based Filtering) :: 오늘 할 일: 끝내주게 숨쉬기
[추천시스템] 3) 컨텐츠 기반 필터링(Contents-based Filtering) :: 오늘 할 일: 끝내주게 숨쉬기

Read More

추천시스템02. 콘텐츠기반 필터링(content based filtering) 구현

  • Article author: pearlluck.tistory.com
  • Reviews from users: 44285 ⭐ Ratings
  • Top rated: 3.2 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 추천시스템02. 콘텐츠기반 필터링(content based filtering) 구현 콘텐츠 기반 필터링(content based filtering). 사용자가 특정 아이템을 선호하는 경우, 그 아이템과 ‘비슷한’ 콘텐츠를 가진 다른 아이템을 추천 … …
  • Most searched keywords: Whether you are looking for 추천시스템02. 콘텐츠기반 필터링(content based filtering) 구현 콘텐츠 기반 필터링(content based filtering). 사용자가 특정 아이템을 선호하는 경우, 그 아이템과 ‘비슷한’ 콘텐츠를 가진 다른 아이템을 추천 … 콘텐츠 기반 필터링(content based filtering) 사용자가 특정 아이템을 선호하는 경우, 그 아이템과 ‘비슷한’ 콘텐츠를 가진 다른 아이템을 추천해주는 방식 굉장히 단순한 아이디어. 요즘엔 자주 사용하지 않는..사소한 기록들이 모여 실력이 된다
  • Table of Contents:

티스토리툴바

추천시스템02 콘텐츠기반 필터링(content based filtering) 구현

추천시스템02. 콘텐츠기반 필터링(content based filtering) 구현
추천시스템02. 콘텐츠기반 필터링(content based filtering) 구현

Read More

추천시스템: 컨텐츠 기반 필터링 :: 빨간연필

  • Article author: skyeong.net
  • Reviews from users: 34763 ⭐ Ratings
  • Top rated: 4.3 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 추천시스템: 컨텐츠 기반 필터링 :: 빨간연필 컨텐츠 기반 필터링은 사용자가 과거에 경험했던 아이템 중 비슷한 아이템을 현재 시점에서 추천하는 것입니다. Information Retrieval과 Machine … …
  • Most searched keywords: Whether you are looking for 추천시스템: 컨텐츠 기반 필터링 :: 빨간연필 컨텐츠 기반 필터링은 사용자가 과거에 경험했던 아이템 중 비슷한 아이템을 현재 시점에서 추천하는 것입니다. Information Retrieval과 Machine … 컨텐츠 기반 필터링이란? 컨텐츠 기반 필터링은 사용자가 과거에 경험했던 아이템 중 비슷한 아이템을 현재 시점에서 추천하는 것입니다. Information Retrieval과 Machine Learning의 중간 지점 정도라고 생각할..데이터의 의미와 쓸모에 대해 꾸준히 고민하고, 유용한 가치를 더하기 위해 연구하고, 일합니다.
  • Table of Contents:

컨텐츠 기반 필터링이란

컨텐츠 기반 추천시스템 구조

컨텐츠 기반 추천시스템에서 중요한 것

컨텐츠 기반 추천시스템의 장점

컨텐츠 기반 추천시스템의 단점

음악 사이트 판도라(Pandora)의 추천 시스템 예시

See also  Top 29 망 초대 효능 Top 57 Best Answers

TAG

관련글 관련글 더보기

인기포스트

티스토리툴바

추천시스템: 컨텐츠 기반 필터링 :: 빨간연필
추천시스템: 컨텐츠 기반 필터링 :: 빨간연필

Read More

추천시스템: 컨텐츠 기반 필터링 :: 빨간연필

  • Article author: heegyukim.medium.com
  • Reviews from users: 11550 ⭐ Ratings
  • Top rated: 4.7 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 추천시스템: 컨텐츠 기반 필터링 :: 빨간연필 콘텐츠 기반 추천은 기존에 사용자가 선택한 컨텐츠와 비슷한 컨텐츠를 추천하는 방법입니다. 예를 들어 사용자가 토이 스토리 1을 봤다면, 비슷한 … …
  • Most searched keywords: Whether you are looking for 추천시스템: 컨텐츠 기반 필터링 :: 빨간연필 콘텐츠 기반 추천은 기존에 사용자가 선택한 컨텐츠와 비슷한 컨텐츠를 추천하는 방법입니다. 예를 들어 사용자가 토이 스토리 1을 봤다면, 비슷한 … 컨텐츠 기반 필터링이란? 컨텐츠 기반 필터링은 사용자가 과거에 경험했던 아이템 중 비슷한 아이템을 현재 시점에서 추천하는 것입니다. Information Retrieval과 Machine Learning의 중간 지점 정도라고 생각할..데이터의 의미와 쓸모에 대해 꾸준히 고민하고, 유용한 가치를 더하기 위해 연구하고, 일합니다.
  • Table of Contents:

컨텐츠 기반 필터링이란

컨텐츠 기반 추천시스템 구조

컨텐츠 기반 추천시스템에서 중요한 것

컨텐츠 기반 추천시스템의 장점

컨텐츠 기반 추천시스템의 단점

음악 사이트 판도라(Pandora)의 추천 시스템 예시

TAG

관련글 관련글 더보기

인기포스트

티스토리툴바

추천시스템: 컨텐츠 기반 필터링 :: 빨간연필
추천시스템: 컨텐츠 기반 필터링 :: 빨간연필

Read More

컨텐츠 기반 시스템 & 협업 필터링 (Content-based Systems & Collaborative Filtering)

  • Article author: movefast.tistory.com
  • Reviews from users: 13076 ⭐ Ratings
  • Top rated: 3.0 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 컨텐츠 기반 시스템 & 협업 필터링 (Content-based Systems & Collaborative Filtering) 컨텐츠 기반 시스템 & 협업 필터링 (Content-based Systems & Collaborative Filtering). r4v3n-k 2019. 12. 22. 14:34. 반응형. 데이터 간 유사도. …
  • Most searched keywords: Whether you are looking for 컨텐츠 기반 시스템 & 협업 필터링 (Content-based Systems & Collaborative Filtering) 컨텐츠 기반 시스템 & 협업 필터링 (Content-based Systems & Collaborative Filtering). r4v3n-k 2019. 12. 22. 14:34. 반응형. 데이터 간 유사도. 데이터 간 유사도 – 모든 데이터는 벡터로 표현 가능 – 일반적으로 내적을 이용해서 데이터간 유사도를 측정 – 내적을 쓰는 이유: 각도를 이용하는데, 예를 들어 0도면 서로 같고 180도면 서로 다르다. 이를 위해..
  • Table of Contents:

댓글0

공지사항

최근글

인기글

최근댓글

태그

전체 방문자

컨텐츠 기반 시스템 & 협업 필터링 (Content-based Systems &  Collaborative Filtering)
컨텐츠 기반 시스템 & 협업 필터링 (Content-based Systems & Collaborative Filtering)

Read More

[Recommendation System] 콘텐츠 기반 필터링 (Content Based Filtering)

  • Article author: velog.io
  • Reviews from users: 15798 ⭐ Ratings
  • Top rated: 3.2 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about [Recommendation System] 콘텐츠 기반 필터링 (Content Based Filtering) 콘텐츠 기반 필터링 (content based filtering) 추천시스템에는 크게 1. 콘텐츠 기반 필터링 방식과 2. 협업 필터링 방식이 존재한다. …
  • Most searched keywords: Whether you are looking for [Recommendation System] 콘텐츠 기반 필터링 (Content Based Filtering) 콘텐츠 기반 필터링 (content based filtering) 추천시스템에는 크게 1. 콘텐츠 기반 필터링 방식과 2. 협업 필터링 방식이 존재한다. 콘텐츠 기반 필터링 (content based filtering) 추천시스템에는 크게 1. 콘텐츠 기반 필터링 방식과 2. 협업 필터링 방식이 존재한다.오늘은 콘텐츠 기반 필터링 방식에 대해 다뤄보려 한다.콘텐츠 기반 필터링 방식은 ‘콘텐츠’에 집중하는 방식이다. 이
  • Table of Contents:
[Recommendation System] 콘텐츠 기반 필터링 (Content Based Filtering)
[Recommendation System] 콘텐츠 기반 필터링 (Content Based Filtering)

Read More

#3 추천시스템 – 콘텐츠 기반 필터링(Content-based Filtering)

  • Article author: alsoj.tistory.com
  • Reviews from users: 13459 ⭐ Ratings
  • Top rated: 4.3 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about #3 추천시스템 – 콘텐츠 기반 필터링(Content-based Filtering) 콘텐츠 기반 필터링은 Item의 Feature를 사용한다. 사용자의 이전 행동(클릭, 시청, 구매 등) 또는 명시적 피드백(평점, 좋아요 등)을 기반으로 … …
  • Most searched keywords: Whether you are looking for #3 추천시스템 – 콘텐츠 기반 필터링(Content-based Filtering) 콘텐츠 기반 필터링은 Item의 Feature를 사용한다. 사용자의 이전 행동(클릭, 시청, 구매 등) 또는 명시적 피드백(평점, 좋아요 등)을 기반으로 … [이전 글]#2 추천 시스템 – 후보 생성(Candidate Generation) 1.콘텐츠 기반 필터링(Content-based Filtering) 개요  콘텐츠 기반 필터링은 Item의 Feature를 사용한다. 사용자의 이전 행동(클릭, 시청, 구매 등..
  • Table of Contents:

태그

관련글

댓글0

공지사항

최근글

인기글

최근댓글

태그

전체 방문자

티스토리툴바

#3 추천시스템 - 콘텐츠 기반 필터링(Content-based Filtering)
#3 추천시스템 – 콘텐츠 기반 필터링(Content-based Filtering)

Read More


See more articles in the same category here: Top 83 tips update new.

카카오 AI추천 : 카카오의 콘텐츠 기반 필터링 (Content-based Filtering in Kakao)

카카오 서비스 사용자들의 아이템(콘텐츠 또는 상품) 소비 패턴을 살펴보면, 기존에 소비한 아이템과 유사한 아이템을 소비하는 경우를 쉽게 찾아볼 수 있습니다. 예를 들면, 브런치의 특정 작가의 글을 연속해서 보거나, 멜론에서 한 장르의 음악을 많이 듣는다거나, 카카오웹툰, 카카오페이지에서 같은 장르의 작품을 많이 감상한다거나, 선물하기 서비스에서 특정 브랜드의 상품을 자주 구매하는 경우가 여기에 해당됩니다.

이렇게 소비 패턴이 뚜렷하다면 아이템의 정보를 활용해 추천하는 콘텐츠 기반 필터링(Content-based filtering) 방식이 효과적일 수 있습니다. 이번 글에서는 콘텐츠 기반 필터링에 대해서 알아보고, 카카오의 서비스에서 어떻게 적용이 되어 있는지 소개하고자 합니다.

콘텐츠 기반 필터링

콘텐츠 기반 필터링은 아래 그림에 표현된 것과 같이, 사용자가 소비한 아이템에 대해 아이템의 내용(content)이 비슷하거나 특별한 관계가 있는 다른 아이템을 추천하는 방법을 말합니다. 아이템의 내용은 아이템을 표현할 수 있는 데이터를 지칭하는데, 아이템 카테고리, 아이템 이름과 같은 텍스트 데이터, 이미지 데이터가 주로 사용됩니다. 다른 사용자의 아이템 소비 이력을 활용하는 협업 필터링(Collaborative filtering) 과는 주로 사용하는 데이터가 다르다는 차이점이 있습니다.

아이템이 유사한지 확인하려면 아이템의 비슷한 정도(유사도, similarity)를 수치로 계산할 수 있어야 합니다. 유사도 계산을 위해서 일반적으로 아이템을 벡터 형태로 표현하고 이들 벡터 간의 유사도 계산 방법을 많이 활용합니다.

아이템을 잘 표현할 수 있는 벡터를 만드는 데 널리 사용되는 방법으로는 (1) 원 핫 인코딩(One-hot encoding), (2) 임베딩(Embedding)이 있습니다.

원 핫 인코딩(One-hot encoding)은 아이템의 카테고리와 같은 범주형 데이터(categorical feature)를 표현하는 간단한 방법으로, 표현해야 하는 범주의 개수를 크기로 갖는 벡터를 만들어 데이터를 1과 0으로 표현하는 방법입니다. 아래 그림처럼 4가지의 아이템의 색상 데이터를 표현하고자 한다면, 그림 오른쪽처럼 특정 색상만 1의 값을 갖고 나머지는 0의 값을 갖는 벡터를 만들 수 있습니다.

표현하는 범주형 데이터의 종류에 따라 0과 1 대신 다양한 실숫값을 사용하기도 합니다. 예를 들어, 텍스트 데이터의 경우는 등장하는 단어를 각각의 범주로 생각하고 각 단어의 중요도나 빈도를 반영하기 위해 TF-IDF 가중치(weight)를 계산해 1 대신 넣기도 합니다.

카테고리와 같은 간단한 범주형 데이터의 경우 원 핫 인코딩(One-hot encoding)으로 표현이 가능하지만, 표현해야 하는 데이터 범주의 영역이 넓거나 이미지와 같이 복잡한 데이터인 경우는 데이터를 고정된 크기의 벡터로 표현하는 임베딩(Embedding) 방법을 많이 사용합니다. 벡터의 크기가 고정되어 있어 다루어야 하는 데이터의 크기가 늘어나더라도 상대적으로 적은 크기의 데이터를 통해 표현이 가능하고 딥러닝을 활용한 텍스트, 이미지 모델을 적용해 좋은 품질의 벡터를 얻을 수 있습니다.

텍스트 데이터의 경우는 Word2Vec 모델이 제일 널리 알려지고 사용되는 텍스트 임베딩 모델입니다. Word2Vec으로 각 단어의 임베딩 벡터를 학습하고, 텍스트에 등장하는 단어의 벡터를 합하거나 TF-IDF 가중 합산을 하는 방식으로 많이 활용되고 있습니다. 이후에 텍스트에 등장하는 단어 사이의 순서를 고려하기 위한 CNN, RNN 모델들이 제안되었고, 최근에는 BERT와 같은 대규모 텍스트 모델을 임베딩 모델로 활용하기 위한 다양한 연구가 등장했습니다.

이미지 데이터의 경우는 ImageNet 데이터의 카테고리 분류를 위해 미리 학습된 모델을 바탕으로 실제 사용할 데이터에 대해 파라미터 미세 조정(Fine-tuning)을 수행한 다음, 분류 레이어(classification layer)의 입력으로 들어가는 보틀넥 피처(Bottleneck feature)를 이미지 임베딩으로 사용하는 방법이 일반적입니다. 인물 사진이나 쇼핑과 같은 일부 도메인에서는 레이어 구조를 수정해 카테고리 분류 대신 유사, 동일성 여부를 직접 판별하는 샴 네트워크(Siamese network), 삼중항 네트워크(Triplet network)를 적용하는 방법도 있습니다.

이렇게 표현된 아이템 벡터는 내적(Dot product), 코사인 유사도(Cosine similarity), 피어슨 상관 계수(Pearson correlation coefficient)와 같은 다양한 벡터 유사도 측정 방식을 통해 아이템 유사도를 측정하는 용도로 사용됩니다. 측정된 유사도를 바탕으로 사용자가 최근 소비한 아이템과 유사한 아이템을 추천하면 콘텐츠 기반 필터링을 통한 추천이 됩니다.

콘텐츠 기반 필터링은 아이템 정보만 있으면 추천이 가능하기 때문에 소비 이력이 없는 새로운 아이템에 대한 추천이 바로 가능하다는 장점이 있습니다. 하지만 충분한 소비 이력이 쌓인 아이템에 대해서는 협업 필터링에 비해 추천 성능이 밀린다는 인식이 보편적입니다. 이런 이유로, 콘텐츠 기반 필터링은 추천 대상 아이템이 빠르게 바뀌는 상황이나 소비 이력이 적은 아이템에 대해, 협업 필터링을 보완하는 용도로 많이 활용됩니다.

카카오웹툰에서의 콘텐츠 기반 필터링

콘텐츠 기반 필터링을 통한 추천 로직은 카카오의 많은 서비스에 이미 적용이 되어 있습니다. 이번 단락에서는 카카오웹툰의 연관 작품 추천 영역에 적용된 콘텐츠 기반 필터링 로직을 소개하겠습니다.

아래 화면은 카카오웹툰에서 작품을 열람하기 위해 작품 리스트에서 작품을 클릭하면 진입하게 되는 작품 홈 영역입니다. 작품 홈 영역 상단에는 해당 작품을 본 사용자가 볼 만한 다른 작품을 추천해 주는 연관 추천 영역(“A 작품과 비슷한 작품들” 영역)이 있습니다. 사용자는 좌우로 추천 리스트를 스와이프 해 다른 작품을 탐색하고 열람할 수 있습니다. 여기에 제공되는 추천에 콘텐츠 기반 필터링을 활용하고 있습니다.

새로운 작품이 추가되면, 콘텐츠 기반 필터링을 위해 아래와 같은 데이터 준비 작업을 실시간으로 진행합니다.

작품 줄거리 텍스트 데이터를 바탕으로 작품 텍스트 임베딩을 생성합니다. 텍스트 임베딩에는 카카오가 보유한 다양한 텍스트 데이터로 사전에 학습한 한국어 임베딩 모델을 사용합니다.

사전에 다양한 이미지를 사용해 학습 시켜 둔 이미지 모델을 사용해 작품 대표 이미지의 임베딩을 생성합니다.

카카오브레인에서 개발한 웹툰 그림체 추출 모델을 사용해 작품 대표 이미지의 그림체 임베딩을 생성합니다.

특정 작품에 대한 연관 추천 결과를 계산할 때, 미리 준비해둔 콘텐츠 기반 필터링을 위한 데이터를 사용합니다. 앞서 얘기했듯이 콘텐츠 기반 필터링의 장점과 단점이 있기 때문에 이것만으로 추천 결과를 계산하지는 않고 다양한 모델로 얻은 추천 결과를 함께 사용합니다.

먼저, 앞서 알아본 3가지 임베딩을 통해 찾은 유사한 작품들 이외에도 협업 필터링과 같이 다른 방법으로 학습한 임베딩을 사용해 각각 유사한 작품 상위 K개를 추출합니다.

예를 들어, 위의 그림과 같이 “슬” 작가님의 <슬프게도 이게 내 인생>이라는 작품 대상으로 추천 결과를 계산한다면, 협업 필터링, 텍스트, 그림체, 이미지 임베딩을 가지고 각각 유사도가 높은 작품을 추려내고 이 유사한 작품들을 <슬프게도 이게 내 인생> 작품의 연관 추천 대상으로 선정합니다.

이후에는 선정한 유사 작품들을 멀티암드 밴딧(multi-armed bandit) 알고리즘을 통해 사용자가 추천받은 작품을 열람할 확률을 최대로 만들 수 있도록 순서를 조정해 사용자에게 노출합니다. 멀티암드 밴딧(multi-armed bandit) 알고리즘은 사용자가 열람하는 이벤트를 실시간으로 받아 열람 확률 최대화를 계속해서 진행합니다. 이로 인해 사용자는 항상 최근 인기도와 작품 내용 모두를 반영한 최신 추천 결과를 받을 수 있습니다.

마치며

이번 글에서는 다양한 추천 영역에서 활용되고 있는 콘텐츠 기반 필터링의 기본적인 아이디어와 카카오웹툰 연관 추천 영역에 적용된 사례를 살펴봤습니다.

카카오웹툰에서는 텍스트, 이미지와 같은 기본적인 임베딩 모델은 물론, 웹툰 도메인에 맞게 만든 그림체 추출 모델을 만들어 추천 대상을 다양하게 준비해두고 콘텐츠 기반 필터링, 협업 필터링, 멀티암드 밴딧 등 여러 알고리즘을 결합시킨 로직으로 추천 결과를 만들고 있습니다. 이 글이 콘텐츠 기반 필터링의 실제 적용 사례를 이해하는 데 도움이 되었길 바랍니다.

함께 하면 좋은 글

추천 시스템 – 컨텐츠 기반 필터링이란? (CBF)

컨텐츠 기반 필터링

코로나로 인해 오프라인보다는 온라인 구매가 더 많아지고 있습니다.

온라인 마켓의 장점은 ‘시간과 공간’에 제한되지 않는다는 것 같습니다.

문을 열고 닫는 시간도, 물건을 진열한 매장도 필요 없으니까요.

또한 사용자에게 구매할 가능성이 높은 제품을 ‘추천’해 줄 수도 있습니다.

이번 포스팅에서는 추천 시스템을 구현하는 방법 중 하나인 컨텐츠 기반 필터링에 대해 정리해보려고 합니다.

1. 컨텐츠 기반 필터링

추천시스템은 Utility Matrix에 기반하고 있습니다.

Utility Matrix는 어떤 유저가 어떤 아이템들을 구매했는지를 나타낸 행렬입니다.

컨텐츠 기반 필터링은 ‘내용(Content)’에 알맞는 아이템을 추천해주는 것입니다.

유저 X가 아이템 Y를 구매했다면, Y와 비슷한 아이템을 추천해주는 것이죠.

영화를 예를 들면 어떤 유저가 ‘인셉션’과 ‘인터스텔라’에 좋은 평점을 주었습니다.

그럼 두 영화의 공통적인 특징을 뽑아낸 뒤 그에 맞는 영화를 추천해주는 방식입니다.

예를 들어 두 영화 모두 SF영화이고 감독은 크리스토퍼 놀란이므로

놀란 감독의 SF장르 신작인 ‘테넷’을 추천할 수 있습니다.

유저가 좋아한 아이템들을 뽑아낸 목록을 Item Profile이라고하고,

Item Profile로부터 공통된 특징을 뽑아낸 결과가 User Profile입니다.

결국 User Profile의 특징에 기반한 아이템을 추천해 주는 것이죠.

Item이 영화라면, 감독, 제목, 배우 등이 있고

Item이 텍스트라면, 문서 내에 있는 중요한 키워드들로 구성될 수 있습니다.

2. 컨텐츠 기반 필터링의 장점

컨텐츠 기반 필터링의 장점은 크게 4가지입니다.

1. 다른 유저의 데이터가 필요하지 않다.

2. 개인의 독특한 취향을 고려한 추천이 가능하다.

3. 새로운 아이템이나 대중적이지 않은 아이템도 추천할 수 있다.

4. 사용자에게 추천하는 이유에 대한 설명이 가능하다.

1번,2번,3번은 개인의 취향을 기반으로 ‘내용’ 중심 추천을 하기 때문에 가능합니다.

특히 1번의 경우 Cold-Start problem과 Sparsity problem으로부터 자유롭기 때문입니다.

Cold-Start Problem는 협업 필터링에서 새로운 아이템이 추가되었을 때, 평가한 사람이 없어 추천이 어려운 문제고

Sparsity Problem는 모든 유저들이 모든 아이템에 대해 평가하지 않기 때문에 발생하는 문제입니다.

하지만 컨텐츠 기반 필터링은 개인의 평가에 기반하기 때문에 해당되지 않는 장점이 있습니다.

3번을 협업 필터링으로 구현 시 문제점으로 언급되는 No first-rater problem 문제가 있습니다.

협업 필터링은 타인의 평가 데이터가 필요한 데,

아무도 평가하지 않은 Item은 추천할 수 없는 문제입니다.

반면, 컨텐츠 기반 필터링은 아무도 평가하지 않은 새로운 아이템과 인기 없는 아이템이라도

해당 Feature들만 뽑아낼 수 있다면 추천이 가능한 것이죠.

그리고 왜 추천하는지 설명할 수 있는 것도 장점입니다.

Item Profile을 뽑아낼 때 구성한 Feature들로 설명해주면 되기 때문입니다.

3. 컨텐츠 기반 필터링의 단점

1. Feature를 뽑아내기 어려운 데이터들이 존재한다.

2. 처음 유입된 유저에 대해서는 추천할 수 없다.

반면 단점은 Feature들을 뽑아내기 어려운 Item들이 있습니다.

음악 같은 경우 종류가 너무 다양하기 때문에 공통된 Feature를 찾기가 어렵습니다.

이미지도 공통된 특징을 뽑아내기가 어려운 편에 속합니다.

또한 새로운 유저에 대해서는 추천이 어렵습니다.

주변 유저 평가는 영향을 받지 않지만,

아예 처음 유입된 유저는 무엇을 좋아하는지 모르기 때문에 추천할 수 없는 문제가 있습니다.

이상으로 추천시스템을 구현하는 방식 중 하나인 컨텐츠 기반 필터링에 대해 정리해보았습니다.

다음 포스팅에서는 협업 필터링에 대해 정리해보겠습니다. 🙂

[추천시스템] 3) 컨텐츠 기반 필터링(Contents-based Filtering)

지난 추천시스템 2편에서는 추천시스템을 구축하기 위해 필요한 데이터의 종류와 대표적인 추천알고리즘을 간단하게 알아보았습니다. 본 포스팅에서는 널리 쓰이는 추천시스템 중 하나인 컨텐츠 기반 필터링에 대해 알아보겠습니다.

컨텐츠 기반 필터링(Contents-based Filtering)

아이템에 대한 프로필 데이터를 이용해 과거에 사용자가 좋아했던 아이템과 비슷한 유형의 아이템을 추천하는 시스템을 컨텐츠 기반 필터링이라고 합니다. 핵심은 사용자가 이전에 높은 평점을 주었던(좋았다고 평가했던) 아이템 A와 유사한 아이템 A’를 찾는 것 이죠. 물론 이 아이템 A’는 사용자가 과거에 경험하지 않았던 아이템이어야 합니다.

예를 들어, 사용자가 영화 캡틴마블을 재밌게 보았다면 캡틴 마블에 대한 설명을 바탕으로 성격이 유사한 영화 블랙 위도우를 추천하는 것이죠.

컨텐츠 기반 필터링의 분석 절차

1. 이미지, 음성, 태그, 상품 설명서, 리뷰 등과 같은 아이템의 설명으로부터 아이템의 특징을 추출 합니다.

이때 아이템의 설명을 알고리즘(모델)이 이해할 수 있는 형태인 벡터로 변환합니다.

2. 알고리즘을 이용 하여 과거에 좋게 평가했던 아이템 A와 유사한 아이템들을 선별 합니다.

만약 군집화 알고리즘 이용한다면, 아이템들을 몇 종류의 군집으로 나눈 후 아이템 A와 동일한 군집에 있는 아이템 A’, B, C, D를 추천할 아이템 후보로 선정하는 것이죠.

여기서 아이템 사이의 유사성을 무엇으로 파악하고(어떤 특징을 사용할 것인지), 어떻게 계산할지가 컨텐츠 기반 필터링의 핵심이라고 할 수 있습니다.

3. (사용할 수 있는 데이터에 평점이 있는 경우) 추천할 아이템 후보 중에서도 평점이 높을 것으로 예상되는 일부 아이템 A’과 B를 우선적으로 추천 합니다.

컨텐츠 기반 필터링의 장단점

장점

다른 사용자들의 데이터가 없어도 추천이 가능 추천을 제공받는 사용자의 컨텐츠 이용내역만 있으면 됩니다.

새로 추가된 아이템, 평점이 없는 유명하지 않은 아이템도 추천이 가능 아이템의 설명만 있다면 다양한 아이템이 후보군이 될 수 있습니다.

추천을 하는 근거를 설명할 수 있음 아이템의 설명(feature)을 이용해 아이템간의 유사성을 계산하기 때문에 어떤 특징이 유사성의 근거가 되는지 파악할 수 있습니다.

단점

아이템의 설명을 구성하는 과정에서 주관성이 개입될 수 있음 사용자 A는 영화 X를 흥미진진하다, 박진감 넘친다고 평가할 수 있지만, 반대로 사용자 B는 동일한 영화를 두고 폭력적이라고 평가할 수 있습니다.

사용자가 과거에 좋아했던 아이템을 제공하지 않으면 추천이 어려움 때문에 몇몇 동영상서비스 플랫폼에서는 사용자가 서비스를 이용하기 전, 이전에 보았던 영상에 대한 평가를 받습니다. 이 과정이 어렵다면 사용자의 단순 프로필(성별, 나이, 지역 등)을 이용하여 비차별적인 매스마케팅식으로 아이템을 제공하고, 이후에 사용이력이 쌓이면 그때부터 개인화 추천을 시도할 수도 있습니다.

아이템 속성 정보 간의 연관성을 바탕으로 하기 때문에 사용자가 이미 알고 있거나, 알고 있는 것과 유사한 아이템만을 주로 추천하는 문제점 지나치게 특정된 아이템들 만을 추천하여 사용자의 다양한 취향을 반영할 수 없습니다. 필터 버블(Filter bubble) : 개인화 추천으로 생긴 정보편식 현상으로, 사용자가 제한된 주제와 관점을 가진 정보만을 접하게 되는 것을 말합니다. 필터링된 정보만을 취득하여 다양한 생각들을 알 수 없게 되고 스스로 가치판단을 할 수 없게 된다는 문제가 있습니다.

유사 컨텐츠를 찾는 방법

앞서 컨텐츠 기반 필터링의 분석 절차에서 유사성을 무엇으로 파악하고 어떻게 계산하는지 가 핵심이라고 짚었는데요, 다양한 아이템들 사이에서 유사한 아이템을 찾기 위해 벡터간 유사도 계산을 이용할 수 있습니다.

출처: https://intellifysolutions.com/blog/similarity-distance-measures-2/

코사인 유사도(Cosine Similarity) : 두 점 사이의 각도를 측정한 지표로, 값이 작으면 두 데이터가 가까이 있다 = 유사하다는 의미입니다.

: 두 점 사이의 각도를 측정한 지표로, 값이 작으면 두 데이터가 가까이 있다 = 유사하다는 의미입니다. 유클리드 거리(Euclidean Distance) : 두 점 사이의 거리를 측정한 지표로, 값이 작으면 두 데이터가 가까이 있다 = 유사하다는 의미입니다.

: 두 점 사이의 거리를 측정한 지표로, 값이 작으면 두 데이터가 가까이 있다 = 유사하다는 의미입니다. 맨하탄 거리(Manhattan Distance): 두 점 사이의 거리를 측정하되, 수평-수직으로만 이동하는 거리를 구합니다.

이외 유사도의 종류와 파이썬을 활용해 아이템 벡터간 유사도를 계산하는 방법은 유사도의 종류와 파이썬 구현 포스팅을 참고해주시길 바랍니다.

이렇게 구해진 벡터간 유사도(거리)를 이용 해 k-근접이웃 알고리즘, DBSCAN과 같은 군집화 알고리즘을 적용 하면 유사한 아이템들을 찾을 수 있습니다. 사용자가 좋아했던 아이템이 속하는 군집을 찾고, 그 군집에 같이 포함된 다른 아이템들을 추천해 주는 방식이죠.

이상으로 컨텐츠 기반 필터링의 개념과 분석 절차 및 장단점, 유사 컨텐츠를 찾는 방법에 대해 알아보았습니다. 사람들의 다양한 취향을 만족시킬 수 있는 컨텐츠가 쏟아져 나오는 만큼, 컨텐츠를 제공하는 플랫폼과 플랫폼 사용자 모두 적절한 컨텐츠를 알아서 찾아주는 알고리즘이 절실하게 필요하겠죠. 엄청나게 복잡한 모델이 아니더라도 유사성만 판정해도 되기 때문에 컨텐츠 기반 필터링은 여러 플랫폼에서 여전히 널리 쓰이고 있다고 합니다.

다음 포스팅에서는 컨텐츠 기반 필터링과 함께 보편적으로 쓰이는 협업 필터링에 대해 알아보겠습니다. 🤗

참고

Beginners Guide to learn about Content Based Recommender Engines

https://ko.wikipedia.org/wiki/%ED%95%84%ED%84%B0_%EB%B2%84%EB%B8%94

So you have finished reading the 콘텐츠 기반 필터링 topic article, if you find this article useful, please share it. Thank you very much. See more: 콘텐츠 기반 필터링 파이썬, 콘텐츠 기반 필터링 협업 필터링, 콘텐츠 기반 필터링 딥러닝, 콘텐츠 기반 필터링 구현, 콘텐츠 기반 필터링 추천, 콘텐츠 기반 필터링 예제, 콘텐츠 기반 필터링 단점, Content-based filtering

Leave a Comment