2008년 12월 16일 화요일

Netflix 영화추천 시스템 분석

마이크로소프트웨어 인터넷 잡지를 살펴보던 중
흥미있는 기사를 발견했다.
제목은 Netflix 영화추천 시스템 분석 이라는 내용의 기사였는데
그 내용인 즉
======================================================================
2006년 10월 미국의 온라인 DVD 대여업체인 Netflix는 매우 흥미로운 공모전을 발표했다. 2011년까지 지속되는 이 공모전은 자체 개발한 Cinematch 기술보다 10% 향상된 자동추천시스템을 개발하면 100만 달러, 그러니까 우리 돈으로 10억 원을 지급하겠다는 조건을 달았다. 자동추천시스템은 일종의 인공지능 시스템으로 가입자가 특정한 영화를 얼마나 좋아할지의 여부를 기존의 평가 결과를 기초로 추정하는 시스템이다.
상금보다 더 흥미로운 점은 이 회사가 자체적으로 수집한 방대한 데이터를 공모전에 참여하는 모든 사람들에게 공개했다는 사실이다.       (마이크로소프트웨어 기사 중 발췌)
======================================================================
아 그런데 저 기사의 필자를 보니
티맥스 WAS 실에 근무하시는 김종규 실장님이시다.
식당에 가다가 얼굴만 몇번 봤고 개인적으로는 모르지만 저런 재미있는 기사를 써주셔서 감사드립니다.

아무튼 자기들이 개발한 추천시스템보다 10% 더 향상된 추천시스템을 제시해주는 팀에게는 10억(요새 환율로는 14억 ㅠㅠ)을 지급하겠다는 내용인데 12월 3일에 BellKor in BigChaos 라는 팀명에서 9.56% 향상된 추천시스템이 등록되었다.
어떤 데이트 셋인지 궁금해서 다운받고 있는 중인데 시간이 너무 많이 걸리네..

아무튼, 요사이 접하고 읽게 되는 많은 글중에서
machine learning을 접하고 있다.
개인적으로 관심이 있는 검색분야에서 검색 기능 개선의 두 가지 관점 이라는 글을 보기도 했고( 아마 저 분은 고감자라는 필명으로 널리 알려진 그 분이 아닐까 싶다)
지금 접한 기사의 영화추천 시스템 분석까지.
데이터용량의 증가의 속도로 보면 사람의 관점으로 데이터를 분석하는 것보다는
기계학습을 통해 데이터를 분석하게 하는 것이 맞을 지도 모른다.
하지만, 모든 데이터의 판단 기준은 정해진 것이 아니고
사용자가 판단하기 나름이라고 생각한다.
결국은 기계학습을 통해서 데이터를 분석하고 추천할 수 밖에 없다는 결론이다.

요즘 이러 저러한 글을 보면서
세상에는 정말 뛰어난 프로그래머가 많다는 것을 다시 한번 실감하고 있고
이제 그 차이는 나와 더 벌어지는게 아닐까 하는 반성도 해본다..

휴..

댓글 없음:

댓글 쓰기