Anbefalingssystemer og personalisering
Anvendelse

Anbefalingssystemer

Forudsiger brugerens præferencer og anbefaler relevante produkter, film, musik eller indhold. Kernen i platforme som Netflix, Spotify og Amazon.

Anbefalingssystemer (recommendation systems/engines) er ML-systemer der forudsiger hvilke elementer en bruger sandsynligvis vil foretrække og præsenterer personaliserede forslag. De er en central del af brugeroplevelsen på moderne digitale platforme.

Netflix estimerer at deres anbefalingssystem sparer virksomheden over 1 milliard dollars årligt i reduceret churn. Amazon rapporterer at 35% af deres omsætning kommer fra anbefalinger. Spotify's Discover Weekly-playliste bruges af over 100 millioner brugere.

De tre hovedtilgange er:

Collaborative Filtering (CF): Baseret på antagelsen om at brugere der var enige i fortiden, vil være enige i fremtiden. User-based CF finder lignende brugere og anbefaler hvad de kunne lide. Item-based CF finder lignende produkter baseret på brugerinteraktioner. Matrix Factorization (SVD) er en kraftfuld CF-teknik der dekomponerer bruger-item interaktionsmatricen i latente faktorer.

Content-Based Filtering: Anbefaler elementer lignende dem brugeren tidligere har interageret med, baseret på elementernes egenskaber. For film bruges genre, instruktør, skuespillere. For artikler bruges emner, nøgleord og skriverstil. TF-IDF og word embeddings bruges til at beregne indholdslig lighed.

Hybride systemer: Kombinerer CF og content-based metoder for at udnytte styrkerne ved begge. Netflix bruger et hybrid system med hundredvis af specialiserede modeller. De fleste moderne produktionssystemer er hybride.

Deep learning har transformeret anbefalingssystemer:

Neural Collaborative Filtering (NCF) erstatter traditionel matrix factorization med neurale netværk der kan fange ikke-lineære bruger-item interaktioner.

Sekventielle modeller (Transformers, RNNs) modellerer brugerens adfærd over tid og fanger kontekstuelle mønstre som tidspunkt, enhed og session-dynamik.

Two-Tower modeller bruger separate netværk til bruger- og item-repræsentationer, hvilket muliggør effektiv retrieval i real-time fra millioner af kandidater.

Cold start-problemet er en central udfordring: hvordan anbefaler man til nye brugere (ingen historik) eller nye elementer (ingen interaktioner)? Løsninger inkluderer content-based metoder, populærbaserede anbefalinger og aktiv onboarding.

Evalueringsmetrikker inkluderer precision@k, recall@k, NDCG (Normalized Discounted Cumulative Gain), MAP (Mean Average Precision) og offline A/B-test simulering. Online A/B-testing er standarden for at måle reel effekt.

Eksempler

  • Netflix anbefalinger
  • Spotify Discover Weekly
  • Amazon produktforslag
  • YouTube forslag

Relaterede algoritmer

Matrix FactorizationNeural CFContent-basedDeep Learning