Hva er semantisk SEO og TF*IDF!

Les videre, så får du kanskje noe å tenke på. Søkemotorene har alltid forsøkt å behandle og tolke innhold slik som vi mennesker gjør. Ut fra denne tolkingen blir du presentert et søkeresultat. Så forsøker vi å reversere denne teknologien for å finne ut hvordan søkemotorene kommer frem til sitt resultat. Hensikten er å «knekke koden» for å kunne rangere et gitt innhold øverst i søkeresultatet.

Fra Wikipedia: Semantikk er den grenen av lingvistikken (språkvitenskapen) som studerer ordenes betydning, både enkeltvis og i sammenstilte strukturer (setninger).

 

Det påstås at nøkkelen til suksess er å få rangert innholdet ditt ved å vise til mening og relevans. Og for å få det til, sies det at det er viktig å bruke semantisk relaterte nøkkelord gjennom hele innholdet når du skriver artikkelen din. Hva er så semantisk relatert nøkkelord? Meget enkelt fortalt i denne sammenheng slik jeg har forstått det: Ord som settes i relasjon til hverandre og som til sammen gir en klar mening.   Illustrasjon semantikk. Semantisk hot dog

«Semantikk er læren om betydning. Siden språk for det meste brukes til å formidle betydning, står semantikken sentralt i alt språkstudium. Både kontekst og personlige erfaringer spiller en stor rolle for hvordan vi forstår betydningen av ord og setninger. Og nyansene kan være mange…». Kilde: mamiandme

 

«Semantisk søk er en teknikk som tar hensyn til søkeres hensikt og kontekstuelle betydningen av ord eller uttrykk. Dette i et forsøk på å forbedre nøyaktigheten og vise de mest relevante resultatene.» Kilde: longtailpro

 

Fordi menneskelig ordbruk kan være preget av omfattende bruk av synonymer, polysemi og homonymer kan dette ofte lede til mangel på forståelse. Relevansen og sammenhengen kan forsvinne fordi forskjellige mennesker beskriver det samme emnet ved hjelp av forskjellige ord, og fordi de samme ordene kan ha forskjellige betydninger kan irrelevant informasjon bli hentet eller presentert som resultat. Et eksempel kan være ordet «ark». Dette ordet kan bety flere ting alt etter hvilken relasjon en knytter det mot. Det kan f.eks. være et stykke papir, Noah’s ark, Ark Bokhandel, eller et utbygg på loftet.

  • Ark kan f.eks. knyttes til et trykkeri, en bok, kopipapir, servietter etc.
  • Ark kan f.eks. knyttes til tømmermann, bygningsingeniør eller arkitekt.

Så uten å utdype hva en egentlig mener gir søkeordet «Ark» ingen konkret mening for søkemotorindeksene. Søkemotoren kan dermed ikke gi deg en god tilbakemelding. Det grunnleggende problemet kan enklest sies å være at folk ønsker å få tilgang til informasjon basert på mening. Men ordene de velger/søker etter, gir ikke tilstrekkelig uttrykk for ønsket mening. Derfor forsøker søkemotorene å vise deg det de tror du søker etter. Men det er ikke alltid så lett hvis inputen er mangelfull eller ikke inneholder nok informasjon til å gi deg det svaret du var på jakt etter. Et forenklet eksempel hvis du bare søker etter ordet «hund»: Da får du opp en masse treff om alt mulig relatert til «hund» (Wikier, leksikon, kennel, veterinærer, tamhund, foring, hundeutstyr etc). Altså, søkemotoren forstår ikke helt hva du søkte etter. Dermed blir svaret du får helt sikkert ikke det du hadde i tankene da du søkte. Du må med andre bli mer konkret og skrive flere søkeord eller forklare bedre hva du mener for søkemotoren.  Er du mer spesifikk og søker etter «halsbånd til hund» så tenker søkemotoren: «Aha! – du har en hund og trenger et halsbånd». Du vil da få bedre treff på dette med bl.a. nettsider som selger hundehalsbånd. Enda flere begrep til søkemotoren gir enda bedre treff, osv. I tillegg eller alternativt kan du også ta en titt nederst på Google søkesiden. Der finner du reelle søk som andre har foretatt relatert til halsbånd til hund. Eksempel («semantiske ord» er de som er uthevet): Relatert Google søk Disse relaterte søkebegrepene kan du også bruke i teksten din hvis det er relevant for det du skriver om! Altså – sett deg inn i hva en typisk bruker ville søkt etter for å finne den artikkelen du har tenkt å skrive (før du begynner å skrive). Mange artikler på nett refererer i denne sammenheng også til LSI (Latent Semantisk Indeksering) når det gjelder nøkkelord, fraser og semantikk. Det hersker uenighet om LSI – slik det beskrives – virkelig brukes aktivt av søkemotorene. Uansett er jeg ikke tvil om at semantisk ordbruk vil bedre kvaliteten og forståelsen av innholdet ditt.

 

bestill ny nettside i dag

 

TF*IDF (Term Frequency * Inverse Document Frequency)

I tillegg finnes det et mye omtalt begrep som heter TF*IDF. Dette er teknologi som søkemotorene bruker i dag og som en bør ta hensyn til hvis en ønsker å bli høyt rangert på SERP (Search Engine Results Page). «TF*IDF» er en numerisk statistikk som brukes i informasjons henting for å representere hvor viktig et bestemt ord eller uttrykk er i et gitt dokument. » Google har lenge brukt TF-IDF i indeksering og informasjons gjenfinning. Hovedformålet med TF-IDF er å finne betydningen eller intensjonen av/med et gitt søkeord på en gitt side. Matematisk er TF-IDF et produkt av hvor ofte et søkeord vises på en side (TF) og hvor ofte det er forvent å bli vist på en gjennomsnittlig nettside basert på et større sett med dokumenter (IDF).

Fordi TF*IDF sammenligner en enkelt sides ordbruk med et stort dokumentarkiv får en da et estimat av viktige begreper på siden. TD*IDF nedprioriterer også ubetydelige ord og uttrykk. De mer sjeldne, meningsfulle ord og uttrykk blir oppskalert og sett på som betydningsfulle. Kildeutdrag og fri oversettelse fra link-assistant.com:

 

Les også Googles AI Blog om dette: (eksempelutdrag nedenfor – fritt oversatt)

«En måte å nærme seg problemet på er å lete etter ord en ser oftere enn vanlige. Hvis du for eksempel ser ordet «coach» 5 ganger i en artikkel på 581 ord og sammenligner den med den vanlige frekvensen som er 5 ganger per 330 000 ord – da har du grunn til å mistenke at artikkelen har noe å gjøre med «coaching».»

Det er dette som et tanken bak TF-IDF og teknikken brukes i dag for å indeksere nettsider. Prøv dette selv og les mer på disse lenkene:

From The Future: Understanding TF*IDF and it’s role in SEO

http://www.nichelaboratory.com/

Et eksempel fra «From The Future». Her la jeg inn søkeordet «halsbånd til hund» og ikke noen lenke på «Target URL». I skrivende stund går programmet deretter gjennom Google topp 10 liste for dette søkeordet og lister opp varianter av bigrams og trigrams (2 og 3 ord’s termer). En kan da se hva disse topp 10 nettstedene har av felles uttrykk. Dette kan være søke termer og dermed også noe akkurat disse nettstedene rangerer såpass høyt for.

Eksempel graf på TD*IDF Test gjerne dette med egne søkeord og sammenlign med din nettside (Target URL). Du får da se hvordan din sides ordsammensetning er i forhold til topp 10. Det er utallig meninger og artikler om TF*IDF og semantikk på nettet, men det skader ikke å ha noe av dette i tankene når en skal skrive innhold for en blogg eller artikkel.


Så – når du skriver teksten/artikkelen din må du sørge for å få med og bruke nok relevante ord til at søkemotorene skjønner hva du skriver om. I tillegg, les litt om TF-IDF og finn andre ord som er med på å klargjøre hva artikkelen din handler om. På den måten kan søkemotorene igjen indeksere innholdet ditt bedre og vil dermed kunne presentere det beste/det rette innholdet til den som søker.

Relatert: Innhold på sidene dine – «innhold er konge»

Det er alt det dreier seg om – skriv for leseren og skriv grundig! Men – viktig! – ta hensyn til at søkemotorene også skal forstå hva budskapet ditt handler om slik at de kan presentere akkurat din artikkel når noen søker.

Nå er det heldigvis slik at du normalt bruker ord eller uttrykk som er semantisk relatert til hverandre når du skriver naturlig. Hvis teksten din flyter lett og ledig – samt at meningmann kan forstå hva den dreier seg om – er det sannsynligvis bra. Jeg anbefaler likevel at du forsøker å lage en liste over nøkkelord, ord og uttrykk som kan bruke i artikkelen din før du begynner å skrive. Da har du en slags mal å gå ut fra og det blir lettere å sjekke at du har fått med deg det som er nødvendig. «Bak» 😊 så disse orden naturlig inn i teksten.

  • Jeg er av den oppfatning at godt innhold med høy kvalitet aldri går av «mote» med tanke på SEO
  • Forsk og finn søkeord som kan gi innholdet ditt større verdi
  • Bruk ord (ikke nøkkelord) som forklarer hva siden handler om (ref. Googles eksempel med «coach»)
  • Kom inn under huden på leserne dine og forstå leserens hensikt med søket
  • Skriv artikkelen slik at den gir god verdi for leseren din
  • Vi har samme ønske og mål (søkemotorene og oss):

– Søkemotorene ønsker å presentere deg innhold slik din intensjon med søket var
– Du ønsker å bli presentert et innhold slik du hadde intensjon om

For noen kan det i tillegg også være av interesse å sjekke opp såkalte rike snutter (rich snippets) og strukturerte data (Structured Data). Dette er også metoder for å gi mening til for eksempel en artikkel, og metoden blir brukt av søkemotorene for å indeksere innhold. Se Schema.org. Bruker du WordPress finnes det en hel del utvidelser (plugins) som kan benyttes.

Share This