Hvad er relevansen

skrive på side søgemaskine eller søgefelt (øverst på skærmen) browser begivenheder begynder at ske, der er skjult for almindelige brugere.Hvordan så i langt de World Wide Web for at finde oplysninger, og hvad er relevansen af ​​søgeresultaterne?Ordet stammer fra det latinske «relevo» og oversat til russisk som "hæve" eller "lette".Den engelske pendant til udtrykket - "relevans".I punkt 3.5.1 i GOST 7.73-96 står for dette koncept, og "relevant" og "relevante" har den samme definition, der er fremstillet i henhold til de oplysninger, som anmodningen om brugeroplysninger.

Dette nationale standard indeholder andre nyttige standardiseret terminologi og definitioner i forbindelse med inden for informationssøgning og formidling af information via automatiserede systemer.Dokumentet hjælper til at forstå betydningen af ​​mange ord i de oplysninger, forlagsvirksomhed og bibliotek aktivitet, og ikke blot en enhed af sprog, som "relevante".Definitionen af ​​"relevans" og "relevans", og dekrypteret punkt 3.5.2 GOST 7,73-96.De skal behandles som korrespondance modtaget information data informationsbehov.Dette er ofte forveksles med begrebet relevans, som er fundamentalt ikke sandt, for i et tilfælde er det et spørgsmål om overholdelse af anmodningen, og den anden - i henhold til behovene.Det er også forkert på spørgsmålet: "Hvad er relevansen?" Svar, at udtrykket er tæt på begrebet "værdi", som er den praktiske anvendelighed af resultaterne.

Men alligevel er der oplysninger?Søgemaskinen bruger en hær af robotter - stand-alone programmer, besøger hjemmesider og opbevare oplysninger om dem.Navnet er afledt af det engelske ord "bot", der er en forkortelse for "robot".Disse programmer er at finde nye steder og derefter gå til startsiden og gennemse dens indhold.Bots studerer sider henvist til hjemmet (i en browser den er indlæst først) interne links.Også programmet-bots se på de links, der peger på andre websteder, der har eksterne links.Gem denne information, videregive dem, opdage nye steder og lære, hvordan web-ressourcer hænger sammen.Således er de konstant at studere "kort" af World Wide Web.Men hvad er relevansen?Hvad har det at gøre med de bots?

I et specifikt eksempel se, at tilbuddet søgemaskiner Yandex og Google.På spørgsmålet "Hvad er relevansen?" Udlevering Yandex fundet 28 millioner reaktioner, og hos Google 155.000.Det kan siges, at de alle imødekomme efterspørgslen og behov er ikke altid, det er, relevans er ikke dem alle.For eksempel forklarer side på Wikipedia CEO dette koncept vil uden tvivl være nyttigt, og stedet for de relevante og irrelevante omkostninger i beslutningsprocessen gælder ikke for dette emne.Et mere oplagt eksempel er, når en anmodning "hands up", betød at modtage oplysninger om den musikalske gruppe, har Yandex udstedt 31 millioner besvarelser, og blandt dem er der en artikel med en appel til at hæve sine hænder op, som det er, i henhold til de terapeuter, meget nyttige.En sådan reaktion kan ikke anses for relevans, selv om svarene fra de 31 millioner, han fandt i at udstede 586 position.

Således højere relevansen af ​​teksten, jo mere sandsynligt, at det vil gå ned i de første positioner af søgning svar.Dette indeks er en kvantitativ vurdering, men gennemførelsen algoritmer af forskellige søgemaskiner har forskellige og ukendt for brugeren, og de ændrer sig med tiden, da søgemaskinerne forsøger at klatre i placeringerne, forsøge at give relevansen oplysninger, reducere den tid til at søge efter den.Anses yderst relevant side nøgleordet registrering, der svarer forespørgslen kan være i området fra 3 til 7%.Men det er ikke det eneste kriterium for relevansen af ​​dokumentet.Disse omfatter en række interne og eksterne parametre.Interne indikatorer (med undtagelse af søgeord massefylde), er deres placering i teksten (indtastning titlen, deres nærhed til titlen og til hinanden danne en eventuel søgning sætninger), samt tilstedeværelsen af ​​synonymer, der bekræfter, at indholdet af den tekst søgning.Den vigtigste eksterne indikator anses for at være populær i det globale netværk, som tyder PageRank til Google, Yandex og TIC har Tor100 systemet Rambler.Det vil sige, hvor ofte siden gå til andre steder, er det bedre, hvis de er meget populære.Det er, hvad relevans.