Mis on tekst

click fraud protection

Kirjutamise leheküljel otsingumootori või otsingukasti (peal ekraanil) brauseri sündmused hakkavad juhtuma, et on peidetud tavalised kasutajad.Kuidas siis valdav World Wide Web leida infot, ja mis on asjakohasust otsingutulemuste?Sõna pärineb ladina «relevo» ja vene keelde tõlgitud kui "tõsta" või "hõlbustamiseks".Ingliskeelse vastena mõistet - «tekst».Punktis 3.5.1 GOST 7,73-96 tähistab see mõiste, ja "asjakohane" ja "asjakohane" on sama määratlus, mis on tehtud vastavalt saadud teavet kasutaja poolt teabenõude.

See riiklik standard sisaldab muid kasulikke standardiseeritud terminoloogiat ja mõisteid, mis on seotud valdkonnas infootsinguks ja teabe edastamine automatiseeritud.Dokument aitab mõista tähendust palju sõnu informatsiooni, kirjastamine ja raamatukogu tegevuse, ja mitte ainult üksuse keeles, nagu "asjakohane".Mõiste "asjakohasus" ja "asjakohasus" ja lahti krüptida punkt 3.5.2 GOST 7,73-96.Neid tuleb käsitleda kui kirjavahetust saanud teavet andmete vajadus.See on sageli segi ajada mõistega tekst, mis on põhimõtteliselt pole tõsi, sest ühel juhul on küsimus taotluse täitmise ja teine ​​- vastavalt vajadustele.Samuti on vale küsimusele: "Mis on tekst?" Vastus, et mõiste on lähedane mõiste "väärtus", mis on praktilise tulemuse rakendatavust.

Aga kõik sama on andmeid?Otsingumootor kasutab armee robotid - omaette programme, külastades veebisaite ja säilitama andmeid nende kohta.Nimi on tuletatud ingliskeelsest sõnast «bot», mis on lühike «robot».Need programmid on leida uusi kohti ja siis minge avalehele ja sirvida sisu.Robotid õpivad lingitud koju (brauser on koormatud esimese) sisemised lingid.Ka programmi eest vaadata linke, mis viitavad muud alad, mis on väliseid linke.Salvesta see info edasi neid, avastada uusi kohti ja õppida, kuidas web ressursse seotud.Seega, nad on pidevalt õpib "map" World Wide Web.Aga milline on tekst?Mis see on pistmist eest?

Spetsiifilise näiteks näha, et pakutakse otsingumootorid Yandex ja Google.Küsimuse "Mis on tekst?" Väljaandmine Yandex leitud 28 miljonit vastuseid, ja Google ligi 155 tuhat.Võib öelda, et need kõik on nõudmistele ja vajadustele ei ole alati, see tähendab, asjakohasuse ei ole neid kõiki.Näiteks lehekülg Wikipedia tegevjuht selgitab see mõiste on kahtlemata kasulik ja kohas asjakohased ja ebaoluline kulud otsuste tegemisel ei kehti antud teemale.Palju selgem näide on, kui taotlus "käed üles", tähendas, et saada infot muusikaline grupp, Yandex on välja andnud 31 miljonit vastuseid ning nende seas on artikkel üleskutsega tõsta käed üles, nagu ta on, vastavalt terapeudid, väga kasulik.Selline vastus ei saa pidada asjakohasust, kuigi vastuseid 31 miljoni võttis ta väljaandmisel 586 positsiooni.

Seega mida suurem tähtsus teksti, seda suurem on tõenäosus, et see läheb alla esimese positsiooni otsingumootori vastuseid.See indeks on kvantitatiivne hinnang, kuid selle rakendamine algoritme erinevaid otsingumootoreid on erinevad ja tundmatu kasutaja ja nad muutuvad aja jooksul, nagu otsingumootorid üritavad ronida pingeread, püüab pakkuda asjakohasust informatsiooni, vähendades aega, et otsida seda.Loetakse väga oluline lehel sisestatud märksõna päringule vastava võib olla vahemikus 3-7%.Kuid see ei ole ainus kriteerium dokumendi asjakohasust.Need hõlmavad mitmeid sisemisi ja väliseid parameetreid.Sisemine näitajad (välja arvatud märksõna tihedus), on oma positsiooni teksti (sisestades pealkirja, lähedus pealkiri ja üksteisega, moodustades võimalik otsingu fraase), samuti juuresolekul sünonüümid, kinnitades, et teksti sisu otsing.Peamised väline indikaator peetakse populaarne ülemaailmne võrk, mis näitavad PageRank Google, Yandex ja TIC on Tor100 süsteemi Rambler.See tähendab, kui tihti lehele minna teiste alade, see on parem, kui nad on väga hinnatud.Seda tekst.