Muturi di circata

Dâ Wikipedia, la nciclupidìa lìbbira.
Jump to navigation Jump to search

Nu muturi di circata è nu sistema automàticu ca tratta na matassa di dati spissu di iddu stissu cugghiuti e duna nu ìnnici dê cuntinuti dispunìbbili classificànnuli pi fòrmuli matimàtichi ca ni dìciunu lu gradu di rilivanza tràmiti na spicificata chiavi di circata.

Unu dê lochi unni nu muturi di circata veni addupiratu è chiddu di l'accussì diciuta Information Retrieval e ntô web.

Muturi di circata pô web[cancia | cancia la surgenti]

Ci sunnu assai mutura di circata prisenti ntô web. Chiddu ca veni attuarmenti cchiù addupiratu, nti scala munniali, è Google; assai addupirati sunnu macari Windows Live (muturi di circata dâ Microsoft) e Yahoo!. C'è di signalari macari lu tintativu di spummintari lu primu muturi di circata eurupeu, Quaero cuncurrenti di Google cu na nizziativa francu-girmànica. Lu pruggettu, valutatu 'n capu ê 400 miliuna di dollari, vinni abbannunatu doppu picca misi pâ rinunzia dâ cumpagnìa tidisca.

Li muturi di circata taliani megghiu addupirati sunnu Libero e Virgilio. Cumunqui nun si pò parrari di chistu propiu comu di mutura di circata picchì nun fannu àutru ca rinnirizzari pàggini di Google. Libero fa abbìdiri tunnu tunnu lu logu, ntô mentri Virgilio (ca urmai addivinìu nu redirect di Alice.it) addòpira li risurtati senza fari taliari la fonti, nun facennu àutru ca agghiùnciri sulu quarchi sò risurtatu spunzurizzatu.

Funziunamentu[cancia | cancia la surgenti]

La megghia parti dê mutura di circata ca travàgghianu ntô web è gistuta di cumpagnìi privati ca addòpiranu alguritmi sò e database tinuti ammucciati. Ci sunnu macari certiduni provi di spummintari mutura di circata funnati 'n capu lu software lìbbiru, ntra chisti: HTdig, Nutch, Egothor e OpenFTS.

Li Fasi[cancia | cancia la surgenti]

Lu travagghiu dê mutura di circata si sparti principarmenti nti tri fasi:

  • anàlisi dû locu d'azzioni (tràmiti l'addupiramentu di crawler fatti apposta)
  • catalugazzioni dû matiriali uttinutu
  • rispunnuta a chiddu ca circava l'utenti

Anàlisi[cancia | cancia la surgenti]

Pi taliari bonu lu web li mutura di circata addòpiranu certiduni prugrammi canusciuti comu crawler, ca si pìgghianu l'adenza di visitari automaticamenti li URI ca ci sunu ntô database e gghiri appressu li succissivi URI c'attròvanu dintra ê ducumenti taliati, agghiuncennu di vota e 'n vota ntô database tutti li nfurmazzioni ùtili dâ pàggina (lu cuntinutu tistuali, certiduni nfurmazzioni comu la data di l'ùrtimu aggiurnamentu, eccetra.).

Catalugazzioni[cancia | cancia la surgenti]

Doppu l'anàlisi dê pàggini, a secunna dê purtati ca càncianu di muturi 'n muturi, certiduni di chisti vèninu agghiunciuti ntô database e nti l'ìnnici dû muturi di circata.

La parti tistuali archiviata ntô mentri dâ fasi di l'anàlisi veni 'n sècutu taliata pi dari rispunnuti ê circati di l'utenti. Assai mutura di circata dùnanu macari dispunìbbili na copia dê nfurmazzioni tistuali di ogni pàggina archiviata pi quannu la risursa urigginali nun si pò taliari: stu funziunamentu è canusciutu comu Copia cache.

Rispunnuta[cancia | cancia la surgenti]

Rispùnniri ê dumanni di l'utenti cumporta lu bisognu di elincari li siti pi òrdini di rilivanza 'n cunfrontu â dumanna ricivuta.

Pi cunchiùdiri la rilivanza di nu situ vèninu taliati ntô database ddi ducumenti ca hannu la palora chiavi ca desi l'utenti, doppu di chistu ogni muturi di circata si servi dê sò alguritmi pi classificari li pàggini, cuntrullannu, p'asempiu, quantu voti li palori chiavi vèninu ripituti, quanti link ricevi ntô ducumentu, nti quali punti dê pàggini sunnu misi li palori chiavi, quanti siti dû database cuntèninu link a bbèri dda pàggina, o macari quantu voti n'utenti hà vidutu ddu situ doppu na circata.

Risurtati spunzurizzati[cancia | cancia la surgenti]

Li mutura di circata dùnanu macari risurtati spunzurizzati, pi megghiu diri ammùstranu megghiu ntê SERP (Search Engine Research Pages, Pàggini dê risurtati di circata) siti web di azzienni ca pàjanu p'arrisurtari ntê primi risurtati quannu si cèrcanu tèrmini (diciuti keyword o palora chiavi]] ca hannu chi fari ntô giru di l'azzienna stissa. Li risurtati spunzurizzati dê mutura ponnu cumpàriri macari ntê siti ca tràsinu ntê sò prugrammi di affiliazzioni. 'N manera particulari, Google pirmetti di fari cumpàriri ntê sò SERP (di certu spartuti dê risurtati "naturali") risurtati a pajamentu accattati cô prugramma AdWords. Comu junta a chistu offri macari nu sirvizziu di spunzurizzazzioni ca è vutatu a tutti li siti ca hannu ditirminati richisiti, canusciutu comu AdSense. Google AdSense (spissu simpricimenti accurzatu Google AS) addòpira li capacitati dû muturi di circata di analizzari lu tema dâ pàggina unni è misu lu giustu còdici pi furniri annunzi pi tema. Yahoo! Search annunziau l'arruvata di nu novu prugramma anàlicu chiamatu Panama.

Raffinazzioni dâ circata[cancia | cancia la surgenti]

La pussubbilità di raffinazzioni dâ circata cancia di muturi 'n muturi, ma la megghia parti pirmetti di addupirari upiraturi booleani: p'asempiu è pussìbbili circari "Ganimede AND satellite NOT coppiere" pi circari nfurmazzioni 'n capu Ganimede ntinnutu comu pianeta e nu comu fiura dâ mitoluggìa.

Nti Google e ntê mutura di circata cchiù muderni è pussìbbili raffinari la circata a secunna dâ lingua dû ducumentu, dê palori o sintenzi prisenti o assenti, dû furmatu dû file (Microsoft Word, PDF, Post Script, ecetra.), a secunna dâ data di l'ùrtimu aggiurnamentu e àutru ancora. È macari pussìbbili circari cuntinuti prisenti nti nu spicìficu situ, p'asempiu "Ganimede site:nasa.gov" va' cerca li nfurmazzioni 'n capu Ganimede ca ci sunnu ntô situ dâ NASA.

Pruspittivi di sviluppu[cancia | cancia la surgenti]

Li cchiù ricenti nnuvazzioni ntâ pruduzzioni di alguritmi e di sistem di Information Retrieval si jèttanu supra l'anàlisi simàntica dê tèrmini e ntâ siguenti spummintazzioni di riti simàntichi. Lu stissu Google havi adduttatu sistema pâ rilivazzioni di l'arruri e la cuntistualizzati dê risurtati.

È giustu quinni mmagginàrisi ca ntô giru di picca anni li mutura di circata vannu a jittari li sò ticnoluggìi sia 'n capu l'anàlisi quantitativa dê cuntinuti ca suprattuttu nti chidda qualitativa. Ntô futuru, li mutura di circata sunnu, p'asempiu, capaci di capiri lu significatu dâ palora "pisca" a secunna di quali è lu cuntestu unni va' a tràsiri la palora (capiri s'è lu fruttu, lu sport o àutri cosi). Pi muvìrisi a bbèri sta dirizzioni Google s'accattau Oingo (na vota canusciutu comu "lu muturi dê difinizzioni") e la ticnoluggìa di l'azzienna ca lu spummintau, l'Applied Semantics.

Liami nterni[cancia | cancia la surgenti]

Liami Esterni[cancia | cancia la surgenti]