Professional căutare pe internet complet, fiabilitate, viteza
Profesionale on-line de căutare: caracterul complet, fiabilitatea, viteza
Cu acest articol vom începe o mică serie de publicații referitoare la problema de a găsi informații pe internet. Interesul în ea continuă fără încetare pe toată durata de viață a rețelei. Cu toate acestea, punctul nostru de vedere asupra problemei va fi oarecum neconvențional - aceasta va fi de aproximativ o căutare profesionist. Aș dori să evite sunetul patos al cuvântului „profesional“. Acesta subliniază doar faptul că oamenii pentru care căutarea de informații a devenit parte a activității lor, nu întâlnesc probleme caracteristice episodic, „amatori“ de căutare. Dorința lor naturală devine pentru a depăși aceste probleme și de a dezvolta noi abordări eficiente pentru rezolvarea problemelor de căutare.
Trăsăturile unei căutări profesionale
Deci, în contrast cu situația când sunteți în căutarea pentru ceva pentru el, o căutare profesionist presupune executarea unor ordine, cu obligațiile care îi revin clientului. Aceste obligații sunt sursa a trei cerințe principale: sfera de cuprindere a resurselor; verificarea autenticității informațiilor primite de la rețea; de mare viteză de căutare;
Deci, dacă sunteți client, acesta poate solicita motorul de căutare pe lângă rezultatele, și chiar unele dintre garanțiile în conformitate cu cele de mai sus. Aceste garanții pot oferi cu siguranță o persoană bine informată despre complexitatea distribuției și circulația fluxurilor de informații on-line.
Scopul acestei și publicarea următoare va fi o discuție despre oportunitățile disponibile pentru motorul de căutare pentru a obține o performanță optimă în integralitatea, acuratețea și viteza de explorare. Să încercăm acum să identifice mai precis problemele existente
Controlul complet al resurselor de acoperire este o cerință logică, dacă decideți să conteste vizavi de ceea ce pare a fi „pentru a găsi ceva.“
O colecție scară largă de informații de pe Internet pe o problemă în multe cazuri, afișează motorul de căutare dincolo de spațiul de dezvoltare web la nivel în sânul bazelor de date accesibile-Telnet, teleconferinte regionale și alte repertoare de informații. Cunoașterea tuturor tipurilor majore existente în prezent de resurse web, înțelegerea specificului tehnice și tematice de conținut și de caracteristicile accesului acestora devine o condiție necesară pentru planificarea cu succes și efectuarea operațiunilor de căutare.
Viteza de căutare pe web. dacă nu iau în considerare caracteristicile tehnice ale conexiunii utilizatorului, aceasta depinde în principal de doi factori. Acest lucru este bun proceduri de planificare de căutare și abilități de a lucra cu tipul de resursă selectat. Prin elaborarea prospecțiuni planul se referă la alegerea serviciilor de căutare și instrumente care îndeplinesc specificul problemei și, cel mai important, secvența de aplicare a acestora în funcție de performanța estimată. După obținerea accesului la resursele corespunzătoare pe marginea de taiere se extinde capacitatea de a înțelege rapid structura și metodele de navigare sale. Motilității efectua acțiuni, combinație abilă de facilități de căutare și capacitatea de prelucrare a informațiilor clientului local și server pentru motorul de căutare este o abilitate necesară.
Materialul din acest articol va fi dedicat în principal problema complet al căutării efectuate.
Controlul complet al resurselor de acoperire. Tipuri de resurse Internet
Oricum, astăzi informația de pe Internet este accesat din diferite tipuri de surse. Planificarea unei căutări fără o imagine completă a spectrului și particularitățile de funcționare a acestora este posibil. Lista principalelor tipuri de resurse care pot fi folosite ca o hartă la planificarea procedurii de căutare este prezentată în figura 1. De fapt, întrebarea este în sens mai larg - despre principalele metode de prezentare, transmitere și prelucrare a informațiilor pe web.
De bază de resurse de informare și comunicare a Internetului
Fig.1. De bază de resurse de informare și comunicare a Internetului
Oferă acces la resursele de acest tip sunt discutate în mai multe manuale. materiale utile cu privire la acest subiect este, de asemenea, conținut în al doilea număr al revistei Computerpress acest an. Ne limităm aici la o scurtă descriere a fiecărui tip, concentrându-se pe tulpinile care pot suporta resursa atunci când caută pe web.
Câteva mai multe cuvinte pe serverele chat. Ca o regulă, o parte din lista deja codificate în programul client folosit ca, de exemplu, programul Microsoft NetMeeting.
Fig.2. Exemplu de interfață, accesibil prin intermediul bazei de date de protocol telnet Glasgow University Library (Marea Britanie).
Hypertext sistem de informații World Wide Web (WWW) și tehnologia sa de departe cea mai semnificativă în rețea și să continue ascensiunea. În tabloul de navigare de fapt copiat WWW Gopher-resurse, dar consecințele un detaliu mic, puțini ar fi putut anticipa. Acest detaliu - utilizarea de pagini web ca ușor de a crea un obiect compus, din care corpul este montat un mai simplu obiecte, destinate pentru afișarea simultană. Faptul că astăzi, în ultimul text al prezentei listă, hyperlink-uri, grafica, multimedia, cod software, formulare interactive, și mai mult în cele din urmă a determinat utilizarea comercială pe scară largă a WWW. Spider căutare Web condus bazat pe Web spațiu de sistem ajusta subtil pentru ei înșiși și a marcat de fapt o cheie tendetsiyu de dezvoltare a acestora. Este pe de o parte, că resursele de indexare mai studiu detaliat al motoarelor de căutare sunt supuse domeniul pagini web, containere format HTML. Pe de altă parte, intens dezvolta acele elemente de limbi de regăsire informații care susțin căuta în aceste domenii. Astăzi putem afirma cu o integrare profundă a motoarelor de căutare și a resurselor WWW bazate pe o singură tehnologie. Pe lângă cantitate enormă de informații de bază pentru prima dată WWW deosebit de acută a ridicat necesitatea existenței în paralel a unui număr de servicii de căutare identice, servind interesele utilizatorilor.
Motoarele de căutare, și indicele automat - la nivel mondial, locale, specializate (printre WWW) este un puternic sisteme de recuperare a informației, găzduite pe servere de acces gratuit. roboți lor speciale de software, păianjeni sau, în modul automat de scanare continuu rețele de informații bazate pe algoritmi predeterminate documentelor de index. Ulterior, pe baza create motoarele de căutare de baze de date indicele oferă utilizatorului acces la informațiile distribuite pe web site-uri. Acest lucru se realizează prin executarea de interogări de căutare în cadrul interfeței respective. capacitățile de cercetare recente ale motoarelor de căutare, chiar și cel mai puternic dintre ele, cum ar fi AltaVista, HotBot, sau, arată că resursele reale exhaustivității Wide Web-un singur sistem mondial nu depășește 30%. Planificarea pentru procedurile de căutare în spațiul WWW nu este trivial, și cu siguranță ar trebui să fie luate în considerare separat.
resurse de pe Internet prin prisma serviciilor de căutare
Dorința dezvoltatorilor de a înțelege interesele consumatorului este mai mult decât natural. Cu toate acestea, abordări eficiente pentru rezolvarea problemelor de căutare se află exact în penetrarea opusă - o analiză detaliată a intereselor înțelegere motor de căutare, intențiile și soluții tehnice, cultivate de către dezvoltator. În acest sens, atunci când se analizează principalele tipuri de resurse web, am încercat să menționăm pe cele care sunt încă atractive într-o măsură mai mare pentru furnizorii de conținut. Rolul unora dintre ele pentru a căuta nu par sarcini, la prima vedere, o semnificativă, dar această situație se poate schimba.
Istoria dezvoltării tehnologiei de Internet a arătat că starea de servicii de căutare, servind resursei de informații dintr-un anumit tip, este direct legată de faza a ciclului său de viață (vezi. Fig. 3).
Figura 3. Rețeaua de resurse de comunicare dinamica ciclului de viață al serviciilor de căutare aferente.
Pe scurt explica elementele de bază ale ciclului de viață al circuitului. Catalogarea atât proiectarea și integrarea colecții de link-uri către resurse de acest tip ar trebui să fie imediată pentru apariția vieții. Serviciul de indexare automată începe de obicei format numai în cazul unei mase de resurse de informații într-o oarecare volum critic. După această fază a competiției se execută servicii de căutare identice - cataloage și indicii de servire viață. Canonizarea suspendă în mod eficient procesul, oferind palma la unul sau mai multe motoare de căutare. Pasul final - resursa extincție - se caracterizează prin scurgere activă a informațiilor în domeniul mass tip operațiune de o altă resursă și până la stingerea completă.