Алгоритм роботи пошукових системВітаю Вас на моєму блозі Web'Stels. Ru, і сьогодні ми з Вами поговоримо про головну складову всього інтернету, про пошукових системах

Будь-яка пошукова система складається з таких основних компонентів як:

Crawler («Мандрівний» павук) — ця програма, дає можливість автоматично проходить по всіх наявних на сторінці посиланнях.

Database (База даних) — складається з сховища сторінок, які були викачані і оброблені.

Web server (Веб-сервер) — програма робить, взаємодія між відвідувачем і іншими компонентами пошукової машини.

Spider (Павук) — програма схожа на браузер, застосовується для скачування сторінок.

Indexer (Індексатор) — програма, що аналізує веб-сторінки, які були Завантажено роботами павуками.

Search engine results engine (Система видачі результатів) — алгорітмічность програма, за допомогою якої, витягуються результати пошукових запитів з бази даних.

Детальні принципи роботи пошукових систем, звичайно, відрізняється один від одного, але загальний алгоритм дій пошукових систем однаковий.

  • Spider. Павук — програма, завантажує веб-сторінки таким же чином, що робить і простий браузер. Розрізняються вони тим, що браузер показує сторінку, (текст, графіку і д.р.), а павук не володіє ніякими візуальних додатками і працює відразу з html-кодом сторінки (це можна побачити переглянувши html-код у Вашому домашньому браузері, для того щоб побачити простий html-текст).
  • Web server. Ми знаємо що, на сервері є html-сторінка з полем введення, в якому користувач задає потрібну йому інформацію. Веб-сервер крім того відповідає за видачу результатів пошуку відвідувачеві у вигляді html-сторінки.
  • Crawler. Здатний виділяє всі наявні посилання, які є на сторінці. Його завдання полягає у визначенні, куди слід далі йти павуку, на підставі посилань або на підставі заздалегідь отриманого списку адрес. Краулер, йде по виявленим посиланнях, здійснює пошук інших нових документів, ще поки невивчених пошуковою машиною.
  • Search Engine Results Engine. Система видачі результатів — її завдання полягає в ранжируванні сторінок. Саме вона визначає, які сторінки здатні задовольнити запитом клієнтів і користувачів, і як їх розсортувати.
  • Indexer. Індексатор розбиває сторінки сайтів на складові частини і вивчає їх. Він переглядає та аналізує різні складові елементи сторінок, в них входить структурні та стильові елементи, текст, заголовки, спеціальні html-теги і т.п.
  • Database. Це сховище всіх зібраних даних, які пошукова машина качає і робить аналіз. ЇЇ також називають як індекс пошукової машини.
  • Постовий: Відмінні спальні недорого!