Разновидности поисковых систем в интернете
web list
система для профессионалов
- Статьи
- Виды поисковых систем
Виды поисковых систем
Любая поисковая система такая, как, например, Google или Yahoo, – это специальная программа, обеспечивающая жизнедеятельность интернет-пространства, а не просто название бренда. Существуют виды поисковых систем, отличных, прежде всего, географическим размещением, а кроме того, и тематикой информации, которая запрашивается пользователем, методами ее поиска и форматом выдаваемого контента – в виде текстов, аудио- или видеофайлов.
Основные типы поисковых систем
Поисковые системы разделяют на следующие типы:
- поисковые каталоги;
- рейтинговые системы;
- поисковые указатели.
Поисковые каталоги представляют собой дерево категорий и подкатегорий на разнообразные тематики. Их преимущество – в качестве собранного материала, ведь в каталогах собрана самая популярная, “классическая” информация по заданной теме. Именно поэтому желающим получить знания по новой незнакомой теме целесообразно обращаться к ним. Если ресурс современный и малоизвестный, то его может и не оказаться в каталоге. Ярким примером каталога является известный сайт Википедия (wikipedia.org), которая является справочником обо всем на свете.
Рейтинговые справочно-поисковые системы работают по принципу каталога, но выдачу искомой информации осуществляет, исходя из количества обращений пользователей. Становится понятным, что популярность ресурса – вот критерий отбора, который, к сожалению, далеко не всегда означает полезность, ценность и высокое качество информации. Такие системы более всего подходят для быстрого поиска новостей и материала развлекательного характера. Например, alexa.com как раз и является известной рейтинговой системой, оценивающей популярность интернет-ресурсов.
Поисковые указатели отличаются от прочих систем тем, что осуществляют поиск ресурсов по ключевым словам, поэтому именно от заданных в строке поиска слов зависит и качество результата. Ввиду большого количества синонимов, поиск может быть затруднен, если же ключевые слова были подобраны правильно, то для поиска конкретного материала такой запрос может быть очень эффективным. Итак, данный тип относится к большинству глобальных поисковых систем.
Поисковые системы сегодня включают все перечисленные задачи, кроме того, функции поиска постоянно совершенствуются, дабы выдавать релевантную – максимально соответствующую смыслу запроса – информацию. Постоянно совершенствуется алгоритм исключения неправдоподобных данных, а также борьба с “черными” оптимизаторами, занимающимися недобросовестным продвижением контента.
Кроме своих прямых функций, поисковая система, являясь порталом, на котором непосредственно размещается строка поиска, в которую вводится запрос, предоставляет пользователю информацию рекламного характера в рамках заданного запроса, предлагает данные соцсети, электронной почты, инструментов вебмастера и другие инструменты.
Пятерка наиболее популярных мировых поисковых систем
Популярность поисковой системы напрямую зависит от количества обрабатываемых запросов.
- На первом месте – Google, лидирующий с существенным отрывом, и имеющий около 115 миллиардов запросов в месяц, что составляет 70% от их общего числа.
- Второе место досталось китайской системе Baidu, которая обрабатывает 14,5 миллиардов запросов или 8% от общего объема.
- Третье место занимает Yahoo! – система, имеющая в своем распоряжении 8,6 миллиардов запросов.
- Bing – поисковик Microsoft – находится на четвертом месте с показателем обрабатываемых 5 миллиардов запросов.
- Замыкает пятерку лидеров Yandex, располагающий тремя миллиардами запросов для поиска.
Узконаправленные поисковые системы
Даже зная, что существуют различные виды поисковых систем, не каждый пользователь обращал внимание на существование систем узконаправленных, то есть ищущих строго определенную информацию.
И вот примеры таких систем:
- поиском музыки, видео и программного обеспечения занимается система Tagoo;
- существует файловая система FileSearch, ориентированная на поиск файлов на ftp-серверах;
- информацию по астрономии поможет найти Astronet;
- похожие на заданные изображения найдет Tineye;
- звуковые файлы разыскивает FindSounds;
- Wolfram Alpha, вообще, сразу отвечает на поставленные вопросы, а не занимается поиском ресурсов, правда не распознает русский язык;
- существует и специальный детский поисковик Agakids.
Бывают и другие поисковые системы – и популярные, и совсем уж экзотические. Среди привычных поисковиков, конечно, несомненным лидером является Google. В рунете конкуренцию ему составляют системы Rambler, Aport, Mail, Nigma и другие. Яндекс же остается его главным конкурентом.
Часто пользователи задаются вопросом, какая из поисковых систем лучше. Если сравнивать Google и Yandex, то первая система превосходит вторую по качеству и стабильности работы. Так, примером может быть “падение” Яндекса 19 августа 2011 года, когда с 17:00 в течение пяти часов невозможно было пользоваться ни одним его сервисом. В течение трех часов работа была возобновлена частично, а к десяти часам вечера – проблема уже полностью решена, однако, факт поломки, конечно, неприятен. Помимо этого, в Google содержится более актуальная, новейшая информация, поскольку система обновляется гораздо чаще, сайты здесь индексируются быстрее. Несмотря на это, и на тот факт, что Гугл стремительно пополняет ряды своих поклонников, Яндекс остается главной поисковой системой рунета.
Видео: Какие бывают поисковые системы
Похожие статьи:

Виды интернет рекламы и их особенности
Уже очень длительное время реклама является одним из самых действенных способов увеличить продажи всех категорий товаров. Но если еще недавно реклама была доступна только на бумажных носителях либо .
Англоязычные поисковые системы
Интернет — это уже такая неотъемлемая часть нашей жизни, как автомобиль, стиральная машина, сотовый телефон. Старшее поколение сетует, мол, молодежь совсем перестала читать, книги уходят в прошлое. .
Американские поисковые системы
Прошлый век был потрясающе плодотворен в создании множества ресурсов Всемирной паутины (интернета или World Wide Web). Огромное количество людей не только пользовались информацией, почерпнутой из .
Разновидности поисковых систем в интернете: разбираемся вместе
Здравствуйте, дорогие читатели! С вами Екатерина Калмыкова. Сегодняшняя статья будет посвящена такому понятию, как поисковая система, что это такое, для чего она нужна. Также мы подробно рассмотрим разновидности поисковых систем в интернете.
Если у вас возник вопрос: «Зачем мне знать про эти поисковые системы?», то я отвечу так. Когда вы едите вкусный суп в ресторане, хотелось бы вам знать, из каких ингредиентов он приготовлен, чтобы повторить его самостоятельно дома? Ведь если вас устраивает конечный результат, то есть вкус супа, то наверняка вам интересно было бы узнать, что привело к такому результату?
Также можно сказать и про работу с поисковой системой (ПС). Если вы в будущем создадите свой блог, то зная работу ПС вам не придется обращаться за помощью к специалистам. Вы сможете самостоятельно вести таким образом свой проект, чтобы поисковая система его видела и показывала другим пользователям. Ведь именно от этого будет зависеть посещаемость вашего ресурса и соответственно заработок.
Что такое поисковая система?
Поисковая система — это специальный ресурс в Интернете, который выдает информацию пользователю в соответствии с его запросом. То есть этот ресурс собирает все данные в глобальной сети, все веб-проекты и при поступлении от пользователя определенного запроса выдает необходимую искомую информацию путем направления его, например, на тематический блог или сайт.
Таким образом, после создания своего проекта ваша задача будет попасть в выдачу, то есть в «список» или базу поисковой системы. Поскольку продвижение сайта в интернете просто не возможно без использования какой-либо поисковой системы, поэтому вам необходимо будет позаботиться о качестве своего ресурса, о внутренней и внешней его оптимизации. Как это сделать мы поговорим в следующих статьях. Так что подпишитесь, чтобы не пропустить.
А пока, если вы решили создать свой блог, то рекомендую прочитать вот эти статьи:
Поскольку новые веб-ресурсы появляются практически каждый день, то соответственно и база поисковых систем должна постоянно обновляться. Каждый вновь созданный сайт должен проиндексироваться роботом. Говоря простыми словами, помощники ПС – роботы должны познакомиться с новым ресурсом и передать эти данные самой поисковой системе.
Ну, тут вы, наверное, догадались, что при посещения вашего блога роботом ему все должно понравиться. От этого гостя и будет зависеть ваша дальнейшая судьба.
Как сделать, чтобы робот от вашего проекта остался в полном восторге я расскажу в одной из следующих статей. Не пропустите, будет интересная и весьма любопытная информация, которой я с вами поделюсь.
Работа поисковых систем
Вся работа, связанная с ПС, начинается с ввода искомого запроса в поисковой строке. Что могут искать пользователи? Да что угодно, начиная от рецепта пирожков с капустой и заканчивая извечным вопросом «как заработать денег побольше ничего не делая».
Чтобы именно ваш ресурс выходил в качестве ответа на вопрос, необходимо опережать своих конкурентов. Для этого и нужно обратить особое внимание на продвижение своего проекта, куда входят такие мероприятия как написание качественного оптимизированного контента, то есть отвечающего на запросы статьи, улучшение поведенческого фактора, то есть чтобы вашему читателю было интересно находится на ресурсе, это улучшение юзабилити, то есть удобство посетителя и многие другие факторы. Это мы все научимся с вами делать.
Компоненты поисковых систем
А что же помогает поисковикам, например, тому же Гугл индексировать ваш ресурс?
- Агенты — это работники, выполняющий основную часть работу — индексируют и анализируют сайты.
- Пауки (spider) – программа, которая может скачивать страницы веб-ресурса и собирать общую информацию о нем.
- Кроулеры (crawler) – программа, отыскивающая все ссылки на страницах, переходя по которым разыскивает новые данные не знакомые поисковикам.
- Индексатор (indexer) – анализирует текст, заголовки, стиль и др.
- Роботы — индексируют страницы вашего контента, а также изучают разнообразные ссылки.
Для того чтобы индексация происходила так, как нужно вам вы и создаете специальный документ «robots.txt». Он позволяет системе проверять только те страницы, которые вам нужно, и убирать то, что видеть не следует.
Виды поисковых систем
Существуют несколько вариантов информационно — поисковых систем:
- Каталоги. Простое сравнение поиска – это книжная полка в библиотеке. Там все хранится в подкатегориях и категориях определенной тематики. Если вы попали в такой поисковик, то поверьте, информация, которую вы там найдете, будет более чем полезна и понятна для вашего восприятия. Догадались о каком распространенном сайте идет речь? Конечно же о википедии, которая собрала в себе целый справочник полезной информации.
- Поисковые указатели. Поиск в данных осуществляется за счет ключевых фраз. Это и удобно и неудобно одновременно. Думаю, меня поймут те люди, которые ищут, например, «Девушка показывает класс», чтобы найти как девушка показывает большой палец вверх, а в поиске вылезает что-то не очень приличное. Такой вид поиска характеризирует большую часть поисковых систем.
- Рейтинговые системы. Определяют вашу популярность за счет количества посещений. Конечно, не самый лучший критерий, так как не всегда учитывается полезность и качественность самого ресурса. Пример такой системы – это интернет ресурс alexa.com.
Поисковые сервера подразделяются также на общие и специализированные . Общие поисковики сортируют информационные данные без всякого отбора по всем известным им веб-ресурсам. К ним относятся Яндекс, Рамблер, Гугл. Специализированные — осуществляют сортировку по используемому языку.
Также поисковые системы могут делиться на региональное и мировое распространение .
На сегодняшний день все поисковики постоянно совершенствуют свои алгоритмы по отбору качественных, релевантных ресурсов.
Немного истории
В Рунете ПС появились в 1996 года – это Апорт и Рамблер. Годом позже в 1997 году образовался Яндекс, а еще годом позже в 1998 году появился еще один конкурент – Google. В настоящий момент наиболее популярные – это Яндекс и Google.
Какие же поисковики сейчас наиболее популярны?
Как вы видите, сейчас в России наибольшей популярностью пользуется Яндекс, наряду с Гугл и Мэйл.
Таким образом, вы можете увидеть топ поисков, на которые вам следует ориентироваться при создании и продвижении своего проекта.
Поисковая система Яндекс (Yandex)
Принцип работы следующий: в поисковую строку вводите искомый запрос, нажимаете «Найти» и смотрите выдачу. Яндекс подобрал вам 13 млн. ответов на ваш запрос. Искать можно также в картинках, видео, маркете (смотрим левую колонку).
Дополнительно вы можете настроить регион для поиска. Для этого необходимо в строке поиска нажать на значок рядом с крестиком и в окне фильтра выбрать нужный регион.
Поисковая система Гугл (Google)
Гугл работает по аналогии с Яндекс. Искать информацию можно в разных разделах: картинки, видео, новости, карты и т.д.
Если вы нажмете на «Инструменты поиска», то откроется панель с настройками, где вы можете выбрать регион, язык и за какое время осуществить поиск информации.
Теперь вы знаете, какие системы поиска существуют в интернете, также вы увидели самые популярные из них, и теперь, вооруженные информацией вы можете налаживать свои связи и взаимодействие с поисковиками.
На сегодня все. Как Вам статья?
Советую подписаться на обновление блога, чтобы не пропустить выход свежих новостей.
Поисковые системы Интернета, список Топ 14 лучших поисковиков
Мы рассмотрим поисковые системы Интернета, список лучших поисковиков в этой статье. Возможно Вы ещё новичок и не определились, какую именно поисковую систему использовать для поиска информации и работы в Интернете. С помощью этого обзора, Вы точно будете знать, какой поисковик лучше.
Что такое поисковая система в Интернете
Здравствуйте друзья! Существуют огромное количество поисковых систем в Интернете. Они исполняют только одну цель – поиск той или иной информации в Сети. В основном новички ещё не знают, что такое поисковая система в Интернете. Поэтому, подробно об этом расскажу.
Поисковая система – это программно-аппаратный комплекс для поиска различной информации (текст, видео, музыка, картинки, книги). Функции этой системы предназначены для поиска нужной информации, для любого пользователя Интернета.
Например, человек хочет найти какую-нибудь книгу. И вводит поисковый запрос в поисковой строке – «Скачать книги бесплатно». Так же можно написать её название. После этого, мы как обычно нажимаем «Enter» или на значок поиска «Найти» (Скрин 1).
Результат поиска нам выдал 12 000 000 результатов. Выбирать можно любой из них. Вот именно так и работает поисковая система. Дальше, мы будем рассматривать поисковые системы Интернета, список по рейтингу всех основных поисковых систем. Для безопасной работы в Сети, вероятно Вас могут заинтересовать несколько поисковиков, которые будут служить Вам для удобной и комфортной работы в Интернете.
Поисковые системы Интернета, список 2019 года
Перед тем, как пополнить поисковые систем списком, сделаем для начала небольшой обзор на топ 14 лучших поисковых систем 2019 года.
- Поисковая система Google. Она является самой популярной и известной во всём мире в том числе США и Европе.
- Поиск Яндекс. Эта российская поисковая система. В основном она имеет популярность в русскоязычном Интернете.
- Bing. Данный поиск в Интернете был разработан компанией Майкрософт. Его часто используют в США, Германии, и в Китае.
- Поисковик Yahoo. Данная поисковая «машина» Интернета не так популярна в России, как например в странах Индии, США, Индонезии и так далее.
- Китайская поисковая система Baidu. Этим поисковиком пользуются только китайцы. Поскольку у него полностью отсутствует перевод на русский язык.
Низкие по рейтингу поисковые системы
- AOL. Название данного поисковика Америка Онлайн. Это американский поисковик.
- ASK.COM. Такая поисковая система, немного похожа на ресурс Ответы Мейл ру. Только в виде ответов выдаёт полноценные статьи.
- EXCITE. Эта поисковая система, включает в себя не только поиск, но и различные сервисы. Например, Новости, погода, с помощью него можно узнать в какие страны ездят отдыхать и так далее.
- DuckDuckGo. Такая поисковая система позволяет пользователям «сидеть в Интернете» в приватной зоне.
- WOLFRAM ALPHA. Данный поисковик очень хорошо подойдёт студентам. Поскольку он выдаёт информацию на основе различных знаний и поможет Вам написать студенческие работы.
- Спутник. Поисковая система в основном предназначена для поиска в Рунете. Она потеряла свою популярность, поскольку ею никто не пользуется. Но со временем, на неё должны перейти государственные служащие.
- TUT BY. Поисковик относится к белорусской поисковой системе.
- Рамблер. Это встроенный поисковик в систему поиска Яндекса.
- MIL.RU. Русскоязычная поисковая система. Она популярна и её посещают не более чем 54 000 000 пользователей Рунета.
Итак, мы рассмотрели лучшие поисковые системы Интернета, список, которых Вы можете посмотреть здесь (Скрин 2).
Далее, мы эти поисковые системы разберём ещё подробнее.
Обзор поисковых систем Интернета
Выше мы сделали небольшое описание поисковых систем. А здесь, хотелось бы Вам рассказать о них немного подробно. Когда их создали, и какие у них плюсы и минусы:
- Google. Эта поисковая система была создана в США в 1998 году. Её создали программисты Сергей Брин и Ларри Пейдж. Сейчас она включает в себя более 25 миллиардов веб-сайтов и её используют 200 миллионов пользователей из разных стран мира. Плюсы этой поисковой системы в том, что можно найти качественную информацию быстрее, чем не качественную. Минусы – нагрузка на компьютер, так как частое обновление Гугла нагружает оперативную память компьютера.
- ЯНДЕКС. Её создали в 1997 году. Создатели этой поисковой системы – Аркадий Волож и Илья Сегалович. Занимает второе место по популярности в России. Плюсов у этой системы много и из них – использование электронной почты, кошелька Яндекс деньги, и быстрый доступ к любой информации. Компания установила фильтры поиска, но это не спасает пользователей посещать сомнительные сайты в Интернете. Это один главный минус и недостаток этого поисковика.
- YAHOO. Поисковик является более старым из всех поисковых систем, которые мы рассматриваем. Его создание принято считать в 1995 году, предпринимателями Джерри Янгом и Дэвидом Филом. Он является достаточно крупным Интернет порталом и у него есть только один минус – не устанавливается на компьютер, а используется через браузер.
- MAIL.RU. Эту поисковую систему организовали в 1998 году. Её авторы и создатели – Евгений Голанд и Владимир Шутов. Этот портал принадлежит крупной компании – Мейл Ру Групп. Так же включает в себя популярные проекты: Одноклассники, Вконтакте, Мой мир. Пользоваться этим поисковиком удобно. Но минусы в том, что электронная почта от Мейл не имеет хорошей защиты от взлома и нередко браузеры заражаются вирусной рекламой от этой системы.
- BING. Она была создана в 2009 году. Эта поисковая система работает, как на компьютерах, так и на Смартфонах. В большинстве случаев, ей выгодно пользоваться на телефонах, это считается её главным преимуществом.
Менее популярные поисковые системы
- DUCKDUCK.GO. Наличие поисковика на компьютере, позволит Вам использовать его в полной мере и вместе с этим сохранить свои конфиденциальные данные. Её создал предприниматель Гэбриель Вайнберг в 2006 году. Эта система не сохраняет во время поиска кэш и историю браузера.
- СПУТНИК. Как было уже сказано выше, это поисковая система пока ещё не всеми используется. Её создали в 2014 году, и создателем считают компанию Ростелеком. Эту поисковую систему, планирует использовать государство.
- РАМБЛЕР. Самый известный в Рунете поисковый портал. Создатель портала Дмитрий Крюков – 1996 год. Он существовал до 2011 года, и сейчас по-прежнему работает в полной мере, как поисковая система.
- BAIDU. Данную китайскую поисковую систему основали в 2000 году, предприниматели – Робин Ли и Эрик Сю. Этим поисковиком пользуется только китайское население. К нему очень негативное отношение во многих странах из-за рекламного вируса и нет возможности перевода языка.
- TUT BY. Данная поисковая система была создана в Белоруссии в 2000 году. Его основал журналист Сергей Дмитриев. Посещаемость поисковика уже превышает более 2 000 000 пользователей в этой стране.
Известные поисковики за рубежом
- AOL (Американская поисковая система). Была разработана в США в 90-е годы. У неё довольно слабая популярность среди пользователей. Работают с поисковиком, в основном, жители Америки.
- ASK.COM. Создание поисковой системы принято считать в 1995 году. Чтобы пользоваться этой системой, достаточно лишь внести в поисковую строку какой-либо вопрос, и она выдаст результаты. Её поиск распределяет результаты по порядку, и всегда можно найти необходимую информацию и качественную.
- ECITE. Данная поисковая машина, особо ничем от других не отличается. Сайт был запущен в 1994 году и в данный момент принадлежит компании IAC Search Media. Этот сервис может предлагать пользователям различную информацию в виде обмена быстрыми сообщениями, отправка писем по электронной почте, и имеет полную настройку домашней страницы в браузере.
- Wolfram Alpha. Он был запущен в Интернет – 15 мая 2009 года. Имеет огромную базу знаний, и мощные вычислительные алгоритмы для нахождения этой информации в поиске.
Итак, эти поисковые системы на сегодняшний день самые лучшие. Думаю, Вы сможете выбрать для себя подходящий вариант. Часто приходиться использовать несколько поисковиков для эффективного поиска нужной информации.
Заключение
В статье мы рассмотрели вопрос, какие есть поисковые системы Интернета, список этих поисковых систем в том числе. Возможно Вы заинтересуетесь одной из них, или будете использовать несколько. Выбирайте только те, которые имеют защиту и приватные настройки. Ведь работа и поиск в Интернете должны быть максимально безопасны. Спасибо и удачи!
Поисковые системы
Поисковые системы (ПС) уже давно являются обязательной частью интернета и нашей повседневной жизни. Сегодня они громадные и сложнейшие механизмы, которые представляют собой не только инструмент для нахождения любой необходимой информации, но и довольно увлекательные сферы для бизнеса.
Функции и понятие ПС
Поисковая система – это аппаратно-программный комплекс, который предназначен для осуществления функции поиска в интернете, и реагирующий на пользовательский запрос который обычно задают в виде какой-либо текстовой фразы (или точнее поискового запроса), выдачей ссылочного списка на информационные источники, осуществляющейся по релевантности. Самые распространенные и крупные системы поиска: Google, Bing, Yahoo, Baidu. В Рунете – Яндекс, Mail.Ru, Рамблер.
Рассмотрим поподробнее само значение запроса для поиска, взяв для примера систему Яндекс.
Запрос обязан быть сформулирован пользователем в полном соответствии с предметом его поиска, максимально просто и кратко. К примеру, мы желаем найти информацию в данном поисковике: «как выбрать автомобиль для себя». Чтобы сделать это, открываем главную страницу и вводим запрос для поиска «как выбрать авто». Потом наши функции сводятся к тому, чтобы зайти по предоставленным ссылкам на информационные источники в сети.
Но даже действуя таким образом, можно и не получить необходимую нам информацию. Если мы получили подобный отрицательный результат, нужно просто переформировать свой запрос, или же в базе поиска действительно нет никакой полезной информации по данному виду запроса (такое вполне возможно при заданных «узких» параметров запроса, как, к примеру, «как выбрать автомобиль в Туле»).
Самая основная задача каждой поисковой системы – доставить людям именно тот вид информации, который им нужен. Приучить же пользователей создавать «правильный» вид запросов к поисковым системам, то есть фразы, которые будут соответствовать их принципам работы, практически, невозможно.
Именно поэтому специалисты-разработчики поисковиков делают такие принципы и алгоритмы их работы, которые бы давали пользователям находить интересующие их сведения. Это означает, что система, должна «думать» так же, как мыслит человек при поиске необходимой информации в интернете.
Когда он вводит свой запрос в поисковую машину, он желает найти то, что ему надо, как можно проще и быстрее. Получив результат, пользователь составляет свою оценку работе системы, руководствуясь несколькими критериями. Получилось ли у него найти нужную информацию? Если нет, то сколько раз ему пришлось переформатировать текст запроса, чтобы найти ее? Насколько актуальная информация была им получена? Как быстро поисковая система обработала его запрос? Насколько удобно были предоставлены поисковые результаты? Был ли нужный результат первым, или находился на 30-ом месте? Сколько «мусора» (ненужной информации) было найдено вместе с полезными сведениями? Найдется ли актуальная для него информация, при использовании ПС, через неделю, либо через месяц?
Основные характеристики поисковых систем
Полнота.
Точность.
Еще одна основная функция поисковой системы – точность. Она определяет степень соответствия запросу пользователя найденных страниц в Сети. К примеру, если по ключевой фразе «как выбрать автомобиль» найдется сотня документов, в половине из них содержится данное словосочетание, а в остальных просто есть в наличии такие слова (как грамотно выбрать автомагнитолу, и установить ее в автомобиль»), то поисковая точность равна 50/100 = 0,5.
Чем поиск точнее, тем скорее пользователь найдет необходимую ему информацию, тем меньше разнообразного «мусора» будет встречаться среди результатов, тем меньше найденных документов будут не соответствовать смыслу запроса.
Актуальность.
Это значимая составляющая поиска, которую характеризует время, проходящее с момента опубликования информации в интернете до занесения ее в индексную базу поисковика.
К примеру, на следующий день после возникновения информации о выходе нового iPad, множество пользователей обратилась к поиску с соответствующими видами запросов. В большинстве случаев информация об этой новости уже доступна в поиске, хотя времени с момента ее появления прошло очень мало. Это происходит благодаря наличию у крупных поисковых систем «быстрой базы», которая обновляется несколько раз за день.
Скорость поиска.
Наглядность.
Наглядное представление результатов является важнейшим элементом удобства поиска. По множеству запросов поисковая система находит тысячи, а в некоторых случаях и миллионы разных документов. Вследствие нечеткости составления ключевых фраз для поиска или его не точности, даже самые первые результаты запроса не всегда имеют только нужные сведения.
Это значит, что человеку часто приходится осуществлять собственный поиск среди предоставленных результатов. Разнообразные компоненты страниц выдачи ПС помогают ориентироваться в поисковых результатах.
История развития поисковых систем
Когда интернет только начал развиваться, число его постоянных пользователей было небольшим, и объем информации для доступа был сравнительно невеликим. В основном доступ к этой сети имели лишь специалисты научно-исследовательских сфер. В то время, задача нахождения информации не была столь актуальна как сейчас.
Одним из самых первых методов организации широкого доступа к ресурсам информации стало создание каталогов сайтов, причем ссылки на них начали группировать по тематике. Таким первым проектом стал ресурс Yahoo.com, который открылся весной 1994-ого года. Впоследствии когда количество сайтов в Yahoo-каталоге существенно увеличилось, была добавлена опция поиска необходимых сведений по каталогу. Это еще не было в полной мере поисковой системой, так как область такого поиска была ограничена только сайтами, входящими в данный каталог, а не абсолютно всеми ресурсами в интернете. Каталоги ссылок весьма широко использовались раньше, однако в настоящее время, практически в полной мере утратили свою популярность.
Ведь даже сегодняшние, громадные по своим объемам каталоги имеют информацию о незначительно части сайтов в интернете. Самым известным и большим каталогом в мире был DMOZ (прекратил работу 14 марта 2017 года) имеет информацию о пяти миллионах сайтов, когда база Google содержит информацию о более чем 25 миллиардов страниц.
Самой первой настоящей поисковой системой стала WebCrawler, возникшая еще в 1994-ом году.
В следующем году появились AltaVista и Lycos. Причем первая была лидером по поиску информации очень длительное время.
В 1997-ом году Сергей Брин вместе с Ларри Пейджем создал машину поисковую Google как исследовательский проект в Стэндфордском университете. Сегодня именно Google, самая востребованная и популярная поисковая система в мире.
В сентябре 1997-ом году была анонсирована (официально) ПС Yandex, которая в настоящий момент является самой популярной системой поиска в Рунете.
Доля поисковых систем
Принципы работы поисковой системы
Модуль индексирования.
Данный компонент состоит из трех программ-роботов:
Spider (по англ. паук) – программа которая предназначена для того чтобы скачивать веб-страницы. «Паук» скачивает определенную страницу, одновременно извлекая из нее все ссылки. Скачивается код html практически с каждой страницы. Для этого роботы используют HTTP-протоколы.
«Паук» функционирует следующим образом. Робот передает запрос на сервер “get/path/document” и иные команды запроса HTTP. В ответ программа-робот получает поток текста, который содержит информацию служебного вида и, естественно, сам документ.
Извлекаются все ссылки из тэгов. Вместе с ними обрабатывают редиректы. Любая скачанная страница сохраняется в таком формате:
- URL скаченной страницы;
- дата, когда осуществлялось скачивание страницы;
- заголовок http-ответа сервера;
- html-код, «тела» страницы.
Crawler («путешествующий» паук). Данная программа автоматически заходит на все ссылки, которые найдены на странице, а также выделяет их. Его задача – определиться, куда в дальнейшем должен заходить паук, основываясь на этих ссылках или исходя из заданного списка адресов.
Crawler, исследуя найденные ссылки, ищет новые документы, еще не ставшие известными поисковой системе.
Indexer (робот-индексатор) – это программа, анализирующая страницы, которые скачали пауки.
Индексатор полностью разбирает страницу на составные элементы и проводит их анализ, применяя свои морфологические и лексические виды алгоритмов.
Анализ проводится над разнообразными частями страницы, такими как заголовки, текст, ссылки, стилевые и структурные особенности, теги html и др.
Таким образом, модуль индексирования дает возможность проходить по ссылкам заданного количества ресурсов, скачивать страницы, извлекать ссылочную массу на новые страницы из полученных документов и делать подробный их анализ.
База данных
Поисковый сервер
Это самый важный элемент всей системы, потому что от алгоритмов, лежащих в основе ее функциональности, прямо зависит скорость и, конечно же, качество поиска.
Поисковый сервер работает следующим образом:
- Запрос, который идет от пользователя подвергается морфологическому анализу. Информационное окружение любого документа, имеющегося в базе, генерируется (оно и будет в дальнейшем отображаться как сниппет, т.е. информационное поле текста соответствующего данному запросу).
- Полученные данные передают как входные параметры специализированному модулю ранжирования. Они обрабатываются по всем документам, и в итоге для каждого такого документа рассчитывается свой рейтинг, который характеризует релевантность такого документа запросу пользователя, и иных составляющих.
- В зависимости от условий заданных пользователем этот рейтинг вполне может быть подкорректирован дополнительными.
- Затем генерируется сам сниппет, т.е. для любого найденного документа из соответствующей таблицы извлекают заголовок, аннотацию, наиболее отвечающую запросу, и ссылка на этот документ, при этом найденные словоформы и слова подсвечивают.
- Результаты полученного поиска передаются осуществившему его человеку в виде страницы, на которую выдают поисковые результаты (SERP).
Все эти элементы тесно связаны между собой и функционируют, взаимодействуя, образовывая отчетливый, но достаточно непростой механизм функционирования ПС, требующий громадных затрат ресурсов.