Поисковое возможности сети интернет

Поисковые возможности Интернет

По мере развития Интернета обостряется парадокс — вероятность существования нужной информации возрастает, а возможность ее нахождения уменьшается. В принципе гипертекстовая природа WWW обеспечивает нахождение любой информации в процессе целенаправленного продвижения по ссылкам.

Наилучшим вариантом работы с информационными ресурсами Интернета является вариант, когда пользователь знает адрес сайта и получает возможность ознакомиться с его содержимым. Адрес сайта может быть получен с любых источников (например, рекламные объявления, желтые страницы и т.д.). Также на сайт можно прийти с помощью гиперссылок, рассматривая другие сайты. Опытный специалист в области информации всегда должен иметь список интересующих его сайтов. В этом случае ему придется только отслеживать появления новых интересующих его сайтов.

Если пользователь исследует новую проблему в бизнесе, ищет информацию среди ресурсов, которую он еще не освоил, то одним из основных методов является использование поисковой машины и каталогов. В этом случае может быть предложена следующая технология подготовки и проведения поиска:

  • Определение общей направленности запроса, т.е. его содержимое;
  • Определение регионов поиска (географических), т.к. для практических задач ценность информационных ресурсов может зависеть от его географического расположения;
  • Отбор поисковых машин. Качество выполнения этого этапа будет зависеть от опыта работы пользователя с поисковыми машинами;
  • Составление запросов к поисковым машинам — это наиболее сложный этап и для эффективного использования поисковых машин. Запрос составляется таким образом, чтобы область поиска была сужена до максимальной степени. Предпочтение должно отдаваться не одному расширенному запросу, а нескольким. Необходимо по ключевым словам составить тезаурус запроса, для чего необходимо хорошее знание предметной области, по которому выдается запрос;
  • Выполнение запроса и его уточнение. Анализ полученных результатов позволяет корректировать запрос с целью сужения областного поиска.

В связи с этим возникает потребность в программных средствах, эффективно решающих проблемы поиска необходимой пользователю сети Интернет информации. Эти средства должны быть:

  • максимально просты в обращении;
  • осуществлять поиск во всех информационных ресурсах, доступных через Интернет;
  • обеспечивать как можно большую релевантность, то есть соответствие найденной информации задаче поиска;
  • быстро приспосабливаться к условиям постоянного обновления информации и образования новых узлов сети.

Поисковые системы (поиск по входящим в узлы словам, являющимся серьезным расширением алфавитного каталога) не всегда удобны. Во многих случаях трудно или невозможно сформулировать ключевые слова, но если тематика точно известна, наиболее подходящим инструментом поиска оказываются каталоги (предметные указатели).

Разные поисковые системы отличаются друг от друга деталями, но не общими принципами (описание поисковых систем см. табл. 1).

Действие поисковых машин заключается в постоянном последовательном исследовании всех узлов Интернет, доступных данной системе поиска, со всеми их связями и ответвлениями. В связи с постоянным обновлением информации машина поиска регулярно возвращается через определенный срок (порядка месяца) к уже изученным узлам, чтобы обнаружить и зарегистрировать изменения. Вся прочитанная информация индексируется, то есть создается специализированная база данных, в которой закодированы все исследованные системой страницы Интернет.

Читайте также:  Посмотреть реальную скорость интернета

При поступлении запроса от пользователя машина поиска рассматривает всю индексированную информацию и выдает список документов, соответствующих задаче поиска. Найденные документы ранжируются в зависимости от местоположения ключевых слов (в заголовке, в начале текста, в первых параграфах) и частоты их появления в тексте.

Несмотря на схожий принцип работы, машины поиска различаются по языкам запроса, зонам поиска, глубине поиска внутри документа, методам ранжирования и приоритетов, поэтому применение разных поисковых машин дает различные результаты.

ажными показателями качества поисковой машины являются:

  • объем базы данных (количество документов);
  • скорость обхода Сети (с этим связана скорость обновления информации в базе данных);
  • алгоритм индексации (только по ключевым словам Web-страницы или по всему тексту, с учетом морфологии или без него, с поиском по тэгам HTML — заголовкам, ссылкам, подписям к изображениям и др.).

Обычно в поисковых машинах есть и дополнительные возможности (расширенный поиск, поиск похожих документов, ограничение области поиска), удобный пользовательский интерфейс и справочная система.

Мощная поисковая машина обходит всю сеть за несколько дней. При этом составляется весьма свежий и довольно подробный индекс — опись доступных ресурсов. При каждом новом цикле обхода индекс обновляется, и старые недействительные адреса удаляются. Однако автоматизированный подход приводит к тому, что в индекс могут попасть дубликаты (один и тот же документ на разных сайтах, в разных кодировках).

Каталожные и поисковые службы непрерывно совершенствуются в условиях жесточайшей конкуренции. Они снабжены справочными материалами по использованию.

Сервисы, составляющие портал, могут нести различную тематическую нагрузку. Портал, предоставляющий информацию и сервисы только по одной узкой теме, называется вертикальным, а портал, состоящий из разнотематических сервисов, — горизонтальным.

Главная задача любого портала — задержать пользователя как можно дольше, чтобы он провел там десятки минут и даже часы.

К отличительным особенностям хорошего образовательного портала можно отнести:

  • высокую посещаемость;
  • многоуровневость и многофункциональность;
  • развитая система ссылок и сквозной поиск;
  • высокоскоростной (быстрый) доступ к качественной информации;
  • развитые возможности персонификации;
  • хорошую систему защиты информации;
  • применение специальных средств для хранения данных и обработки запросов;
  • стилевое единство оформления всех страниц.

Кроме порталов большое распространение в сети получают тематические обзоры.

Периодическое использование каталогов и поисковых механизмов очень полезно как для разового информационного поиска, так и для постоянного слежения за новой информацией. Порталы более пригодны для профессиональной, деловой (или другой) коммуникации.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

Источник

Otvety_k_informatike / 16. Поиск информации в интернете

Информация, размещенная во Всемирной сети, исчисляется огромным количеством байт. Для поиска информации во Всемирной сети используются специальные веб-сайты – информационно-поисковые системы. Они позволяют по ключевым словам найти информационные ресурсы, связанные с ключевыми словами. Это может быть текст, содержащий ключевые слова, или графическое изображение одного из ключевых слов. Примерами информационно-поисковых систем являются системы Google и Yandex.

Читайте также:  Usb модем мобильный интернет для ноутбука

Поиск информации – одна из самых востребованных на практике задач, которую приходится решать любому пользователю Интернета.

Существуют три основных способа поиска информации в Интернет:

1. Указание адреса страницы.

2. Передвижение по гиперссылкам.

3. Обращение к поисковой системе (поисковому серверу).

Способ 1: Указание адреса страницы

Это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа или сайта, где расположен документ.

Не стоит забывать возможность поиска по открытой в окне браузера web-странице (Правка-Найти на этой странице…).

Способ 2: Передвижение по гиперссылкам

Это наименее удобный способ, так как с его помощью можно искать документы, только близкие по смыслу текущему документу.

Способ 3: Обращение к поисковой системе

Пользуясь гипертекстовыми ссылками, можно бесконечно долго путешествовать в информационном пространстве Сети, переходя от одной web-страницы к другой, но если учесть, что в мире созданы многие миллионы web-страниц, то найти на них нужную информацию таким способом вряд ли удастся.

На помощь приходят специальные поисковые системы (ихеще называют поисковыми машинами). Адреса поисковых серверов хорошо известны всем, кто работает в Интернете. В настоящее время в русскоязычной части Интернет популярны следующие поисковые серверы:Яндекс (yandex.ru), Google (google.ru) и Rambler (rambler.ru

Поисковая система — веб-сайт, предоставляющий возможность поиска информации в Интернете.

Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.

По принципу действия поисковые системы делятся на два типа: поисковые каталоги и поисковые индексы.

Поисковые каталоги служат для тематического поиска.

Информация на этих серверах структурирована по темам и подтемам. Имея намерение осветить какую-то узкую тему, нетрудно найти список web-страниц, ей посвященных.

Катало́г ресурсов в Интернете или каталог интернет-ресурсов или просто интернет-каталог — структурированный набор ссылок на сайты с кратким их описанием.

Каталог в котором ссылки на сайты внутри категорий сортируются по популярности сайтов называется рейтинг (или топ).

Поисковые индексы работают как алфавитные указатели. Клиент задает слово или группу слов, характеризующих его область поиска, — и получает список ссылок на web-страницы, содержащие указанные термины.

Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, разработанный Мэтью Грэйем из Массачусетского технологического института в 1993.

Как работает поисковой индекс?

Поисковые индексы автоматически, при помощи специальных программ(веб-пауков), сканируют страницы Интернета и индексируют их, то есть заносят в свою огромную базу данных.

Поисковый робот ( «веб-паук») — программа, являющаяся составной частью поисковой системы и предназначенная для обхода страниц Интернета с целью занесения информации о них (ключевые слова) в базу поисковика. По своей сути паук больше всего напоминает обычный браузер. Он сканирует содержимое страницы, забрасывает его на сервер поисковой машины, которой принадлежит и отправляется по ссылкам на следующие страницы.

Читайте также:  Виндовс 10 нет интернета хотя сеть есть

В ответ на запрос, где найти нужную информацию, поисковый сервер возвращает список гиперссылок, ведущих web-страницам, на которых нужная информация имеется или упоминается. Обширность списка может быть любой, в зависимости от содержания запроса.

Яндекс — российская система поиска в Сети. Сайт компании, Yandex.ru, был открыт 23 сентября 1997 года. Головной офис компании находится в Москве. У компании есть офисы в Санкт-Петербурге, Екатеринбурге, Одессе и Киеве. Количество сотрудников превышает 700 человек.

Слово «Яндекс» (состоящее из буквы «Я» и части слова index; обыгран тот факт, что русское местоимение «Я» соответствует английскому «I») придумал Илья Сегалович, один из основателей Яндекса, в настоящий момент занимающий должность технического директора компании.

Поиск Яндекса позволяет искать по Рунету документы на русском, украинском, белорусском, румынском, английском, немецком и французском языках с учётом морфологии русского и английского языков и близости слов в предложении. Отличительная особенность Яндекса — возможность точной настройки поискового запроса. Это реализовано за счёт гибкого языка запросов.

По умолчанию Яндекс выводит по 10 ссылок на каждой странице выдачи результатов, в настройках результатов поиска можно увеличить размер страницы до 20, 30 или 50 найденных документов.

Время от времени алгоритмы Яндекса, отвечающие за релевантность выдачи, меняются, что приводит к изменениям в результатах поисковых запросов. В частности, эти изменения направлены против поискового спама, приводящего к нерелевантным результатам по некоторым запросам.

Лидер поисковых машин Интернета, Google занимает более 70 % мирового рынка. Cейчас регистрирует ежедневно около 50 млн поисковых запросов и индексирует более 8 млрд веб-страниц. Google может находить информацию на 115 языках.

По одной из версий, Google — искажённое написание английского слова googol. «Googol (гугол)» – это математический термин, обозначающий единицу со 100 нулями. Этот термин был придуман Милтоном Сироттой, племянником американского математика Эдварда Каснера, и впервые описан в книге Каснера и Джеймса Ньюмена «Математика и воображение»(Mathematics and the Imagination). Использование этого термина компанией Google отражает задачу организовать огромные объемы информации в Интернете.

Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д.

Rambler Media Group — интернет-холдинг, включающий в качестве сервисов поисковую систему, рейтинг-классификатор ресурсов российского Интернета, информационный портал.

Rambler создан в 1996 году.

Поисковая система Рамблер понимает и различает слова русского, английского и украинского языков. По умолчанию поиск ведётся по всем формам слова.

Источник

Оцените статью
Adblock
detector