- 13. Поиск и обмен информацией в глобальных и локальных компьютерных сетях
- 13.1. Методы поиска и обмена информацией в глобальных компьютерных сетях
- Поиск информации в сети Internet Поисковые системы
- Организация и проведение поиска информации в Internet
- 2.4 Поиск информации с использованием компьютера. Программные поисковые сервисы. Передача информации между компьютерами. Виды связи. Автоматизированные системы управления
- 2.4.1 Поиск информации с использованием компьютера.
13. Поиск и обмен информацией в глобальных и локальных компьютерных сетях
13.1. Методы поиска и обмена информацией в глобальных компьютерных сетях
Само понятие информационного поиска появилось только в середине 20 века. В основе этого понятия лежит представление о том, что поиск необходимой информации в любом собрании документов невозможен путем прочтения или даже беглого просмотра текстов всех документов этого собрания.
Прочтение полного текста документа заменяется просмотром заглавий, аннотаций, рефератов. Документы пришлось систематизировать по содержанию, которое условно стали обозначать индексами (буквами или цифрами). Систематизация по разделам наук – один из первых способов раскрытия содержания документа.
С увеличением объемов документов ввели алфавитно-предметную классификацию.
До середины 20 века в библиотеках, в основном, ограничивались тремя способами: систематическим, предметным и алфавитным. В 50-года сформировалось само понятие информационного поиска.
Информационный поиск – это совокупность логических процедур, в результате которых в ответ на информационный запрос выдается:
— документы, в которых она находится;
— библиографические адреса этих документов.
Информационный поиск реализуется с помощью информационно-поисковой системы, которая в абстрактном виде должна состоять из информационно-поискового языка, правил перевода на этот язык и критерия смыслового соответствия, определяющего объем выдачи документов или информации (критерий выдачи).
Состав и принципы работы поисковой системы
В России основной поисковой системой является «Яндекс», Google.ru, Mail.ru. Причем, на данный момент, Mail.ru использует механизм и базу поиска «Яндекса».
Практически все крупные поисковые системы имеют свою собственную структуру, отличную от других. Однако можно выделить общие для всех поисковых машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов.
Модуль индексирования
Модуль индексирования состоит из трех вспомогательных программ (роботов):
Spider (паук) – программа, предназначенная для скачивания веб-страниц. «Паук» обеспечивает скачивание страницы и извлекает все внутренние ссылки с этой страницы. Скачивается html-код каждой страницы. Для скачивания страниц роботы используют протоколы HTTP. Работает «паук» следующим образом. Робот на сервер передает запрос “get/path/document” и некоторые другие команды HTTP-запроса. В ответ робот получает текстовый поток, содержащий служебную информацию и непосредственно сам документ.
Ссылки извлекаются из тэгов a, area, base, frame, frameset, и др. Наряду со ссылками, многими роботами обрабатываются редиректы (перенаправления). Каждая скачанная страница сохраняется в следующем формате:
- URL страницы
- дата, когда страница была скачана
- http-заголовок ответа сервера
- тело страницы (html-код)
Поиск информации в сети Internet Поисковые системы
Поисковая система– это система, которая занимается сбором информации о ресурсах Internet и ее систематизацией для того, чтобы упростить пользователю доступ к интересующей его информации.
- каталоги;
- поисковые машины;
- агент (паук или кроулер), которая сканирует Internet и собирает информацию;
- база данных, которая содержит собираемую информацию;
- поисковый механизм и интерфейс для взаимодействия с базой данных.
- Количество слов запроса в текстовом содержимом документа (т.е. в HTML-коде).
- Тэги, в которых эти слова располагаются (например, в )
- Местоположение искомых слов в документе (например, в начале страницы).
- Время – как долго страница находится в базе поискового сервера.
- Индекс цитируемости – как много ссылок на данную страницу ведет с других страниц, зарегистрированных в базе поисковой системы.
Организация и проведение поиска информации в Internet
- Сформулировать понятие о том, что ищете (в письменной форме).
- Уточнить категорию информации (общая, специальная и др.)
- Определить тип искомого ресурса (web-сайт, ftp-архив, e-mail адрес, документ и др.)
- Сформировать список ключевых слов, синонимов и отношений между ними.
- Выбрать инструментальное средство поиска.
- Выбрать способ поиска в поисковой системе.
- Выбрать поисковую систему.
- Выполнить поиск.
- Просмотреть найденные ресурсы.
- Создать закладки избранного.
- Изменить элементы стратегии поиска при необходимости (например, вернитесь к пункту 5).
2.4 Поиск информации с использованием компьютера. Программные поисковые сервисы. Передача информации между компьютерами. Виды связи. Автоматизированные системы управления
2.4.1 Поиск информации с использованием компьютера.
С каждым годом объемы Интернета увеличиваются в разы, поэтому вероятность найти необходимую информацию резко возрастает. Интернет объединяет миллионы компьютеров, множество разных сетей, число пользователей увеличивается на 15-80% ежегодно. И, тем не менее, все чаще при обращении к Интернет основной проблемой оказывается не отсутствие искомой информации, а возможность ее найти. Поэтому особенно актуально правильно и грамотно научиться искать информацию.
Чтобы найти нужную информацию, необходимо найти её адрес. Для этого существуют специализированные поисковые сервера (роботы индексов (поисковые системы), тематические Интернет-каталоги, системы мета-поиска, службы поиска людей и т.д.).
Технология поиска — Web-технология World Wide Web (WWW) считается специальной технологией подготовки и размещения документов в сети Интернет. В состав WWW входят и web-страницы, и электронные библиотеки, каталоги, и даже виртуальные музеи. При таком обилии информации остро встает вопрос: «Как сориентироваться в столь огромном и масштабном информационном пространстве?» В решении данной проблемы на помощь приходят поисковые инструменты.
Поисковые инструменты — это особое программное обеспечение, основная цель которого – обеспечить наиболее оптимальный и качественный поиск информации для пользователей Интернета. Поисковые инструменты размещаются на специальных веб-серверах, каждый из которых выполняет определенную функцию:
- Анализ веб-страниц и занесение результатов анализа на тот или иной уровень базы данных поискового сервера.
- Поиск информации по запросу пользователя.
- Обеспечение удобного интерфейса для поиска информации и просмотра результата поиска пользователем.
- Интерфейс поискового инструмента представлен в виде страницы с гиперссылками, строкой подачи запроса (строкой поиска) и инструментами активизации запроса.
- Индекс поисковой системы – это информационная база, содержащая результат анализа веб — страниц, составленная по определенным правилам.
- Запрос – это ключевое слово или фраза, которую вводит пользователь в строку поиска. Для формирования различных запросов используются специальные символы («», ~), математические символы (*, +, ?).
- определитесь с темой запроса;
- обращайте внимание на язык, грамматику. Важно также правильно сформулировать и вписать ключевые слова. Каждая поисковая система имеет свою форму составления запроса — принцип один, но могут различаться используемые символы или операторы. Каждая поисковая система имеет раздел «Help» («Помощь»), где присутствуют все синтаксические правила, а также рекомендации и советы по поиску;
- используйте возможности разных поисковых систем;
- чтобы исключить документы, содержащие определенные термины, используйте знак «-» перед каждым таким словом. Например, если Вам нужна информация о работах Шекспира, за исключением «Гамлета», то введите запрос в виде: «Шекспир-Гамлет». И для того, чтобы, наоборот, в результаты поиска обязательно включались определенные ссылки, используйте символ «+». Так, чтобы найти ссылки о продаже именно автомобилей, Вам нужен запрос «продажа+автомобиль». Для увеличения эффективности и точности поиска, используйте комбинации этих символов.
- каждая ссылка в списке результатов поиска содержит сниппет – несколько строчек из найденного документа, среди которых встречаются ключевые слова.
- помните, что поисковые системы не производят самостоятельную информацию. Поисковая система – это лишь посредник между обладателем информации (сайтом) и Вами.
- неэкранированная витая пара. Максимальное расстояние, на котором могут быть расположены компьютеры, соединенные этим кабелем, достигает 90 м. Скорость передачи информации — от 10 до 155 Мбит/с;
- экранированная витая пара. Скорость передачи информации — 16 Мбит/с на расстояние до 300 м.
- коаксиальный кабель. Отличается более высокой механической прочностью, помехозащищённостью и позволяет передавать информацию на расстояние до 2000 м со скоростью 2-44 Мбит/с;
- волоконно-оптический кабель. Идеальная передающая среда, он не подвержен действию электромагнитных полей, позволяет передавать информацию на большие расстояния.