- Методы и средства поиска информации в сети интернет
- Характеристика основных методов поиска информации в Интернете: использование гиперссылок, поисковых машин, специальных средств, новых ресурсов. Преимущества и недостатки работы поисковых машин. Рекомендации для эффективного поиска информации в сети.
- Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
- Подобные документы
- Методы получения первичной информации средствами сети Интернет
Методы и средства поиска информации в сети интернет
Характеристика основных методов поиска информации в Интернете: использование гиперссылок, поисковых машин, специальных средств, новых ресурсов. Преимущества и недостатки работы поисковых машин. Рекомендации для эффективного поиска информации в сети.
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Методы и средства поиска информации в сети интернет
Количество информации в Интернет растет в геометрической прогрессии.
По данным аналитической службы Netcraft (news.netcraft.com), в Интернете на февраль 2012 г. зарегистрировано 612 843 429 сайтов. За январь 2012 года количество сайтов увеличивалось почти на 32 миллиона (+5,2%).
Поиск информации в Интернете.
1. Получить полезную информацию;
2. Найти полезные ссылки на специализированные сайты.
1. Программы-браузеры Интернет (Internet Explorer, Opera, Firefox, Google Chrome);
2. Программы для захвата и каталогизации содержимого страниц:
— оффлайн-браузеры (Offline Explorer, Teleport Pro, WebCopier, «ДИСКо Качалка»);
— надстройки над браузерами (Internet Explorer Text Archiver, CacheX );
3. Программы для захвата и каталогизации ссылок на ресурсы в сети (Compass, LinkSync, Linkman, Links Organizer);
4. Программа почтового клиента для чтения почтовых рассылок;
5. Программы обеспечения безопасности при работе в сети.
Поисковая система — программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете.
В просторечии под поисковой системой подразумевают веб-сайт, на которой размещён интерфейс (фронт-энд) системы — yandex.ru, google.com.
Программной частью поисковой системы является поисковая машина (поисковый движок) — комплекс программ, обеспечивающий функциональность поисковой системы и являющийся коммерческой тайной компании-разработчика поисковой системы: Робот, Индекс, Программа обработки запросов.
Основные методы поиска информации в Интернете
1) Непосредственный поиск с использованием гипертекстовых ссылок (поиск информации производится путем последовательного просмотра связанных страниц с помощью браузера);
2) Использование поисковых машин (использовании ключевых слов, которые передаются поисковым серверам в качестве аргументов поиска: что искать);
3) Поиск с применением специальных средств (применении специализированных программ — спайдеров, которые в автоматическом режиме просматривают Web-страницы, отыскивая на них искомую информацию);
4) Анализ новых ресурсов (необходим при проведении повторных циклов поиска, поиска наиболее свежей информации или для анализа тенденций развития объекта исследования в динамике).
Большинство поисковых машин обновляет свои индексы со значительной задержкой, вызванной гигантскими объемами обрабатываемых данных, и эта задержка обычно тем больше, чем менее популярна интересующая тема.
Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.
Основные критерии качества работы поисковой машины:
— релевантность (степень соответствия запроса и найденного, то есть уместность результата);
История поисковых систем
Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, который создавал «World Wide Web Wanderer» — бот, разработанный Мэтью Грэем (англ. Matthew Gray) из Массачусетского технологического института в 1993. Также в 1993 году появилась поисковая система «Aliweb», работающая до сих пор. Первой полнотекстовой, то есть индексирующей ресурсы при помощи робота, поисковой системой стала «WebCrawler», запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице — с тех пор это стало стандартом во всех основных поисковых системах.
Средства поиска информации:
— Тематические каталоги ресурсов;
В каталогах информация о сайтах упорядочена в соответствии с рубрикатором. В отличие от простых подборок ссылок имеется механизм поиска. Работа поисковых механизмов ограничивается поиском в кратких аннотациях сайтов.
Кроме основных разделов многие каталоги имеют дополнительные разделы, в которых сайты классифицированы по другому основанию:
Информация о сайтах в каталоги может вноситься вручную как авторами сайта через механизм регистрации, так и модераторами — ведущими рубрик каталога. Преимущество каталога — создание списка «отборных» сайтов. Недостатки: неоднозначность структуры, требуется время для поиска нужной категории, количество сайтов в каталоге недостаточно большое.
Особенность каталогов в том, что они более эффективны при поиске подборок информации на определенную общую тему, например, «развитие образования», «состояние промышленности», но не при поиске ответа на конкретный вопрос!
Специализированные каталоги включают только ссылки на сайты определенной, узкой тематики. Подобные каталоги удобны для поиска информации по конкретной тематике. Пример специализированного каталога: RadioLink — каталог ресурсов о телекоммуникациях.
Универсальные каталоги позволяют производить поиск по различным темам. Информация сгруппирована по разделам. Каждый раздел имеет несколько подразделов.
Проблема классификации каталогов.
В настоящее время в интернете функционируют миллионы каталогов. Они неравнозначны по качеству исполнения, информационному содержанию и функциональности. Значительная часть каталогов не производит индексацию сайтов и, следовательно, не производит поиск по их содержимому. Необходимо различать обычные каталоги от «продвинутых».
«Продвинутые« каталоги отличаются расширенной, а иногда и полной индексацией содержимого сайтов. К имеющимся возможностям каталогов (рубрикатор и поиск по аннотациям) добавляются мощные механизмы поиска в материалах сайтов.
Поиск с помощью каталогов.
Вариант 1. Чтобы найти сайты по определенной теме, необходимо «пройтись» по дереву каталога, постепенно сужая область поиска. Самое главное — изначально определить, в каком разделе начинать поиск.
Вариант 2. Используйте поисковый механизм. Практически все каталоги содержат поисковый механизм, позволяющий искать информацию по ключевым словам или фразам в описаниях и даже содержимом сайтов.
Механизм работы поисковиков
Таким образом, после получения запроса поисковая система анализирует ту информацию, которую собрала ранее.
Преимущества: многократно повышается скорость обработки запроса.
Недостатки: область поиска ограничена внутренними ресурсами ПС, информация в базе данных быстро устаревает.
— Заголовок найденной страницы;
— Отрывок из текста страницы;
— Полный URL-адрес Интернет-страницы в сети;
— Размер страницы, дата последнего изменения;
— Ссылка на копию страницы в базе поисковой машины (сохранено в кэше);
— Рубрику каталога или рейтинга поисковой машины.
Современные наиболее быстродействующие поисковые системы стремятся произвести индексацию всего документа, а не только его названия и первых предложений текста. Наиболее совершенные роботы при индексации сканируют не только главную страницу, но и по гиперссылкам заходят вглубь сайта.
Этапы поисковой процедуры.
поиск информация интернет гиперссылка
1) Проверить орфографию в написании слова;
2) Использовать синонимы ключевых слов, если список найденных страниц слишком мал;
3) Проводить поиск больше, чем по одному слову. Максимально сузить предмет поиска;
4) Не начинать обычные слова с прописной буквы, кроме имён собственных;
5) Добавить к своему браузеру панели надстроек;
6) Для ускорения поиска отключить загрузку анимации, видео, звуки и картинок в браузере или воспользоваться облегченными версиями поисковых систем;
7) Настроить поиск: задать удобные параметры описания документов и структуру страницы с результатами поиска;
8) При необходимости использовать язык запросов, чтобы сделать запрос более точным.
Логическое И (в пределах предложения)
Логическое И (в пределах документа)
фото | фотография | снимок | фотоизображение
Обязательное наличие слова в найденном документе
(технология | изготовление) (сыра | творога)
Бинарный оператор И НЕ (в пределах предложения)
Бинарный оператор И НЕ (в пределах документа)
путеводитель по Парижу ~~ (агентство | тур)
Расстояние в словах (минус (-) — назад, плюс (+) — вперед)
поставщики /2 кофе музыкальное /(-2 4) образование вакансии ~ /+1 студентов
«красная шапочка» Эквивалентно: красная /+1 шапочка
Расстояние в предложениях (минус (-) — назад, плюс (+) — вперед)
Подобные документы
Характеристика методов поиска информации в Интернете, а именно — с использованием гипертекстовых ссылок, поисковых машин и специальных средств. Анализ новых интернет ресурсов. История возникновения и описание западных и русскоязычных поисковых систем.
Средства поиска информации в сети Интернет. Основные требования и методика поиска информации. Структура и характеристика поисковых сервисов. Глобальные поисковые машины WWW (World Wide Web). Планирование поиска и сбора информации в сети Интернет.
Организация поиска информации по заданной теме в сети Интернет. Поиск с помощью поисковых машин. Преимущества и недостатки метода поиска по ключевому слову (фразе). Поиск в каталогах информационных ресурсов. Преимущества и недостатки предметных каталогов.
Особенности поиска информации в Интернет: стратегия и методика. Поисковые машины, каталоги и порталы информационных ресурсов. Подбор и введение ключевых слов. Использование режима «расширенный поиск», который имеет каждая из поисковых систем в Интернете.
Методы и инструментарий хранения данных во Всемирной сети. Понятие и разновидности гипертекстовых документов и графических файлов. Принципы работы поисковых систем и правила поиска нужной информации. Характеристика некоторых поисковых систем Сети.
Общие принципы организации поиска информации в сети Интернет. Поиск с помощью каталогов информационных ресурсов и с помощью поисковых машин. Правила поиска информации, касающейся учета текущих обязательств и расчетов с покупателями и заказчиками.
Хранение данных в сети Internet. Гипертекстовые документы, виды файлов. Графические файлы, их виды и особенности. Поисковые системы и правила поиска информации. Обзор поисковых систем сети Internet. Все о поисковых системах Yandex, Google, Rambler.
Методы получения первичной информации средствами сети Интернет
Выделяют следующие виды опросов в режиме on-line: e-mail и Web-опрос. E—mailопрос — рассылка в почтовые ящики респондентам приглашений к участию в опросе. В письме может содержаться ссылка на сайт, где расположена анкета или собственно вопросник с приглашением заполнения опросного листа (рис. 4.2.). При проведении опроса респондентам присваивается личный номер, который позволяет отследить скорость и уровень ответной реакции респондента. Если респондент не ответил на анкету в течение какого то фиксированного времени, ему высылается напоминание об опросе. Рис. 4.2. ПримерE-mail опросаWeb– опрос. Анкета размещается на корпоративном сайте компании, и любой желающий, увидевший ссылку на проведение исследования, может принять участие в опросе. Опросы on-line используются для изучения количественного и качественного состава аудитории как всей сети, так и отдельных ее сегментов: социально-демографические и имущественные характеристики; для определения степени регулярности пользования сетевыми ресурсами; для определения целей посещения Интернет и различных сайтов. С помощью таких опросов можно выяснить степень известности различных сетевых ресурсов и источников получения информации о сетевых ресурсах, изучить отношения респондентов к тому или иному товару/услуге, представленной в сети, сразу после того, как человек принял решение совершить/не совершить покупку; можно провести исследование сайтов (привлекательность для посетителей, оценка нового дизайна, навигация сайта и т.п.) Например, маркетинговое агентство Step-by-Step (http://www.stepbystep.ru/) объявило о запуске нового Web-сервиса, ориентированного на сотрудников отдела маркетинга коммерческих компаний, а также рекламных и маркетинговых агентств. Оно заключается в организации проведения оперативных on-line опросов. Как утверждают организаторы исследований, уникальность данного предложения заключается в том, что, используя предлагаемый ресурс, заинтересованные компании могут при необходимости сегментировать потребителей, работать с высокой оперативностью (через 3-7 дней будут готовы результаты анкетирования) и за небольшие деньги (от $30) провести опрос, по результативности эквивалентный проведению полевого опроса. «Эти опросы, конечно, не претендуют на “супер-репрезентативность” 22 . Однако, если Вы оперативно хотите получить ответ на небольшой, но волнующий маркетолога вопрос, например, нравится ли определенной аудитории ролик прямо сегодня, или как они оценивают фразу «…» в рекламе — вполне можно. При этом с гарантией будет получено 50-200 анкет в день».