Логический анализ сети интернет Шалак, Владимир Иванович
Шалак, Владимир Иванович. Логический анализ сети интернет : автореферат дис. . доктора философских наук : 09.00.07 / Шалак Владимир Иванович; [Место защиты: Ин-т философии РАН].- Москва, 2008.- 52 с.: ил. РГБ ОД, 9 08-2/312
Актуальность диссертационного исследования.
Возникновение и бурное развитие сети Интернет существенным образом повлияло на изменение форм многих видов человеческой деятельности, а также привело к появлению новых.
Посредством сети Интернет по-новому реализуется политическая деятельность, экономическая, научная, культурная, деятельность средств массовой информации. Появилась возможность вовлекать в нее широкий круг заинтересованных лиц, что приводит к значительному ускорению протекания многих социальных процессов.
Одной из важнейших функций сети Интернет является функция коммуникации между людьми. В обсуждении самых актуальных проблем принимают участие люди, физически разделенные странами и континентами, но объединенные посредством межкомпьютерной связи. Обмен самой последней научной информацией, новыми результатами, полученными в тех или иных областях, убыстряет развитие науки. Свободное обсуждение политических и социальных проблем, отсутствие запретных тем, делает жизнь более открытой и позволяет легче избегать конфликтных ситуаций.
Вместе с тем проявляются и негативные тенденции использования сети Интернет в качестве средства для ведения преступной деятельности, которая может быть направлена как против отдельных лиц, так и против различных социальных институтов.
Все это делает необходимым проведение глубокого анализа информационной структуры сети Интернет, ее теоретического осмысления. Одним из методов такого анализа является построение логических моделей с последующим их уточнением и развитием.
Параллелизм между протекающими в реальном мире процессами и их отражением в сети Интернет позволяет поставить вопрос о разработке методов изучения окружающего нас мира путем анализа распределения в глобальной сети различной тематической информации. Решение этой задачи позволило бы расширить ныне весьма ограниченный арсенал
точных методов, предназначенных для использования в гуманитарных науках.
Степень разработанности проблемы. До недавнего времени логическая активность в изучении сети Интернет была весьма ограничена. Она сводилась в основном к использованию весьма ограниченного фрагмента логики при построении языков запросов поисковых систем. В 2001 году было объявлено о проекте создания семантического Интернета (Semantic Web), в реализации которого важную роль должна сыграть именно логика. В этом проекте основной упор делается на такие способы представления информации в глобальной сети, которые были бы достаточно богаты и в то же время допускали эффективную машинную обработку. В настоящее время основная активность логиков приходится на разработку дедуктивного аппарата OWL и решение различных проблем сложности доказательств в этом языке.
Диссертанту неизвестны работы, в которых бы ставилась задача логического анализа существующей глобальной информационной структуры Интернет.
Цель и задачи исследовапия. Основная цель работы -построить логическую модель Интернет, способную послужить отправным пунктом для более детального анализа различных аспектов его информационной структуры. Для достижения поставленной цели в диссертации решаются следующие задачи:
Выделен минимальный набор предикатов, достаточный для построения реляционной модели Интернет.
Сформулирован первопорядковый язык для описания построенной модели.
Предложена аксиоматизация свойств построенной модели Интернет.
Рассмотрены дальнейшие направления исследований в области логического анализа информационной структуры Интернет.
На основе проведенного анализа показана недостаточность средств современной логики для
представления многих интересных свойств
распределения информации в сети Интернет.
Предложено альтернативное определение отношения логического следования.
Построена аксиоматизация отношения альтернативного следования для истинностнозначных булевых формул.
Предложено непосредственное квантитативное обобщение классической логики, которое в случае конечных моделей совпадает с элементарной теорией вероятностей для классического определения вероятности.
Проанализирована связь логики альтернативного следования и теории вероятностей.
Построена теоретико-категорная модель логики альтернативного следования.
На языке квантитативной логики анализируется работа поисковых систем Интернет.
Сформулирован ряд методов поиска квантитативных закономерностей распределения информации в сети Интернет.
На конкретных примерах, использующих предложенные методы, продемонстрирована возможность
Научная новизна работы. Основные результаты, выносимые на зашиту. Новизна состоит в первую очередь в выборе самого объекта исследования. Для достижения поставленных целей наряду с аппаратом современной символической логики понадобилось сформулировать и обосновать право на существование отношения альтернативного логического следования и квантитативной логики.
Были получены следующие новые результаты, выносимые на защиту:
1. Показано, что для построения реляционной модели сети Интернет, понимаемой как Всемирная Паутина (World Wide Web), в качестве базисного множества, над которым определяются все остальные предикаты, может быть
взято множество всех слов в некотором фиксированном
алфавите. Минимальный набор свойств модели задается
следующими предикатами. Одноместный предикат
Address выделяет множество слов, являющихся URL-
адресами. Одноместный предикат Body выделяет
множество слов, являющихся текстовым содержанием
Интернет-страниц. Одноместный предикат Time
выделяет множество слов, служащих представлением
моментов времени. Одноместный предикат Numeral
выделяет множество слов, являющихся представлением
натуральных чисел. Четырехместное отношение Page
представляет Интернет-страницу, связывая между собой
Интернет-адрес страницы, ее текстовое содержание,
момент времени, когда она была создана и множество
ссылок на другие страницы Интернет. Двухместное
отношение Site представляет сайты сети Интернет. Оно
связывает между собой адрес главной страницы сайта с
адресами страниц, которые его составляют. Двухместное
отношение Domain соотносит имя домена с множеством
относящихся к нему адресов. Одноместный предикат
Request выделяет множество слов, являющихся
правильно построенными запросами поисковых систем.
Двухместное отношение Sat определяет семантику
запросов поисковых систем, соотнося запросы с
множеством адресов удовлетворяющих им Интернет-
страниц. Трехместное отношение SE представляет
поисковые системы Интернет. Каждому запросу
сопоставляется оценка количества удовлетворяющих ему
Интернет-страниц и множество адресов таких страниц с
указанием на момент времени, когда они были занесены
в базу данных поисковой системы.
2, В языке прикладного исчисления предикатов первого
порядка с равенством построена аксиоматизация свойств
модели Интернет. Доказаны теоремы
непротиворечивости и полноты относительно предложенной модели.
- Сформулировано понятие альтернативного логического следования для языка булевых формул. В его основе лежит не сохранение истинностных значений от посылок к заключению, как это принято в классической и многих других логиках, а условие достаточности знания истинностных значений посылок для определения истинностного значения заключения. Предложена система аксиом логики, соответствующей данному отношению следования, доказывается ее непротиворечивость и полнота.
- Сформулировано функциональное обобщение альтернативного отношения логического следования. Проанализирована его связь с классическим отношением следования, введено понятие протологики, определена категорная семантика.
- Построена семантика квантитативной логики, в которой формулам языка сопоставляется не множество возможных миров, а их количественная оценка. Данная логика является прямым обобщением логики альтернативного следования и в свою очередь теснейшим образом связана с теорией вероятностей.
- С использованием языка квантитативной логики проведен углубленный анализ запросов поисковых систем. Предложен ряд методов поиска закономерностей распределения информации в сети Интернет, коррелирующих с закономерностями реального мира.
Теоретическое и практическое значение диссертации.
Теоретическая значимость работы заключается в построении реляционной логической модели сети Интернет, которая может послужить отправным пунктом для дальнейших исследований в данной области. Предложенное строгое определение понятия альтернативного логического следования позволяет по-новому взглянуть на природу самой логики. Понятие квантитативного следования и квантитативной логики, представленные в диссертации, могут послужить отправной точкой для нового направления логических исследований.
Результаты работы могут найти применение в учебном процессе при подготовке спецкурсов по логике, предназначенных для студентов, и аспирантов высших учебных заведений.
Предложенные методы поиска закономерностей в сети Интернет могут быть использованы в практической работе социологов и политологов.
Апробация работы. Проблематика диссертационного исследования неоднократно обсуждалась на семинаре в секторе логики Института философии РАН.
Ряд результатов исследования докладывался на конференции по проблемам обработки больших массивов текстовых документов (Москва, 2001), на международных конференциях «Смирновские чтения» (Москва, 1999, 2003), на международных конференциях по современной логике (СПб, 2000, 2006).
Основные результаты диссертационного исследования отражены в научных публикациях автора, в том числе в трех монографиях — «Современный контент-анализ», «Логический анализ сети Интернет» и «О понятии логического следования».
Структура диссертации. Диссертация состоит из введения, трех глав, заключения, списка литературы и приложения.
Логический анализ сети интернет
Расширенный поиск
Скачать
Логический анализ сети Интернет
ИФ РАН
Шалак В.И. Логический анализ сети Интернет / РАН. Ин-т философии. – М.: ИФ РАН, 2005. – 96 с.
Предоставлено Институтом философии РАН
Аннотация
Монография посвящена вопросам анализа и построения логических моделей сети Интернет с целью более полного извлечения содержащейся в нем информации. Основной акцент делается на возможность извлечения не фактической информации, как это делается в настоящее время, а аналитической, явным образом не представленной в глобальной сети.
Книга предназначена для логиков, философов, специалистов по искусственному интеллекту и IT-технологиям, для исследователей, интересующихся возможностями применения точных методов в гуманитарных науках.
1. Аксиоматизация Интернет
Что мы будем понимать под сетью Интернет?
Что существенно для нашего анализа?
Логическая модель Интернет
Язык описания модели
Интерпретация
Аксиомы
Примеры использования языка
2. Анализ запросов поисковых систем
Алгебраическая модель
Об отношении логики и теории вероятностей
Вероятностная модель запросов
Подтверждение и принятие гипотез
Практический пример 1
Ряды событий
Практический пример 2
Практический пример 3
Практический пример 4
3. Математические методы контент-анализа
Что такое контент-анализ?
Оценки частот
Условные частоты
Нормы
Контекстный анализ
Связи категорий
Контент-мониторинг
4. Приложения
1. Комбинированная логика запросов
2. Алгоритм построения аналитических запросов
3. Технология прогноза
4. Летний банковский кризис 2004 года
Литература