STATISTICA Automated Neural Networks (Автоматизированные нейронные сети). Нейронные сети

Эти книги можно приобрести в офисе StatSoft .

Популярное введение в современный анализ данных и машинное обучение на Statistica

В.П. Боровиков

Объем: 354 стр.

Цена: 1000 руб.

Популярно и увлекательно освещены современные возможности анализа данных и машинного обучения, являющегося трендом современной компьютерной аналитики. В изложении упор сделан на понимании методов и их применении к практическим задачам. "Делайте вслед за нами, и вы научитесь анализировать данные!" - основной лейтмотив книги.

Подробно описаны классические статистические методы, включая многомерные методы: кластерный, дискриминантный анализ, множественная регрессия, факторный анализ, метод главных компонент, анализ выживаемости и регрессия Кокса. В отдельных главах изложены нейросетевые методы, методы добычи данных, деревья классификации и регрессии (CART - модели). Рассмотрены примеры из различных областей человеческой деятельности: промышленности, ритейла, инфокоммуникаций, бизнеса, медицины. Специальные главы посвящены теории вероятностей и методам оптимизации, лежащим в основе методов машинного обучения.

Для широкого круга читателей: инженеров, технологов, менеджеров, аналитиков, врачей, исследователей, интересующихся современными аналитическими методами и технологиями анализа данных и машинного обучения и их применением на практике.

Популярное введение в современный анализ данных в системе STATISTICA

В.П. Боровиков

Объем: 288 стр.

В уникальной книге научного директора StatSoft Владимира Боровикова собрано все лучшее, что известно в области анализа данных.

На простых, ясных примерах из бизнеса, маркетинга, медицины описаны современные методы анализа данных - визуальный анализ и графическое представление данных, описательные статистики, методы классификации и прогнозирования.

Книга является образовательным стандартом в области анализа данных в ведущих вузах России: НИУ МИЭМ ВШЭ, МГУ, Кубанский государственный университет и др.

Большое внимание уделяется систематике анализа данных, начиная от описательного анализа, чистки и верификации данных, визуального представления, группировки и методов классификации до новейших технологий нейронных сетей и data mining, позволяющих найти закономерности в ваших данных.

Теория вероятностей, математическая статистика и анализ данных: Основы теории и практика на компьютере. STATISTICA. EXCEL. Более 150 примеров решения задач

Халафян А.А., Боровиков В.П., Калайдина Г.В.

Объем: 320 стр.

Цена: 600 руб.

Отправить заявку можно по адресу

Современный уровень развития компьютерных технологий позволяет изучение теории вероятностей и математической статистики вывести на новый образовательный уровень, сделав упор на прикладную часть дисциплины – математическую статистику и компьютерный анализ данных.

В учебном пособии изложены элементы комбинаторики, различные способы вычисления вероятностей, даны понятия случайной величины, ее функциональные и числовые характеристики. Теоретический материал сопровождается примерами и специально подобранными задачами, позволяющими глубже изучить материал. В отдельной главе описано использование Excel и STATISTICA для решения прикладных задач. Excel входит в состав Microsoft Office и на сегодняшний день является одним из наиболее популярных приложений в мире. STATISTICA занимает лидирующее положение среди программ анализа данных, имеет более миллиона пользователей по всему миру. Программа полностью русифицирована, создан Интеллектуальный портал знаний, который представляет глобальный мультимедийный ресурс для широкого круга пользователей: школьников, студентов, аспирантов – всех желающих развить свой интеллект, познакомиться с современными технологиями компьютерного анализа данных.

Учебное пособие адресовано широкому кругу учащихся и преподавателей, студентам, бакалаврам гуманитарных и естественно-научных специальностей нематематического направления, изучающих высшую математику.

Нейронные сети STATISTICA Neural Networks : Методология и технология современного анализа данных

Под ред. В.П. Боровикова

Объем: 392 стр.

Отправить заявку можно по адресу

В книге изложены нейросетевые методы анализа данных, основанные на использовании пакета STATISTICA Neural Networks , полностью адаптированного для русского пользователя.

Даны основы теории нейронных сетей; большое внимание уделено решению практических задач, всесторонне рассмотрена методология и технология проведения исследований с помощью пакета STATISTICA Neural Networks мощного инструмента анализа данных, построения зависимостей, прогнозирования, классификации.

В настоящее время нейронные сети интенсивно используются в банках, промышленности, маркетинге, экономике, медицине и других областях, где требуется прогнозирование и углубленное понимание данных. Общепризнанно, что нейронные сети являются естественным дополнением классических методов анализа и применяются там, где стандартные процедуры не дают нужного эффекта.

Книга содержит множество примеров анализа данных, практические рекомендации по проведению анализа, прогнозирования, классификации, распознавания образов, управления производственными процессами с помощью нейронных сетей.

Книга будет полезна для широкого круга читателей, занимающегося исследованиями в банковской сфере, промышленности, бизнесе, геологоразведке, управлении, транспорте и других областях.

STATISTICA : искусство анализа данных на компьютере (2-ое издание)

+ Мультимедийный Учебник StatSoft

В. П. Боровиков

Объем: 700 стр.

В настоящее время книга отсутствует в продаже. В ближайшее время планируется новое издание книги. Ваши заявки, пожалуйста, направляйте по адресу:

Книга является самым фундаментальным текстом по современному анализу данных и включает около 700 страниц описания методов и процедур анализа данных. Второе издание книги дополнено новыми материалами, не включенными в предыдущую версию книги, в частности: описан анализ мощности, оценка объема выборки, частные корреляции, анализ главных компонент, дана новая интерпретация нейронных сетей и многое другое. К книге прилагается компакт-диск, на котором Вы найдете демо-версии программных продуктов StatSoft, примеры анализа данных, знаменитый электронный учебник StatSoft, учебник по промышленной статистике, материалы обучающих курсов, а также огромное количество данных для обучения и проведения самостоятельных исследований.

Главную особенность второго издания представляет новая глава о языке STATISTICA Visual Basic (SVB), расширяющем возможности системы STATISTICA и позволяющем пользователям создавать собственные приложения.

В книге на примере реальных данных подробно описаны основные понятия анализа данных в системе STATISTICA : дескриптивный и визуальный анализ, анализ таблиц сопряженности, построение зависимостей, множественная регрессия, анализ выживаемости, непараметрические методы, анализ соответствий, нейронные сети, классификация и прогнозирование с помощью нейронных сетей, контроль качества, планирование экспериментов, включая самые разнообразные планы и многое другое.

Особенность книги состоит в том, что Вы не только видите результаты анализа, но и можете повторить их вслед за нами на системе STATISTICA , таким образом, используя новейшие компьютерные технологии анализа данных от StatSoft, Вы учитесь шаг за шагом анализировать и понимать данные.

Данное фундаментальное издание рассчитано на самый широкий круг читателей и пользователей системы STATISTICA , желающих стать профессионалами в анализе данных в различных областях: бизнесе, маркетинге, финансах, управлении, экономике, промышленности, страховании, медицине и других приложениях.

Прогнозирование в системе STATISTICA в среде WINDOWS

В.П. Боровиков, Г.И. Ивченко

Объем: 368 стр.

В настоящее время книга отсутствует в продаже.

Секреты прогнозирования из первых рук.

Особенностью книги является сочетание двух взаимосвязанных и взаимодополняющих друг друга частей: практической, в которой подробно, с переводом основных опций и диалоговых окон, описано прогнозирование в современной версии системы STATISTICA , и теоретической, в которой изложены основные идеи, методы и результаты теории стохастического прогнозирования.

По мнению авторов, синтез теории и практики должен привести к тому, что читатель не только механически осваивает методы и приемы прогнозирования, а получает связанное представление о них: от знакомства с математическими основами до приобретения практических навыков в системе STATISTICA .

В основе книги лежит курс, читаемый авторами в Московском государственном институте электроники и математики (МГИЭМ - Технический Университет). Приложение содержит исчерпывающий англо-русский словарь основных терминов по прогнозированию.
Книга ориентирована на научных работников, аналитиков и специалистов, использующих методы прогнозирования в повседневной деятельности, а также может быть использована преподавателями высших учебных заведений при чтении курсов по прогнозированию и математической статистике.

Геостатистика. Теория и практика

В.В. Демьянов, Е.А. Савельева

Объем: 327 стр.

В настоящее время книга отсутствует в продаже.


Эта книга ответит на вопросы:
- что такое геостатистика?
- какие существуют методы пространственной интерполяции?
- что такое кригинг?
- чем полезна вариограмма?
- зачем нужно стохастическое моделирование?
и многие другие

В монографии подробно изложены методы геостатистики и смежных разделов пространственного моделирования. Изложение теории сопровождается примерами использования моделей в различных областях: экологии, геологии, гидрогеологии, нефтедобыче, энергетике, оценке рыбных запасов и т. п. В заключительном разделе очерчены основные направления развития современной геостатистической теории. Издание может быть использовано в качестве учебного пособия.

Материал книги излагается с постепенным усложнением. Для закрепления полученных знаний имеются вопросы и упражнения. В книгу включены приложения, позволяющие использовать её как справочник по геостатистике.


Академия Анализа Данных StatSoft также предлагает широкий выбор курсов по современным методам и технологиям анализа данных в области геоаналитики.

Промышленная статистика. Контроль качества, анализ процессов, планирование экспериментов в пакете STATISTICA

Халафян А.А.

Объем: 384 стр.

В настоящее время книга отсутствует в продаже.


Настоящее издание посвящено описанию статистических методов, которые позволяют при ограниченных объемах анализируемых изделий с заданной степенью точности и достоверности судить о состоянии качества выпускаемой продукции. Статистический анализ качества продукции обеспечивает принятие верных управленческих решений не на основе интуиции, а при помощи научных методов выявления закономерностей в накапливаемых массивах числовой информации.

В учебнике рассмотрены такие разделы промышленной статистики, как: карты контроля качества; анализ процессов; шесть сигма; планирование экспериментов в среде широко известного во всем мире пакета STATISTICA . Дано подробное описание технологии работы с модулями программы.

Издание адресовано студентам направлений "Экономика", "Управление качеством", "Стандартизация и метрология", "Метрология, стандартизация и сертификация", аспирантам, научным работникам, преподавателям вузов, аналитикам и управленцам, а также всем, кто интересуется статистическими методами в управлении качеством.

Как выиграть мировой чемпионат. Методы математической статистики в управлении национальным футболом

Петрунин Ю.Ю., Рязанов М.А.

Объем: 56 стр.

В настоящее время книга отсутствует в продаже.


Современные методы статистики и анализа данных привели к созданию новых научных дисциплин – футболономики и футболометрии. Используя разработанный в них аппарат, можно оценить качество работы государственных (Министерство спорта) и некоммерческих организаций (футбольных ассоциаций и союзов), разработать и применить методы регулирующих воздействий, способных поднять уровень национального футбола и его престиж на мировой арене.

STATISTICA – Краткое руководство пользователя

Объем: 250 стр.

В настоящее время книга отсутствует в продаже.

В книге изложены основные принципы работы с системой, рассматриваются панели инструментов, пользовательский интерфейс, файлы данных, практические примеры использования пакета. Отдельная глава посвящена настройке системы. Также книга содержит исчерпывающий справочник, который представляет собой краткие сведения о наиболее часто используемых соглашениях, функциях и возможностях системы STATISTICA , и предметный указатель.

Многие понятия, относящиеся к методам нейронных сетей, лучше всего объяснять на примере конкретной нейронно-сетевой программы. Поэтому в данном разделе будет много ссылок на пакет STATISTICA Neural Networks (сокращенно, ST Neural Networks, нейронно-сетевой пакет фирмы StatSoft), представляющий собой реализацию всего набора нейросетевых методов анализа данных.

В последние несколько лет мы наблюдаем взрыв интереса к нейронным сетям, которые успешно применяются в самых различных областях - бизнесе, медицине, технике, геологии, физике. Нейронные сети вошли в практику везде, где нужно решать задачи прогнозирования, классификации или управления. Такой впечатляющий успех определяется несколькими причинами:

Нейронные сети - исключительно мощный метод моделирования, позволяющий воспроизводить чрезвычайно сложные зависимости. В частности, нейронные сети нелинейны по свой природе (смысл этого понятия подробно разъясняется далее в этой главе). На протяжение многих лет линейное моделирование было основным методом моделирования в большинстве областей, поскольку для него хорошо разработаны процедуры оптимизации. В задачах, где линейная аппроксимация неудовлетворительна (а таких достаточно много), линейные модели работают плохо. Кроме того, нейронные сети справляются с "проклятием размерности", которое не позволяет моделировать линейные зависимости в случае большого числа переменных

Нейронные сети учатся на примерах. Пользователь нейронной сети подбирает представительные данные, а затем запускает алгоритм обучения, который автоматически воспринимает структуру данных. При этом от пользователя, конечно, требуется какой-то набор эвристических знаний о том, как следует отбирать и подготавливать данные, выбирать нужную архитектуру сети и интерпретировать результаты, однако уровень знаний, необходимый для успешного применения нейронных сетей, гораздо скромнее, чем, например, при использовании традиционных методов статистики.

Нейронные сети привлекательны с интуитивной точки зрения, ибо они основаны на примитивной биологической модели нервных систем. В будущем развитие таких нейро-биологических моделей может привести к созданию действительно мыслящих компьютеров. Между тем уже "простые" нейронные сети, которые строит система ST Neural Networks , являются мощным оружием в арсенале специалиста по прикладной статистике (Нейронные сети. STATISTICA Neural Networks: Методология и технологии современного анализа данных.).

Нейронные сети возникли из исследований в области искусственного интеллекта, а именно, из попыток воспроизвести способность биологических нервных систем обучаться и исправлять ошибки, моделируя низкоуровневую структуру мозга (Patterson, 1996). Основной областью исследований по искусственному интеллекту в 60-е - 80-е годы были экспертные системы. Такие системы основывались на высокоуровневом моделировании процесса мышления (в частности, на представлении, что процесс нашего мышления построен на манипуляциях с символами). Скоро стало ясно, что подобные системы, хотя и могут принести пользу в некоторых областях, не ухватывают некоторые ключевые аспекты человеческого интеллекта. Согласно одной из точек зрения, причина этого состоит в том, что они не в состоянии воспроизвести структуру мозга. Чтобы создать искусственных интеллект, необходимо построить систему с похожей архитектурой.

Мозг состоит из очень большого числа (приблизительно 10,000,000,000) нейронов, соединенных многочисленными связями (в среднем несколько тысяч связей на один нейрон, однако это число может сильно колебаться). Нейроны - это специальная клетки, способные распространять электрохимические сигналы. Нейрон имеет разветвленную структуру ввода информации (дендриты), ядро и разветвляющийся выход (аксон). Аксоны клетки соединяются с дендритами других клеток с помощью синапсов. При активации нейрон посылает электрохимический сигнал по своему аксону. Через синапсы этот сигнал достигает других нейронов, которые могут в свою очередь активироваться. Нейрон активируется тогда, когда суммарный уровень сигналов, пришедших в его ядро из дендритов, превысит определенный уровень (порог активации).

Интенсивность сигнала, получаемого нейроном (а следовательно и возможность его активации), сильно зависит от активности синапсов. Каждый синапс имеет протяженность, и специальные химические вещества передают сигнал вдоль него. Один из самых авторитетных исследователей нейросистем, Дональд Хебб, высказал постулат, что обучение заключается в первую очередь в изменениях "силы" синаптических связей. Например, в классическом опыте Павлова, каждый раз непосредственно перед кормлением собаки звонил колокольчик, и собака быстро научилась связывать звонок колокольчика с пищей. Синаптические связи между участками коры головного мозга, ответственными за слух, и слюнными железами усилились, и при возбуждении коры звуком колокольчика у собаки начиналось слюноотделение.

Таким образом, будучи построен из очень большого числа совсем простых элементов (каждый из которых берет взвешенную сумму входных сигналов и в случае, если суммарный вход превышает определенный уровень, передает дальше двоичный сигнал), мозг способен решать чрезвычайно сложные задачи. Разумеется, мы не затронули здесь многих сложных аспектов устройства мозга, однако интересно то, что искусственные нейронные сети способны достичь замечательных результатов, используя модель, которая ненамного сложнее, чем описанная выше.

За определенную историю наблюдения за больными, накопился массив данных, которые сохранены в таблице системы STATISTICA. Вид соответствующей Таблицы данных представлен на Рисунке 6.

Рисунок 6. Фрагмент таблицы исходных данных

Целью исследования является построение нейросетевой модели, которая по заданному набору исходных данных (данные обследований больного, результаты анализов, лечение до поступления), на основе назначенного в стационаре лечения выдавала бы прогноз его лечения (значений приём в стационаре И-АПФАРА, БАБ, БКК, диуретиков, препаратов центрального действия) с достаточной точностью.

Факт нелинейности задачи не вызывает сомнения. Конечно, можно было бы попробовать решить задачу, воспользовавшись модулем STATISTICA Nonlinear Estimation, а именно при помощи предлагаемых данным модулем итеративных процедур "нащупать" вид функции. Однако здесь есть ряд неприятностей, которые значительно растягивают процедуру поиска решения. Важнейшей из них является формулировка гипотезы о явном виде изучаемой зависимости, которая совсем не является очевидной.

Без дополнительных исследований, о явном виде зависимости сказать что-либо сложно. Тем более, следует упомянуть, что мы не учли еще один фактор. В общем, решение подобной задачи методами нелинейного оценивания может растянуться очень надолго, а может так ни к чему и не привести. В таких критических ситуациях, когда известно, что

Зависимость между переменными есть;

Зависимость определенно нелинейная;

О явном виде зависимости сказать что-либо сложно,

выручают нейросетевые алгоритмы. Рассмотрим способ решения данной задачи в модуле STATISTICA Neural Networks.

К сожалению, универсальных правил, говорящих о том, какой топологии нейронной сети стоит придерживаться для решения той или иной задачи нет. Поэтому, необходима разумная процедура поиска нужной сети.

Модуль Neural Networks системы STATISTICA включает в себя процедуру, организующую поиск нужной конфигурации сети. Эта процедура заключается в построении и тестировании большого количества сетей с разными архитектурами и послудующем выборе из них той сети, которая лучше всего подходит для решения поставленной задачи. Данный инструмент называется Intelligent Problem Solver. Для запуска модуля Neural Networks необходимо воспользоваться одноименной командой основного меню системы STATISTICA - Statistics. (рисунок 7)

Рисунок 7. Запуск модуля Neural Networks

Очень распространенным является следующий тезис: "нейронные сети представляют собой универсальную структуру, позволяющую реализовать любой алгоритм". Попробуем, слепо веря данному утверждению, построить нейронную сеть, которая бы "уловила" предлагаемую зависимость сразу (имеется в виду, без предварительного, разведочного анализа).

Одним из важнейших вопросов, до сих пор, не решенных современной наукой, является вопрос о структуре нейронный сети, которая была бы способна к воспроизведению искомой многомерной нелинейной зависимости. Да действительно, теорема Колмогорова о полноте, доказанная им еще 1957 году, утверждает, что нейронная сеть способна воспроизвести любую (очень важно - непрерывную) функцию. Однако она не прелагает исследователю рецепта по созданию такой сети. В 1988 году, ряд авторов обобщили теорему Колмогорова и показали, что любая непрерывная функция может быть аппроксимирована трехслойной нейронной сетью с одним скрытым слоем и алгоритмом обратного распространения ошибки с любой степенью точности. Таким образом, в нашем случае положительным аспектом является знание того, что сеть должна быть трехслойной, но опять-таки в распоряжении нет правил, устанавливающих зависимость между "любой степенью точности" и количеством нейронов на промежуточном, так называемом скрытом слое.

Резюмируя все вышесказанное, отметим, что универсальных правил, говорящих о том, какой топологии нейронной сети стоит придерживаться для решения той или иной задачи нет. Поэтому, необходима разумная процедура поиска нужной сети.

Модуль Neural Networks системы STATISTICA включает в себя уникальную процедуру, организующую поиск нужной конфигурации сети. Данный инструмент называется Intelligent Problem Solver. Воспользуемся этим инструментом и осуществим поиск нейронной сети, которая будет способна к решению нашей задачи.

Рисунок 8. Стартовая панель модуля Neural Networks

Во вкладке Quick (Быстрый) данного диалогового окна в разделе Problem Type (Класс задач) предлагается осуществить выбор того класса задач, с которым мы столкнулись. Нашей целью является построение многомерной зависимости или, другими словами, многомерной нелинейной регрессии. Значит, в разделе Problem Type - Класс задач следует указать Regression (Регрессия).

Определившись с классом задач, необходимо указать переменные для проведения Анализа. Для того чтобы выбрать переменные, воспользуемся кнопкой Variables. При нажатии данной кнопки появляется диалоговое окно Select input (independent), output (dependent) and selector variables (Укажите входные (независимые), выходные (зависимые) и группирующие переменные). В данном диалоговом окне необходимо задать два списка переменных. Continuous outputs (Непрерывные выходящие), в нашем случае, - это переменные Приём в стационаре И-АПФ/АРА, Приём в стационаре БАБ, Приём в стационаре БКК, Приём в стационаре диуретиков и приём в стационае препаратов центрального действия . Continuous inputs (Непрерывные входящие), в нашем примере, - это с 1 по 61 исходный параметр.

Рисунок 9. Выбор переменных для анализа

В разделе Select analysis (Выбор анализа) доступны две опции Intelligent Problem Solver и Custom Network Designer. Для автоматического подбора параметров нейронной сети требуется первая опция, которая устанавливается по умолчанию. Для продолжения Анализа необходимо нажать кнопку OK.

На следующем шаге появляется диалоговое окно настройки процедуры Intelligent Problem Solver.

Раздел Quick (Быстрый) содержит группу опций, отвечающих за время исполнения алгоритма поиска нейронной сети. На этой вкладке необходимо задать количество сетей, которые необходимо протестировать (выяснить подходят ли они для решения сформулированной задачи), а также указать, сколько из этих сетей войдут в итоговый отчет.

В разделе Networks tested (Количество тестируемых сетей) укажем 100, Networks retained (Количество сохраненных сетей) -- 10 (Рисунок 10)

На вкладке Types указывается, какие типы нейронных сетей будут использованы в процессе тестирования. Для решения задачи нелинейной регрессии больше всего подходит многослойный персептрон, поэтому выбираем сети, отмеченные на рисунке 11.

Рисунок 10. Задание количества тестируемых сетей

Рисунок 11. Выбор архитектуры сети

Далее, для организации процесса перебора и тестирования необходимо указать диапазон изменения количества нейронов в каждом слое нейронной сети. Рекомендуемые для данной задачи значения указаны на рисунке 12.

Рисунок 12. Указание размеров обучающей, контрольной и тестовой выборок

Теперь, после задания всех параметров обучения, для запуска процедуры поиска сетей необходимо нажать кнопку ОК.

Состояние алгоритма поиска отображается в диалоговом окне IPS Training In Progress (Процесс поиска сети).

Во время работы алгоритма поиска подходящей нейронной сети в этом диалоговом окне приводится информация о времени исполнения алгоритма, а так же о рассмотренных нейронных сетях. Цель алгоритма поиска - перебор ряда нейросетевых конфигураций и выбор наилучшей с точки зрения минимума ошибки на выходе сети и максимума её производительности.

Под редакцией В.П. Боровикова

2-е изд., перераб. и доп.

2008 г.

Тираж 1000 экз.

Формат 70x100/16 (170x240 мм)

Исполнение: в мягкой обложке

ISBN 978-5-9912-0015-8

ББК 32.973

УДК 004.8.032.26

Аннотация

Изложены нейросетевые методы анализа данных, основанные на использовании пакета STATISTICA Neural Networks (фирма производитель StatSoft), полностью адаптированного для русского пользователя. Даны основы теории нейронных сетей; большое внимание уделено решению практических задач, всесторонне рассмотрена методология и технология проведения исследований с помощью пакета STATISTICA Neural Networks – мощного инструмента анализа и прогнозирования данных, имеющего широкие применения в бизнесе, промышленности, управлении, финансах. Книга содержит множество примеров анализа данных, практические рекомендации по проведению анализа, прогнозирования, классификации, распознавания образов, управления производственными процессами с помощью нейронных сетей.

Для широкого круга читателей, занимающихся исследованиями в банковской сфере, промышленности, экономике, бизнесе, геологоразведке, управлении, транспорте и других областях.

Предисловие ко второму изданию

Введение. Приглашение в нейронные сети

Глава 1. ОСНОВНЫЕ ПОНЯТИЯ АНАЛИЗА ДАННЫХ

Глава 2. ВВЕДЕНИЕ В ТЕОРИЮ ВЕРОЯТНОСТЕЙ

Глава 3. ВВЕДЕНИЕ В ТЕОРИЮ НЕЙРОННЫХ СЕТЕЙ

Глава 4. ОБЩИЙ ОБЗОР НЕЙРОННЫХ СЕТЕЙ
Параллели из биологии
Базовая искусственная модель
Применение нейронных сетей
Пре- и постпроцессирование
Многослойный персептрон
Радиальная базисная функция
Вероятностная нейронная сеть
Обобщенно-регрессионная нейронная сеть
Линейная сеть
Сеть Кохонена
Задачи классификации
Задачи регрессии
Прогнозирование временных рядов
Отбор переменных и понижение размерности

Глава 5. ПЕРВЫЕ ШАГИ В STATISTICA NEURAL NETWORKS
Начинаем работу
Создание набора данных
Создание новой сети
Создание набора данных и сети
Обучение сети
Запуск нейронной сети
Проведение классификации

Глава 6. ДАЛЬНЕЙШИЕ ВОЗМОЖНОСТИ НЕЙРОННЫХ СЕТЕЙ
Классический пример: Ирисы Фишера
Обучение с кросс-проверкой
Условия остановки
Решение задач регрессии
Радиальные базисные функции
Линейные модели
Сети Кохонена
Вероятностные и обощенно-регрессионные сети
Конструктор сетей
Генетический алгоритм отбора входных данных
Временные ряды

Глава 7. ПРАКТИЧЕСКИЕ СОВЕТЫ ПО РЕШЕНИЮ ЗАДАЧ
Представление данных
Выделение полезных входных переменных.
Понижение размерности
Выбор архитектуры сети
Пользовательские архитектуры сетей
Временные ряды

Глава 8. ПРИМЕРЫ ПРИМЕНЕНИЯ (CASE STUDIES)
Пример 1. Понижение размернотси в геологическом исследование
Пример 2. Распознование образов
Пример 3. Нелинейная классификация двумерных множеств
Пример 4. Сегментация различных образцов топлива по данным лабораторного исследования
Пример 5. Построение модели поведенческого скоринга
Пример 6. Аппроксимация функций
Пример 7. Прогнозирование продаж нефти
Пример 8. Мониторинг и предсказание
температурного режима на установке
Пример 9. Определение достоверности цифровой подписи

Глава 9. КРАТКОЕ РУКОВОДСТВО
Данные
Сети
Обучение сетей
Другие типы сетей
Работа с сетью
Пересылка результатов в систему STATISTICA

Глава 10. КЛАССИЧЕСКИЕ МЕТОДЫ, АЛЬТЕРНАТИВНЫЕ НЕЙРОННЫМ СЕТЯМ
Классический дискриминаннтный анализ в STATISTICA
Классификация
Логит-регрессия
Факторный анализ в STATISTICA

Глава 11. ДОБЫЧА ДАННЫХ В STATISTICA

Приложение 1. Генератор кода

Приложение 2. Интеграция STATISTICA с ERP-системами

Список литературы

Предметный указатель

В пакете STATISTICA задача непрерывного прогнозирования представляется как задача регрессии. В контексте этой задачи нейронная сеть рассматривается как нелинейная функция, сложность которой контролируется "полупараметрически" - число элементов в сети влияет на сложность решения, но, конечно, аналитик не может видеть явный вид регрессионной функции.

Требуется построить нейронную сеть, вычисляющую выброс свинца в атмосферу в зависимости от количества и вида проезжающего транспорта. Данные хранятся в файле Свинец.xls.

Откройте файл Свинец.xls в пакете Statistica. Появится окно «Открытие файла».

Рис. 4. 33. Окно импорта.

Необходимо выбрать опцию «Импортировать выбранный лист» и выбрать название листа с данными:

Рис. 4. 34. Выбор листа Excel для импорта в пакет Statistica.

В следующем окне необходимо указать реальные параметры данных, которые, как правило, определяются и отображаются автоматически (кроме трех последних чекбоксов).

Рис. 4. 35. Задание области импорта.

После этого импортированные данные отобразятся в окне.

Рис. 4. 36. Результаты импорта.

Запустите пакет анализа при помощи нейронных сетей. Для этого выберите в меню «Анализ» пункт «Нейронные сети».

Рис. 4. 37. Выбор способа обработки данных – «нейронная сеть».

после чего появится окно пакета STATISTICA Neural Networks:

Рис. 4. 38. Стартовое окно анализа «нейронные сети».

Перейдите на вкладку «Быстрый», где необходимо задать тип задачи- Регрессия, и инструмент- Конструктор сетей.

Рис. 4. 39. Запуск конструктора нейросетей.

Далее, нажав кнопку «ОК», вы перейдете в режим выбора выходных (зависимых) и входных (независимых) переменных. В качестве первой выбираем «Свинец», а в качестве последних – количество автомобилей всех категорий. Столбцы «№» и «Улицы» остаются неиспользуемыми.

Рис. 4. 40. Выбор входных и выходных данных для нейросети.

Нажав «Ок» вы снова вернетесь на вкладку «Быстрый». Затем, снова нажав кнопку «Ок», вы переместитесь в окно формирования нейросети. На вкладке «Быстрый» необходимо выбрать тип сети- многослойный персептрон,

Рис. 4. 41. Выбор типа нейросети.

а на вкладке «Элементы» можно указать необходимое количество слоев, количество нейронов в каждом, а также вид функции активации:

Рис. 4. 42. Задание количества слоев и типов нейронов.

Рис. 4. 43. Выбор способа обучения нейосети.

Здесь, нажав на кнопку «Выборки», можно задать количество обучающих, контрольных и тестовых примеров. Если задать число тестовых и контрольных примеров равными нулю, то сеть будет обучаться по всем примерам:

Рис. 4. 44. Определение данных для обучения и тестирования.

Вернувшись в главное окно обучения, можно, нажав на кнопку «Пользователя» и перейдя к вкладке «Интерактивный», потребовать, что бы процесс обучения отражался в виде графика:

Рис. 4. 45. Задание вида графика для демонстрации процесса обучения.

Наконец, нажав на кнопку «Ок», вы запустите процесс обучения, результат которого отобразится на графике:

Рис. 4. 46. Обучение нейросети.

Нажав на кнопку «Ок», вы перейдете к окну результатов, где можете изучать различные характеристики созданной сети, перемещаясь по вкладкам окна:

Рис. 4. 47. Результаты моделирования нейросети.

Так, например, на вкладке «Дополнительно» существует кнопка «Архитектура сети», нажав на которую можно увидеть топологию построенной сети:

Рис. 4. 48. Вид построенной нейросети.

а также кнопка «Наблюдения пользователя», где можно задать сети новые исходные данные и получить ответ уже обученной сети.

Понравилась статья? Поделиться с друзьями: