STATISTICA Base (самостоятельный продукт) — это широкий набор основных статистик в понятном интерфейсе со всеми преимуществами, простотой и мощностью технологий STATISTICA.
Описательные и внутригрупповые статистики, разведочный анализ данных
STATISTICA Base предлагает широкий набор методов для разведочного анализа.
Описательные статистики и графики:
- Программа вычисляет практически все используемые описательные статистики общего характера: медиану, моду, квартили, заданные пользователем процентили, среднее значение и стандартное отклонение, квартильный размах, доверительные интервалы для среднего, асимметрию и эксцесс (и их стандартные ошибки), гармоническое и геометрическое среднее, а также многие специальные описательные статистики.
- Как и во всех других модулях системы STATISTICA, в разведочном анализе данных доступны разнообразные графики и диаграммы, в т.ч. различные виды диаграмм размаха и гистограмм, гистограммы двумерных распределений (трехмерные и категоризованные), двух- и трехмерные диаграммы рассеяния с помеченными подмножествами данных, нормальные и полунормальные вероятностные графики и графики с исключенным трендом, К-К и В-В графики и т.д. Имеется набор критериев для подгонки нормального распределения к данным (критерии Колмогорова-Смирнова, Лилиефорса и Шапиро-Уилкса).
Группировка:
- Практически все описательные статистики и графики могут быть построены для данных, категоризованных (сгруппированных) по значениям одной или нескольких группирующих переменных. Например, с помощью нескольких щелчков мыши можно сгруппировать имеющиеся данные о людях по полу и возрасту, а затем просмотреть категоризованные гистограммы, диаграммы размаха, нормальные вероятностные графики, диаграммы рассеяния и т.д. В случае, если было выбрано более двух категоризованных переменных, автоматически будет построен каскад соответствующих графиков.
- Имеется возможность производить категоризацию по числовым (непрерывным) переменным, например, можно потребовать, чтобы значения переменной были разбиты на заданное число интервалов; с помощью инструмента перекодировки можно в реальном времени задать специальный способ перекодировки переменной (возможна категоризация практически любой сложности, заданная через соотношения между любыми переменными файла данных). В дополнение к этому, в системе имеется специализированная процедура иерархической группировки, позволяющая осуществлять категоризацию данных по многим (до шести) переменным и строить различные категоризованные графики, описательные статистики и корреляционные матрицы для подгрупп (пользователь может в интерактивном режиме игнорировать некоторые факторы в полной таблице группировок и исследовать статистики по маргинальным таблицам).
- Многочисленные возможности форматирования и расстановки меток позволяют получать таблицы и отчеты презентационного качества, содержащие длинные метки и описания переменных. При этом важно отметить, что процедура группировки выполняется для чрезвычайно больших объемов данных (например, по одной категоризующей переменной можно построить до 300 групп), а ее результаты содержат все соответствующие статистики дисперсионного анализа (включая полные таблицы ANOVA, критерии проверки гипотез типа критерия Левена однородности дисперсии, семь различных апостериорных (post-hoc) критериев и т.д.).
- Как и во всех других модулях системы STATISTICA, для достижения высокой — не имеющей аналогов в сравнении с другими пакетами — точности результатов здесь можно производить вычисления с повышенной точностью (если нужно — с четырехкратной). Благодаря интерактивному характеру системы изучение данных становится очень простым делом. Например, графики для разведочных статистик можно построить непосредственно по любой таблице результатов, просто указав мышью на отдельные ячейки или группы ячеек. Одним щелчком мыши можно получать каскады графиков (в том числе сложных, например, со множественными категориями), которые затем можно просматривать в режиме демонстрации слайдов, просто нажимая кнопку Продолжить.
- В дополнение к большому числу готовых статистических графиков пользователь может самостоятельно задавать различные типы визуализации исходных данных, описательных статистик, взаимосвязей между статистиками, группировок и категоризаций с помощью средств прямого доступа (point-and-click), что позволяет существенно упростить задачу. Средства графического разведочного анализа объединены с собственно статистическими процедурами, что существенно облегчает визуальный анализ данных (например, в интерактивном режиме можно удалять выбросы, выделять подмножества данных, осуществлять сглаживание и подгонку функций, а богатые средства работы с кистью позволяют легко выявлять и/или выделять нужные данные).
Корреляции:
- В системе имеется большой набор методов для исследования корреляций между переменными. Прежде всего, могут быть вычислены все основные характеристики связи между переменными, в том числе: коэффициент корреляции Пирсона r, коэффициент ранговой корреляции Спирмена R, тау (b, c) Кендалла, Гамма, тетрахорический r, Фи, V Крамера, коэффициент сопряженности C, D Соммера, коэффициенты неопределенности, частные и получастные корреляции, автокорреляции, различные меры расхождения и т.д. Нелинейные корреляции, регрессия для цензурированных данных и другие более специализированные меры корреляции реализованы в модулях Нелинейное оценивание, Анализ выживаемости и STATISTICA Линейные и Нелинейные модели.
- Корреляционные матрицы могут быть вычислены с построчным, попарным удалением пропусков или с подстановкой среднего вместо пропущенных значений. Как и во всех других модулях системы STATISTICA, для достижения высокой — не имеющей аналогов среди других пакетов — точности результатов здесь можно производить вычисления с повышенной точностью (где требуется — с «учетверенной»).
- Как и все численные результаты, корреляционные матрицы в системе STATISTICA выводятся в виде таблиц, имеющих богатые возможности форматирования данных и визуализации численных результатов; так, можно «указать» на конкретный корреляционный коэффициент и вызвать для него контекстное меню всевозможных «описательных диаграмм» (диаграммы рассеяния с доверительными интервалами, различные объемные гистограммы двумерных распределений, вероятностные графики и т.д.). Богатые средства закрашивания позволяют выделять (или, наоборот, затенять) отдельные точки на диаграмме рассеяния и таким образом оценивать их влияние на положение линии регрессии (и других подогнанных кривых). Таким образом исследуются, например, выбросы или резко выделяющиеся наблюдения.
- Поддерживаются разнообразные форматы глобального вывода корреляций; значимые коэффициенты корреляции могут автоматически выделяться цветом, каждую ячейку таблицы результатов можно расширить и посмотреть число n наблюдений, по которым вычислен коэффициент и уровень значимости p, можно запросить подробные результаты, включающие все описательные статистики (попарные средние и стандартные отклонения, B-веса, пересечения, и т.д.).
- Как и все численные результаты, корреляционные матрицы выводятся в виде таблиц, поддерживающих операцию масштабирования и интерактивно управляемый формат вывода значащих цифр (например, от +0.4 до +0.41358927645193); таким образом, матрицы больших размеров можно сжимать (с помощью операции уменьшения, либо изменением формата вывода, что делается перетягиванием границ столбцов с помощью мыши). Это облегчает зрительное восприятие и, в частности, помогает быстро находить коэффициенты, превосходящие заданную величину или имеющие определенный уровень значимости (соответствующие ячейки в таблице результатов будут помечены красным цветом).
Диаграмма рассеивания, матричная диаграмма рассеивания, анализ по группам:
- Как и во всех других диалоговых окнах вывода, здесь доступны различные общие параметры графического вывода, позволяющие проводить дальнейшее изучение закономерностей и взаимосвязей между переменными; например, двух- и трехмерные диаграммы рассеяния (с метками наблюдений или без них) служат для выявления зависимостей по подмножествам наблюдений или последовательностям переменных. Корреляционные матрицы могут быть категоризованы группирующими переменными и представляться графически в виде категоризованных диаграмм рассеяния.
- Могут быть также выведены последовательности таблиц результатов «группировки корреляционных матриц» (по одной матрице на каждое подмножество наблюдений), которые возможно использовать в дальнейшем при Моделировании структурных уравнений [SEPATH] в модуле Линейные и Нелинейные модели STATISTICA). Вся корреляционная матрица может быть представлена на одном графике (со сколь угодно большим разрешением) в виде матрицы диаграмм рассеяния; такие матрицы можно интерактивно просматривать, «увеличивая» нужные участки графика (или прокручивая график в режиме увеличения).
- Имеется также возможность строить категоризованные матричные диаграммы рассеяния (одна матричная диаграмма на каждое подмножество данных). Можно поступить иначе и построить матричные диаграммы рассеяния для нескольких подмножеств (например, задаваемых уровнями группирующей переменной или сколь угодно сложными условиями выбора наблюдений), где отдельные подмножества данных изображаются различными маркерами. Для визуализации корреляционных матриц и поиска в них глобальных закономерностей имеется еще много других графических методов (контурные графики, несглаженные поверхности, пиктограммы и т.д.). Все эти операции требуют лишь нескольких щелчков мыши, а для выбора параметров предоставляются различные средства быстрого доступа. Одновременно на экране можно открыть любое число таблиц результатов и графиков, что принципиально облегчает интерактивный разведочный и сравнительный анализ.
Быстрые основные статистики и блоковые статистики:
- В дополнение к описательным статистикам и корреляциям (о них было рассказано в двух предыдущих разделах) и таблицам частот в системе STATISTICA имеются интерактивные средства, позволяющие одним щелчком мыши вычислять основные статистики и строить графики в любой момент в течение сеанса работы. Быстрые основные статистики доступны из всех панелей инструментов и контекстных меню и выдают результат немедленно без каких-либо промежуточных диалоговых окон, если только пользователь не выберет другой режим.
- Более того, по умолчанию эти быстрые процедуры даже не требуют, чтобы были выбраны переменные для анализа — они выбираются автоматически по выделенному блоку ячеек или диапазону столбцов (или строк) в открытой в данный момент таблице исходных данных или таблице результатов. Быстрые основные статистики — очень удобный способ быстро получать «общие» сведения об исследуемых переменных. Сюда входит полный набор описательных статистик (включая порядковые статистики), корреляции и таблицы частот вместе с ожидаемыми нормальными частотами и другие числовые характеристики, а также большой набор встроенных статистических графиков. Выходные результаты для всех статистик и графиков могут быть категоризованы (сгруппированы по значениям некоторой переменной).
Блоковые статистики:
- Кроме того, все входные и выходные таблицы системы STATISTICA поддерживают функции Блоковые статистики и Блоковые статистические графики, выдающие статистики и статистические графики для произвольного выделенного блока ячеек в открытой в данный момент таблице исходных данных или таблице результатов. Результаты можно выводить по столбцам или по строкам выделенного блока в зависимости от смысла содержащихся в нем данных (исходные данные, нагрузки факторов, средние значения, частоты и т.д.). Например, применив метод Монте-Карло из модуля Моделирование структурными уравнениями (SEPATH), можно выделить блок чисел (например, оценок параметров для последовательных испытаний) в таблице результатов и построить для них описательные статистики (средние значения, медианы, квартили), гистограммы, вероятностные графики, диаграммы размаха и т.д.
Интерактивный вероятностный калькулятор:
- Из любой панели инструментов системы STATISTICA доступен удобный интерактивный Калькулятор вероятностных распределений. Он поддерживает множество типов стандартных распределений (бета, Коши, хи-квадрат, экспоненциальное, экстремальное (Гумбеля), F, гамма, Лапласа, логнормальное, логистическое, Парето, Релея, t (Стьюдента), Вейбулла и Z (нормальное)).
- Графики (плотности вероятности и функции распределения) отображаются в интерактивном режиме, что позволяет наглядно представить себе то или иное распределение, изменяя его с помощью кнопок микропрокрутки (при нажатии левой кнопки мыши изменится последняя, а при нажатии правой — предпоследняя значащая цифра числа). Имеется возможность строить составные графики распределений в нужном диапазоне. Таким образом, калькулятор дает возможность интерактивно исследовать структуру распределений (например, зависимость вероятности от параметров).
T-критерии (и другие критерии групповых различий):
- В этом окне могут быть вычислены T-критерии для зависимых и независимых выборок, а также многомерный критерий T 2 Хотеллинга (относительно сравнений средних значений для одномерных и многомерных данных смотрите также разделы, посвященные модулям ANOVA/MANOVA, и GLM.
- Как и в других модулях системы STATISTICA, здесь в каждом меню результатов доступны функции подробной диагностики и графические инструменты. Так, например, в случае t-критериев для независимых выборок имеется возможность вычислить t-критерий с раздельными оценками дисперсий и критерий Левена однородности дисперсии, построить различные диаграммы размаха, категоризованные гистограммы, вероятностные графики, категоризованные диаграммы рассеяния и т.д.
Таблицы частот, таблицы сопряженности, таблицы флагов и заголовков, анализ многомерных откликов:
- В системе имеются разнообразные средства для табуляции непрерывных и категориальных переменных, переменных множественного отклика и многомерных дихотомий. Вид таблиц и формат данных регулируется многочисленными функциями. Так, например, в таблицах для переменных множественного отклика или многомерных дихотомий маргинальные частоты и процентные показатели могут вычисляться по отношению к общему числу респондентов либо числу ответов, переменные множественного отклика можно обрабатывать парами, имеются различные варианты обработки пропущенных данных.
- Таблицы частот могут быть вычислены для заданных пользователем логических условий выбора наблюдений (условия могут быть любой степени сложности и связывать любые переменные в текущем файле данных), относящих наблюдения к той или иной категории в таблице. Все таблицы можно настроить для вывода результатов в форме конечного отчета (для печати). Например, не имеющую аналогов в других пакетах «многовходовую итоговую таблицу» можно вывести с группировками и иерархическим упорядочением факторов; в ячейках таблицы сопряженности могут выводиться проценты по столбцу, по строке или проценты от общего числа наблюдений в таблице; для описания категорий в таблице можно использовать длинные метки значений; частоты, превышающие заданный пользователем уровень можно выделить цветом и т.д.
- Программа может выводить кумулятивные (суммарные или накопленные) частоты и относительные частоты, логит- и пробит-преобразованные частоты, ожидаемые нормальные частоты (а также значения статистик Колмогорова-Смирнова, Лилиефорса и Шапиро-Уилкса), ожидаемые и остаточные частоты в таблицах сопряженности и др. Среди критериев значимости в таблицах сопряженности реализованы: критерии хи-квадрат Пирсона, максимума правдоподобия и с поправкой Йетса, хи-квадрат МакНемара, точный критерий Фишера (одно- и двухсторонний), Фи, тетрахорическая корреляция; доступны также следующие статистики: тау (a, b ) Кендалла, Гамма, r Спирмена, D Соммера, коэффициенты неопределенности и др. Графические средства включают простые, категоризованные (множественные) и трехмерные гистограммы, гистограммы кросс-сечений (для любых «срезов» одно-, двух- и многовходовых таблиц) и много других типов графиков, в том числе уникальный в своем роде «частотный график взаимодействий», суммирующий частоты для сложных таблиц сопряженности (подобно диаграмме средних в модели дисперсионного анализа ANOVA). В интерактивном режиме можно просматривать целые каскады графиков (в том числе сложных, например, множественные категоризованные графики и графики взаимодействий).
Методы множественной регрессии:
- В модуле Множественная регрессия реализован полный набор методов линейной и фиксированной нелинейной регрессии. Эти методы включают простую, множественную, пошаговую регрессию (с пошаговым/блоковым включением или исключением предикторов), иерархическую, нелинейную (полиномиальную, экспоненциальную, логарифмическую и т.д.) и гребневую (ридж) регрессию, с включением или без включения константы (свободного члена), модели взвешенных наименьших квадратов. Программа вычисляет полный набор статистик и дополнительных анализов, включая полную таблицу регрессии (с значениями стандартной ошибки для B, Beta и свободного члена, коэффициента детерминации R2 и скорректированного R2 для моделей с константой и без нее и таблицей дисперсионного анализа), матрицы частных и получастных корреляций, корреляции и ковариации коэффициентов регрессии, матрицу выметания (обратную матрицу), статистику Дарбина-Уотсона d, расстояния Махаланобиса и Кука, удаленные остатки, доверительные интервалы для предсказанных значений и многие другие статистики.
Предсказанные значения и остатки:
- Широкие возможности анализа остатков и выбросов предоставляют многочисленные графики: диаграммы рассеяния, гистограммы, нормальные и полунормальные вероятностные графики, графики с удаленным трендом, графики частных корреляций, различные построчные графики и диаграммы остатков и выбросов и др. Значения зависимой переменной для отдельных наблюдений можно просмотреть визуально с помощью разведочных пиктографиков и других многомерных графиков, доступных непосредственно из меню таблицы результатов. Остаточные и предсказанные значения можно автоматически добавлять к текущему файлу данных. Процедура прогнозирования позволяет проводить анализ типа «что-если» и интерактивно вычислять предсказанные значения по задаваемым с клавиатуры значениям предикторов.
Внутригрупповые статистики:
- В системе STATISTICA можно проанализировать чрезвычайно большие планы (более 500 переменных). Кроме того, имеются дополнительные средства (специальный аппарат) для сверхбольших задач регрессии (с тысячами переменных), Двуступенчатый метод наименьших квадратов, преобразования Бокса-Кокса и Бокса-Тидвелла. Система STATISTICA имеет также специальные модули общего нелинейного оценивания (Нелинейное оценивание, Обобщенные линейные модели (GLZ), Обобщенные аддитивные модели (GAM), Частные модели наименьших квадратов (PLS)) с помощью которых можно оценить практически любую определенную пользователем нелинейную модель и где имеется целый ряд предопределенных моделей, включая логит-, пробит- модели и др. В системе STATISTICA также имеется дополнительный модуль SEPATH — Моделирование структурными уравнениями, который позволяет анализировать чрезвычайно большие матрицы корреляций, ковариаций и моментов (для моделей со свободным членом).
Непараметрические статистики:
- Модуль Непараметрическая статистика содержит полный набор непараметрических статистик, включая все стандартные тесты и некоторые специальные прикладные статистики, в частности, критерий Вальда-Вольфовица, U тест Манна-Уитни (с точными вероятностями вместо нормальных аппроксимаций для малых выборок), критерии Колмогорова-Смирнова, критерий Вилкоксона парных сравнений, ранговый дисперсионный анализ Краскела-Уоллиса, медианный тест, критерий знаков, ранговый дисперсионный анализ Фридмана, Q- критерий Кохрена, критерий МакНемара, коэффициент конкордации Кендалла, тау (b, c) Кендалла, ранговая корреляция Спирмена R, точный критерий Фишера, критерии хи-квадрат, статистики V-квадрат, Фи, Гамма, d Соммера, коэффициенты сопряженности и другие (специальные непараметрические критерии и статистики входят также в состав некоторых других модулей, см. например, Анализ выживаемости, Анализ процессов и др.) Все (ранговые) критерии могут работать с совпадающими рангами и вносят поправку на малый объем выборки и совпадающие ранги. Как и во всех других модулях системы STATISTICA, процедуры всех критериев снабжены разнообразными графическими инструментами (здесь доступны различные типы диаграмм рассеяния, специальные диаграммы размаха, линейные графики, гистограммы и много других двух- и трехмерных графиков).
Общая модель дисперсионного и ковариационного анализа:
- В модуле Дисперсионный анализ реализованы методы общего одномерного и многомерного дисперсионного и ковариационного анализа, которые являются подмножеством Общих Линейных Моделей, в которых можно обрабатывать планы практически неограниченной сложности.
- Имеется возможность задавать планы непосредственно, определив реальные переменные и уровни факторов, поэтому даже не очень опытные пользователи системы STATISTICA могут анализировать в этом модуле чрезвычайно сложные планы.
- По умолчанию в процедурах модуля используется подход, основанный на модели средних, но пользователь может также вычислить суммы квадратов типа I (последовательные, в порядке по умолчанию или заданном пользователем), типа II или типа III; для неполных планов могут также быть исследованы гипотезы типа IV. Для планов любого типа могут использоваться фиксированные или переменные ковариаты.
- Можно анализировать неполные планы (вложенные, на латинских квадратах, на греко-латинских квадратах, планы с единственным наблюдением на ячейку, случайные блочные планы и т.д.); пользователь может задать объединенные члены ошибки дисперсионного анализа. Могут быть построены апостериорные критерии для маргинальных средних или для эффектов взаимодействия (включая межгрупповые факторы, факторы повторных измерений, или и те и другие): критерий наименьшей значимой разности (НЗР), критерий Ньюмена-Кеулса, критерий множественных сравнений Дункана, критерий Шеффе, критерий Тьюки достоверно значимой разности (ДЗР), обобщенный Спьотволлом и Столайном критерий Тьюки для выборок неравного размера.
- Для всех основных эффектов, взаимодействий и спланированных сравнений могут быть выведены полные статистики дисперсионного анализа; программа вычисляет также множественные таблицы классификации и SSCP-матрицы. Для всех эффектов могут быть выведены таблицы результатов, в которых отмечены цветом все значимые эффекты; в такой таблице, можно исследовать маргинальные средние или просмотреть мгновенные графики отдельных главных эффектов и взаимодействий, для чего достаточно просто дважды щелкнуть по эффекту. Для любых одно- и многомерных планов может быть проведен анализ контрастов неограниченной сложности.
- Пользователь может задавать частные эффекты взаимодействия, простые эффекты, полиномиальные контрасты и экспериментировать с произвольными комбинациями коэффициентов контраста. Имеются средства, упрощающие и ускоряющие задание параметров в сложных анализах: в дополнение к функции Быстрое заполнение, позволяющей автоматизировать ввод коэффициентов контраста, имеется широкий выбор предопределенных контрастов, доступных по одному щелчку мыши (включая полиномиальные, отклонение, разность, Хельмерта, простые и повторные).
- При анализе неполных планов со случайно распределенными пропущенными ячейками процедура анализа контрастов автоматически отмечает все пустые ячейки и помогает пользователю строить проверяемые гипотезы. Большую помощь при анализе оказывают богатые графические возможности модуля (автоматическое построение графиков взаимодействий, в том числе заданных пользователем каскадов графиков компонент («срезов») для многофакторных взаимодействий, внутригрупповых распределений переменных и внутригрупповых корреляций, определенные пользователем диаграммы размаха для медиан, квартилей, средних, стандартных отклонений, стандартных ошибок и т.д. для произвольных сочетаний факторов и многие другие). Могут быть исследованы гипотезы параллельности (т.е. отсутствия взаимодействий, включающих ковариаты); могут быть подсчитаны полные результаты одномерной и многомерной регрессии и выведены или нарисованы скорректированные средние.
- Программа вычисляет также поправки Гринхауса-Гейсера и Хюнха-Фельдта для факторов повторных измерений; для таких факторов автоматически вычисляются одно- и многомерные результаты. Пользователь может исследовать SS-матрицы (сумм квадратов) гипотез и ошибок, и там, где это возможно, программа выполняет полный канонический анализ с вычислением канонических корней, собственных значений, долю дисперсии, приходящуюся на каждый корень, а также стандартизованную и нестандартизованную дискриминантную функцию.
- Для визуализации результатов при исследовании гипотез и предположений в моделях дисперсионного анализа имеется большое число различных типов графиков: графики распределений, графики «ствол и листья», категоризованные и составные графики корреляций и подгоночных функций, позволяющие сравнивать соотношения между зависимыми измерениями (и/или) ковариатами по ячейкам высших порядков, графики средних против стандартных отклонений или дисперсий, обычные и категоризованные нормальные, полунормальные вероятностные графики и графики с исключенным трендом, графики корреляций внутри ячеек и т.д. Там, где это может потребоваться, можно одним щелчком мыши получать каскады графиков, которые затем можно просматривать в режиме, подобном демонстрации слайдов, просто нажимая кнопку Далее.
- Кроме того, имеется большой набор статистических процедур для проверки предположений: C Кохрена, критерий Хартли, критерий Бартлета, критерий Левена, M Бокса, непараметрический критерий Сена и Пури, критерий Колмогорова-Смирнова, критерий сферичности Моучли и т.д. При этом подгонку моделей структурированных средних (с константами), построенных по матрицам моментов для одной и нескольких выборок, можно осуществлять также средствами модуля SEPATH (Моделирование структурными уравнениями) системы STATISTICA, в котором можно оценивать модели MANOVA с явной неоднородностью дисперсий/ковариаций в разных группах и/или с явными структурными моделями для зависимой переменной, различными для каждой группы.
Вариант этого модуля, входящий в пакет Quick STATISTICA, имеет следующие ограничения — в нем можно анализировать одномерные планы с числом межгрупповых факторов не более четырех, одним фактором повторных измерений и одной ковариатой.
Подгонка распределений:
- Опции модуля Подгонка распределений позволяют сравнивать имеющееся распределение переменной с различными теоретическими распределениями. К данным можно попытаться подогнать нормальное, прямоугольное, экспоненциальное, гамма, логнормальное, хи-квадрат распределение, распределения Вейбулла, Гомпертца, биномиальное, Пуассона, геометрическое и Бернулли.
- Точность подгонки может быть оценена с помощью критерия хи-квадрат или одновыборочного критерия Колмогорова-Смирнова (при этом можно контролировать параметры подгонки); кроме того, реализованы также критерии Лиллиефорса и Шапиро-Уилкса. Подгонку гипотетического распределения определенного типа к эмпирическому распределению можно осуществлять при помощи настраиваемых гистограмм (обычных и кумулятивных) с наложенными на них подгоночными функциями; прямо из таблиц результатов можно строить графики и гистограммы для ожидаемых и наблюдаемых частот, отклонений и других показателей.
- Ряд других методов подгонки распределения реализован в модуле Анализ процессов STATISTICA — здесь можно получить оценку значений параметров по принципу максимума правдоподобия для распределений: бета, экспоненциального, эстремальных значений (типа I, Гумбеля), гамма, логнормального, Релея и Вейбулла. В этом модуле имеется возможность автоматически выбрать и подогнать распределение, в наибольшей степени согласующееся с данными, а также средства подгонки распределений через моменты (с помощью кривых Джонсона и Пирсона). На диаграммы могут быть наложены (в виде кривых и поверхностей) графики заданных пользователем функций. Эти функции могут изображать самые разные типы распределений: бета, биномиальное, Коши, хи-квадрат, экспоненциальное, экстремальных значений, F, гамма, геометрическое, Лапласа, логистическое, нормальное, логнормальное, Парето, Пуассона, Рэлея, t (Стьюдента) и Вейбулла, а также их интегралы и обратные распределения.
Графические элементы STATISTICA
Графические возможности STATISTICA сочетают максимально широкий набор научных и технических графиков (со встроенными аналитическими процедурами) с возможностями настройки, рисования и управления составными графиками, которые обычно встречаются в приложениях для создания презентаций и рисования. STATISTICA предоставляет сотни двумерных и трехмерных графиков, включая двумерные и трехмерные тернарные графики, специализированные четырехмерные графики, многомерные графики, категоризированные мультиграфики, матричные графики, пиктограммы, мозаики, спектральные двумерные и трехмерные графики, составные графики и много других специализированных процедур. Также, представлены гибкие и простые в использовании средства пользовательской настройки новых типов графиков и добавления соответствующих команд на панели инструментов.
Существует несколько способов работы с графиками в STATISTICA:
- Можно сказать, что эти методы представляют несколько типов «интерфейсов» между числами и графиками.
- Например, значения, представленные на круговой диаграмме, отображают значения столбца в таблице исходных данных (например, переменная Продажи) в нескольких наблюдениях (например, наблюдения называются: 2002, 2003, 2004, и т.д.) В то же время, значения на круговой диаграмме могут являться результатом неких вычислений. Например, часть диаграммы представляет относительные частоты наблюдений, принадлежащие к определенным категориям одной из гистограмм или процедурам частотной категоризации (например, количество лет с объемом продаж до 10 млн. долл., между 10 и 20 млн. долл., свыше 20 млн. долл.).
- Вне зависимости от метода создания графика (то есть, вне зависимости от источника представления данных и способа вычислений), все графики STATISTICA поддерживают возможности настройки, а средства управления несколькими графиками позволяют изменять окружение графика и совмещать его с другими графиками или документами.
- Все встроенные статистические возможности доступные в графиках STATISTICA (такие как подгонка, сглаживание, вращение, закрашивание, аналитическое масштабирование и т.д.), можно использовать и применять к графикам независимо от источника данных или метода создания.
- Возможности редактирования графика, представленные в STATISTICA, дают возможность создавать не только полностью настраиваемые научные и технические изображения и четкие рисунки, но также и высококачественные диаграммы-постеры, бизнес-графики и другие изображения, соответствующие современным способам передачи информации.
- Графики, сохраненные в файлах или экспортированные из приложения STATISTICA (например, скопированные в буфер или связанные с документами других приложений), являются «объектами» (точнее ActiveX-объектами), которые содержат не только все возможности настройки, но и все данные необходимые для продолжения редактирования различных параметров отображения или анализа содержания (подгонка, сглаживание).
- Так как графики STATISTICA являются ActiveX-объектами, они могут легко связываться или внедряться в другие внешние документы (например, документы Excel или Word), в которых возможно редактирование «на месте». Графики STATISTICA являются также ActiveX-контейнерами и, следовательно, могут содержать различные внедренные или связанные документы, такие как схемы Visio, иллюстрации Adobe, таблицы Excel, или документы Word. Кроме этого, STATISTICA поддерживает иерархию внедренных объектов до четвертого уровня, что означает возможность управления «многоярусными» документами.
Основные типы графиков / Графики встроенные в статистические процедуры:
- Oбщие типы графиков, которые доступны в любом анализе и применимы для выделенного набора данных, включая:
- исходные данные (или любое подмножество исходных данных, выбранных при заданных условиях);
- любые итоговые данные анализов (или любое подмножество данных, выбранных из результирующей таблицы);
- значения, вычисленные в STATISTICA Visual Basic;
- любая комбинация предыдущих трех типов данных.
- Oдна из уникальных особенностей графических возможностей STATISTICA заключается в том, что все численные значения (и их текстовые описания) и всевозможные комбинации этих значений могут быть изображены графически с помощью любой графической процедуры в системе.
- В добавление к этим общим типам графиков, существует сотни видов более специализированных графиков, которые интегрированы с соответствующими статистическими процедурами и доступны даже из диалогов и контекстных меню результирующих таблиц данных.
Общие настройки графиков:
- Набор типов, стилей и графических опций, предоставляемых STATISTICA, намного превышает уровень описанных здесь деталей и свойств. Существуют сотни предопределенных и специализированных настроенных графиков, которые доступны из всех статистических, графических и контекстных меню. Кроме этого, поддерживается практически неограниченное количество графиков, которые возможно настраивать пользователем, и графиков, представляющие любую комбинацию пользовательских наборов данных.
- Более того, каждый существующий график (встроенный или пользовательский) можно рассматривать как начальную точку для дальнейших бесчисленных настроек, которые повлекут изменения в графических типах. Эти настройки заключаются в интерактивных изменениях параметров всех графических компонентов и изображений. Можно добавлять новые ряды к существующим данным, а также объединять с имеющимися данными, на которых построены графики. В результате, практически все структурные аспекты этого графика можно переопределить и настроить, а новые графики STATISTICA можно динамически связать с текущим изображением. Внешние файлы можно легко «переносить» на графики STATISTICA напрямую из Windows Explorer (между окнами приложений). Графики STATISTICA могут также служить контейнерами для ActiveX/OLE совместимых или несовместимых объектов из других приложений.
Графические документы:
- Графические документы STATISTICA содержат все опции, настройки, стили, а также информацию о вставленных, связанных или внедренных объектах, и поэтому, их можно передавать другим пользователям даже без исходного множества данных. Кроме того, вы можете повторно открыть графический документ на другом компьютере для продолжения анализа или настройки графика, например, изменения опций подгонки, задания параметров категоризации и т.д.
Динамические связи между графиками и исходными данными:
- Все графики, созданные из таблицы исходных данных, могут автоматически поддерживать связи с данными. При проведении разведочного анализа данных Вы можете записать макросы для автоматического создания заранее определенных графиков по каждому из наборов данных. Все графики можно автоматически печатать, сохранять или вставлять в высококачественные отчеты, совмещая графики с текстом.
Автоматическое обновление графиков в реальном времени:
- Если таблица исходных данных связана с внешним источником данных, для графиков можно задать автоматическое обновление при изменении данных в таблице (например, в удаленном хранилище данных или в нескольких выбранных базах данных, определенных при использовании STATISTICA Query).
- Например, графики контроля качества и другие типы графиков могут использоваться для мониторинга специальных индексов качества или для контролирования лабораторного процесса. STATISTICA совместима практически с любыми системами получения данных, и данные можно конвертировать в STATISTICA даже через набор ссылок на таблицы данных или макросы, «нажимающие» на кнопки. Если таблицы данных содержат формулы для конвертирования или «очистки» исходных данных, соответствующие части таблицы могут автоматически обновляться при получении новых данных, а конвертированные данные тут же пересылаются в график.
Многообразие графиков:
- Оптимизированный доступ к набору графических типов. В STATISTICA представлено очень большое количество разнообразных графиков, однако, доступ ко всем типам графиков требует минимального количества шагов. Вызвать нужный график можно из меню, панелей инструментов, галереи графиков (предназначенной для упрощения доступа к различным графическим типам и встроенной в Электронное Руководство) или простого иерархического меню; кроме того, возможно использовать пользовательские макросы.
- Быстрый доступ к стандартным типам графиков, ярлыки. Наиболее часто используемые графики разбиты на отдельные группы (например, Быстрые статистические графики или стандартный набор Блоковых графиков), доступные из контекстных или других меню. При таком быстром доступе нет необходимости задавать параметры в различных диалоговых окнах, так как принимаются установки по умолчанию. В качестве исходных данных в этом случае используется выделенный набор значений в таблице данных. Также поддерживаются другие альтернативные пути доступа к стандартным типам графиков. Например, вы можете назначить некоторым часто используемым типам графиков свои кнопки на стандартных или пользовательских панелях инструментов, «горячие» клавиши или добавить их в выпадающие меню.
Обзор основных типов графиков:
- Помимо большого набора 2- и 3-мерных графиков «бизнес типов» (такие как столбчатые, круговые диаграммы, линейные, зонные, наложенные графики, диаграммы размахов, отклонений, блоковые графики и т.д.) STATISTICA представляет широкий спектр (аналитических и исследовательских) графиков. Он включает различные гистограммы (сглаживающая, кумулятивная, составная, с двойной осью Y, подогнанная, висячих столбцов, 1М и 2М категоризированные составные гистограммы, матричная, 3М гистограмма двух переменных, поверхностная сглаживающая, гистограмма с диаграммами рассеивания и последовательностью, со скользящим средним и т.д.);
- графики средних со столбцами ошибок; диаграммы размаха (включая пользовательские графики центральных тенденций (например усеченные средние или медианы) и меры дисперсий (задаются процентили, размахи, стандартные отклонения, стандартные ошибки или диапазоны без выбросов), графики выбросов и крайних точек;
- диаграммы размаха с выбросами и диаграммами рассеяния, 2М, 3М и категоризованные графики диапазонов или изменчивости в нескольких наборах данных и многие другие);
- диаграммы рассеяния (включая составные, с двойной осью Y, диаграммы частот, маркированные, с отмеченными точками, взвешенные, диаграммы Вороного, одно- и двухмерные категоризированные составные диаграммы рассеяния, матричные диаграммы рассеяния, XYZ диаграммы рассеяния, тернарные диаграммы рассеяния, диаграммы рассеяния в полярных координатах, диаграммы рассеяния сложных подгрупп, в которых каждое подмножество данных определяется исходя из заданных условий выбора, составные диаграммы рассеяния с гистограммами или диаграммами размаха, диаграммы рассеяния квантилей для сравнения распределений, специализированные диаграммы рассеяния, в которых каждая точка данных представлена отдельным графическим файлом (BMP, WMF, JPG, PNG), пиктографики рассеяния, в которых точки данных помечены пиктограммами, показывающими связи между дополнительными переменными, например, небольшие круговые диаграммы или лица Чернова);
- линейные графики (включая, составные, агрегированные, маркированные, с двойной осью Y, трехмерные, ленточные);
- широкий набор 2М и 3М-функций подгонки и построения графиков, графики подгонки распределений (включая гибкие категоризированные и простые графики квантиль-квантиль и вероятность-вероятность для широкого спектра распределений);
- категоризованные и протые графики пропущенных данных/диапазонов, показывающие распределение пропущенных данных (или значений из пользовательского диапазона) по всему набору данных или подмножеству данных, заданному категоризацией;
- пиктографики (включая лица Чернова, звезды, лучи, многоугольники, круговые диаграммы, столбцы, линии и профили), матричные графики (включая квадратные или прямоугольные матрицы рассеяния, линий или столбцов и матрицы сложных подгрупп), 2М и 3М графики в треугольных координатах (тернарные) (включая диаграммы рассеяния, контуры (графики, спроецированные на плоскость), поверхности (с возможностью настройки параметров тернарной подгонки), тернарные поверхностные графики и графики отклонений, а также категоризованные (составные) 2М и 3М тернарные графики);
- категоризованные составные диаграммы двувходовых объединений (позволяющие создавать гибкие «кросстабуляции» составных диаграмм рассеяния, гистограмм, линейных графиков, функций подгонки, диаграмм размаха, круговых диаграмм, различных столбчатых, мозаичных графиков, графиков столбцов, диапазонов, отклонений и других специализированных графиков и их комбинаций, включая разнообразные составные (т.е. «категоризованные по…») 3М графики);
- широкий выбор 3М графиков, включая различные XYZ диаграммы рассеяния, пространственные графики, спектральные графики, диаграммы отклонений, графики лент, блоков, ящиков, 3М диаграммы размаха и составные диаграммы размаха (включая летящие блоки, летящие ящики, диапазоны двойных лент, граничные диапазоны, точечные диапазоны и диапазоны ошибки); различные пользовательские графики поверхностей с проецируемыми контурами, линейные графики, графики следа, контурные графики, графики функций, 3М круговые диаграммы и другие);
- специализированные составные 3М (4М) графики и многое другое. В 3М отображении поддерживается интерактивное вращение, изменение пропорций, перспективы и т.д. Кроме того, доступны 4М графики (например, составные графики поверхностей можно одновременно вращать на экране в любой перспективе).
Пользовательские графики:
- Все определения графиков и возможности настройки в STATISTICA можно использовать для определения новых типов графиков, которые будут добавлены в панель инструментов или меню.
Существует несколько способов определения новых графиков:
- Простейший способ создания нового графика (для многократного использования) состоит в следующем: создайте нужный график обычным образом, с помощью опций соответствующих диалоговых окон, затем нажмите кнопку Добавить как пользовательский график. STATISTICA попросит задать имя, после чего этот график будет добавлен в меню.
- Другой способ создания нового графика заключается в написании макроса (прямая запись или написание программы в редакторе STATISTICA Visual Basic). Новый макрос может соответствовать кнопке на панели инструментов, опции меню и «горячим клавишам».
STATISTICA Visual Basic
Предоставляет всесторонний доступ ко всем графическим процедурам STATISTICA. Даже создание составных графиков в STATISTICA Visual Basic не представляет большой сложности. Например, вы можете начать запись макроса, создав график интерактивно, а затем отредактировать полученный программный код. Проводник функций помогает быстро использовать графические функции. В STATISTICA Visual Basic можно определить график любой степени сложности и назначить ему отдельную кнопку, пункт меню или «горячую клавишу» для многократного использования. Существует бесконечное множество примеров применения STATISTICA Visual Basic, от простых линейных графиков (например, линейные графики для каждого наблюдения из файла данных, отображенные в одном окне) до новых, сложных типов специализированных графиков, технических рисунков и диаграмм, связанных с наборами данных.
Доступные инструменты (графические примитивы) позволяют создавать абсолютно новые графические структуры. STATISTICA Visual Basic можно использовать для автоматизации ежедневных задач изменения и настройки существующих графиков (например, вы можете разработать библиотеку собственных процедур настройки графики). С помощью STATISTICA Visual Basic можно создавать сложные составные графические документы с ActiveX/OLE-связями (включая вложенные документы), диаграммы связанные с данными (которые могут обновляться и перерисовываться простым нажатием кнопки) и много других типов отображения информации. Графический вывод данных можно осуществлять напрямую по всем возможным каналам, окнам, рабочим книгам, отчетам. Возможна автоматическая печать, сохранение и комбинирование с документами других приложений (например, с документом Word или таблицей Excel) Ваши собственные графические процедуры можно добавить в систему STATISTICA для многократного использования, назначив их выбранным элементам управления.
Программное обеспечение STATISTICA Base представляет собой комплект инструментов всестороннего статистического анализа, менеджмента, добычи и визуализации данных. STATISTICA Base объединяет широкий набор основных статистик и методов разведочного анализа.
В состав пакета STATISTICA Base входят:
- Полный набор графических инструментов STATISTICA.
- Описательные и внутригрупповые статистики, разведочный анализ данных.
- Корреляции.
- Быстрые основные статистики и блоковые статистики.
- Интерактивный вероятностный калькулятор.
- T-критерии (и другие критерии групповых различий).
- Таблицы частот, сопряженности, флагов и заголовков, анализ многомерных откликов.
- Множественная регрессия.
- Непараметрические статистики.
- Общая модель дисперсионного и ковариационного анализа.
- Подгонка распределений.
Решение STATISTICA Base основано на современных технологиях, полностью соответствуя последним достижениям в области IT. Продукт STATISTICA Base позволяет решать любые задачи в области анализа и обработки данных в маркетинге, финансах, страховании, экономике, бизнесе, промышленности, медицине и т. д.
Компоненты STATISTICA Base:
- Графические инструменты STATISTICA. Программа содержит большое количество категорий и типов графиков (включая деловые, научные, двухмерные и трехмерные графики в различных системах координат, специализированные статистические графики – гистограммы, матричные, категорированные и др.). Предусмотрены разнообразные инструменты настройки всех компонент графиков.
- Описательные и внутригрупповые статистики, разведочный анализ данных. STATISTICA Base вычисляет многие используемые описательные статистики общего характера: медиану, моду, квартили, заданные пользователем процентили, среднее значение и стандартное отклонение, квартильный размах, доверительные интервалы для среднего, асимметрию и эксцесс (и их стандартные ошибки), гармоническое и геометрическое среднее, а также многие специальные описательные статистики. Многие описательные статистики и графики могут быть построены для данных, категоризованных по значениям одной или нескольких группирующих переменных.
- Корреляции. В системе реализован большой набор методов для исследования корреляций между переменными.
- Быстрые основные статистики и блоковые статистики. Интерактивные средства позволяют одним щелчком мыши вычислять основные статистики и строить графики в любой момент в течение сеанса работы. Все входные и выходные таблицы системы поддерживают функции «Блоковые статистики» и «Блоковые статистические графики». Опции выдают статистики и статистические графики для произвольного выделенного блока ячеек в таблице исходных данных или таблице результатов.
- Интерактивный вероятностный калькулятор. Калькулятор вероятностных распределений поддерживает множество типов стандартных распределений (бета, Коши, хи-квадрат, экспоненциальное, экстремальное (Гумбеля), F, гамма, Лапласа, логнормальное, логистическое, Парето, Релея, t (Стьюдента), Вейбулла и Z (нормальное)).
- T-критерии (и другие критерии групповых различий). Программа позволяет вычислять T-критерии для зависимых и независимых выборок, а также многомерный критерий T 2 Хотеллинга.
- Таблицы частот, сопряженности, флагов и заголовков, анализ многомерных откликов. В системе есть множество средств табуляции непрерывных и категориальных переменных, переменных множественного отклика и многомерных дихотомий. Вид таблиц и формат данных регулируется различными функциями.
- Методы множественной регрессии. Модуль содержит полный набор методов линейной и фиксированной нелинейной регрессии.
- Непараметрические статистики. Модуль содержит полный набор непараметрических статистик.
- Общая модель дисперсионного и ковариационного анализа. Реализованы методы общего одномерного и многомерного дисперсионного и ковариационного анализа. Методы являются подмножеством общих линейных моделей, в которых можно обрабатывать планы практически неограниченной сложности.
- Подгонка распределений. Опции позволяют сравнивать существующее распределение переменной с различными теоретическими распределениями.
Новое в STATISTICA 10:
- Возможность параллельной работы на многоядерных процессорах, использование преимуществ аппаратного ускорения для обработки графики.
- Интеграция и обмен данными с SharePoint.
- Импорт файлов из Microsoft Office 2007 и 2010 с полным сохранением форматирования.
- Получение данных не только из внешних систем, таких как поставщик данных Microsoft OLE DB, но и из хранилищ бизнес-информации SAP Business Warehouse.
- Продукт STATISTICA PI включен в комплект поставки – отдельная установка и настройка не требуются.
- Новые процедуры расслоения, закрашивания и сглаживания линий, кривых и поверхностей.
- Возможность интерактивного изменения и настройки всех графических документов STATISTICA 10.
- Интерактивное масштабирование и прокрутка всех осей графиков.
- Поддержка опции «Прозрачность», что позволяет управлять областью графика и удалять лишние точки маркеров.
- Интерактивная правка текста непосредственно в окне графика.
- Обновленная лента пользовательского интерфейса, которую теперь можно настраивать с помощью прикладного программного интерфейса.
Скачать дистрибутив
STATISTICA Base
Раздел:
StatSoft
STATISTICA Base
|
|
|||
|
|||
|
Мы используем куки (cookies) с целью повышения удобства вашей работы с сайтом.
Продолжая работу с сайтом, вы соглашаетесь с нашей
политикой конфиденциальности.
Пройдите тест, узнайте какой профессии подходите
Работать самостоятельно и не зависеть от других
Работать в команде и рассчитывать на помощь коллег
Организовывать и контролировать процесс работы
Введение в Statistica
Statistica — это мощное программное обеспечение для анализа данных и статистики, разработанное компанией StatSoft. Оно широко используется в различных отраслях для обработки, анализа и визуализации данных. Программа предоставляет пользователям инструменты для выполнения сложных статистических расчетов и построения моделей, что делает её незаменимой для исследователей, аналитиков и ученых. В современном мире, где данные играют ключевую роль в принятии решений, Statistica становится важным инструментом для тех, кто хочет получить глубокие и точные инсайты из своих данных.

Основные функции и возможности
Statistica предлагает широкий спектр функций и возможностей, которые делают её универсальным инструментом для анализа данных. Программа поддерживает работу с различными типами данных и предоставляет мощные инструменты для их обработки и анализа.
Анализ данных
Statistica позволяет проводить различные виды анализа данных, включая описательную статистику, регрессионный анализ, факторный анализ и кластерный анализ. Эти инструменты помогают пользователям выявлять закономерности и тенденции в данных. Например, описательная статистика позволяет получить общую картину данных, в то время как регрессионный анализ помогает выявить зависимости между переменными. Факторный анализ используется для выявления скрытых факторов, влияющих на данные, а кластерный анализ помогает группировать объекты на основе их сходства.
Визуализация данных
Программа предоставляет мощные инструменты для визуализации данных, такие как гистограммы, диаграммы рассеяния, коробчатые диаграммы и тепловые карты. Визуализация помогает лучше понять данные и представить результаты анализа в наглядной форме. Например, гистограммы позволяют увидеть распределение данных, диаграммы рассеяния показывают взаимосвязь между двумя переменными, а тепловые карты помогают выявить области с высокой концентрацией значений. Визуализация данных также облегчает коммуникацию результатов анализа с коллегами и заинтересованными сторонами.
Моделирование и прогнозирование
Statistica включает инструменты для построения и оценки моделей, такие как регрессионные модели, модели временных рядов и нейронные сети. Эти инструменты позволяют пользователям делать прогнозы и принимать обоснованные решения на основе данных. Например, регрессионные модели используются для прогнозирования значений зависимой переменной на основе значений независимых переменных, модели временных рядов помогают прогнозировать будущие значения на основе исторических данных, а нейронные сети используются для решения сложных задач, таких как классификация и распознавание образов.
Обработка больших данных
Программа поддерживает работу с большими объемами данных и интеграцию с различными базами данных, что делает её подходящей для анализа данных в крупных организациях. Statistica позволяет обрабатывать данные из различных источников, таких как базы данных, электронные таблицы и текстовые файлы. Это делает программу универсальным инструментом для анализа данных в различных отраслях и сферах деятельности.
Примеры использования в различных отраслях
Statistica находит применение в различных отраслях, где требуется анализ данных и принятие обоснованных решений на основе результатов анализа. Рассмотрим несколько примеров использования программы в различных сферах.
Наука и исследования
В научных исследованиях Statistica используется для анализа экспериментальных данных, построения моделей и проверки гипотез. Например, биологи могут использовать программу для анализа данных о популяциях животных, а медики — для изучения эффективности новых лекарств. Statistica помогает ученым проводить сложные статистические расчеты и визуализировать результаты исследований, что облегчает интерпретацию данных и принятие решений.
Бизнес и маркетинг
В бизнесе и маркетинге Statistica помогает анализировать данные о продажах, поведении клиентов и эффективности рекламных кампаний. Например, маркетологи могут использовать программу для сегментации рынка и определения целевых аудиторий. Statistica позволяет анализировать данные о покупательских предпочтениях, выявлять тенденции и прогнозировать поведение клиентов, что помогает компаниям разрабатывать эффективные маркетинговые стратегии и повышать прибыльность бизнеса.
Производство и качество
В производственных процессах Statistica используется для контроля качества продукции и оптимизации производственных процессов. Например, инженеры могут анализировать данные о дефектах продукции и выявлять причины их возникновения. Statistica помогает улучшать качество продукции, снижать затраты на производство и повышать эффективность производственных процессов. Программа также позволяет проводить анализ данных о производительности оборудования и выявлять узкие места в производственном процессе.
Образование
В образовательных учреждениях Statistica применяется для анализа данных о студентах, успеваемости и эффективности образовательных программ. Например, администраторы могут использовать программу для оценки результатов экзаменов и планирования учебных программ. Statistica помогает выявлять факторы, влияющие на успеваемость студентов, и разрабатывать меры по улучшению качества образования. Программа также позволяет анализировать данные о посещаемости и активности студентов, что помогает улучшать учебный процесс и повышать успеваемость.
Преимущества и недостатки
Преимущества
- Мощные аналитические инструменты: Statistica предоставляет широкий спектр инструментов для анализа данных, что делает её универсальным решением для различных задач. Программа поддерживает различные методы анализа данных, что позволяет пользователям выбирать наиболее подходящие инструменты для решения своих задач.
- Интуитивный интерфейс: Программа имеет удобный и интуитивно понятный интерфейс, что облегчает её использование даже для новичков. Пользователи могут быстро освоить основные функции программы и начать анализ данных без необходимости долгого обучения.
- Гибкость и масштабируемость: Statistica поддерживает работу с большими данными и интеграцию с различными базами данных, что делает её подходящей для крупных организаций. Программа позволяет обрабатывать данные из различных источников и масштабировать анализ в зависимости от потребностей пользователей.
- Поддержка различных типов данных: Программа может работать с различными типами данных, включая числовые, категориальные и временные ряды. Это делает Statistica универсальным инструментом для анализа данных в различных отраслях и сферах деятельности.
Недостатки
- Стоимость: Statistica является коммерческим программным обеспечением, и её стоимость может быть высокой для небольших организаций и частных пользователей. Это может ограничивать доступ к программе для некоторых пользователей, особенно для тех, кто работает в небольших компаниях или на индивидуальной основе.
- Крутая кривая обучения: Несмотря на интуитивный интерфейс, освоение всех возможностей программы может занять время, особенно для пользователей без опыта в статистике. Пользователям может потребоваться время и усилия для изучения всех функций и инструментов программы, что может быть сложным для новичков.
Как начать работу с Statistica
Установка и настройка
Для начала работы с Statistica необходимо скачать и установить программу с официального сайта StatSoft. После установки потребуется активировать лицензию. Процесс установки и активации программы достаточно прост и не требует специальных навыков. Пользователи могут следовать инструкциям на официальном сайте для успешной установки и настройки программы.
Обучающие материалы
Для освоения программы рекомендуется воспользоваться обучающими материалами, доступными на официальном сайте и в интернете. Существуют различные руководства, видеоуроки и курсы, которые помогут вам быстро освоить основные функции и возможности Statistica. Обучающие материалы охватывают широкий спектр тем, от базовых функций до продвинутых методов анализа данных, что позволяет пользователям выбирать наиболее подходящие ресурсы для своего уровня подготовки.
Примеры и шаблоны
Statistica предоставляет множество примеров и шаблонов, которые можно использовать для начала работы. Эти примеры помогут вам понять, как использовать различные инструменты программы для анализа данных. Например, вы можете найти примеры анализа данных о продажах, экспериментах или производственных процессах. Шаблоны позволяют быстро настроить анализ данных и начать работу с программой без необходимости создавать всё с нуля.
Практика и эксперименты
Лучший способ освоить Statistica — это практика. Начните с простых задач и постепенно переходите к более сложным. Экспериментируйте с различными функциями и инструментами, чтобы лучше понять их возможности и применение. Практика поможет вам приобрести навыки работы с программой и научиться эффективно использовать её для решения своих задач. Не бойтесь пробовать новые методы анализа данных и экспериментировать с различными настройками программы.
Statistica — это мощный и универсальный инструмент для анализа данных, который может быть полезен в различных отраслях. С его помощью вы сможете проводить сложные статистические расчеты, визуализировать данные и строить прогнозные модели. Начните с установки программы и изучения обучающих материалов, и вскоре вы сможете использовать все возможности Statistica для решения своих задач. Программа поможет вам получить глубокие и точные инсайты из ваших данных, что позволит принимать обоснованные решения и достигать успеха в вашей деятельности.
Читайте также
11.5. Пакет STATISTICA
Пакет STATISTICA – универсальный статистический пакет компании StatSoft Inc1. Первая версия пакета (STATISTICA for DOS) была выпущена в 1991 г. На сегодняшний день разработана 9-я версия пакета (STATISTICA 9). Русифицирована только 6-я версия (STATISTICA 6).
Стандартную комплектацию пакета STATISTICA составляют три модуля, которые могут приобретаться как единым пакетом, так и отдельно.
- Базовый пакет STATISTICA Base предоставляет обширные возможности выбора основных типов статистического анализа. Для эффективной работы базового пакета требуется как минимум 256 MB оперативной памяти. Минимальные требования к скорости процессора – 500 MHz.
- Модуль Линейные и Нелинейные Модели (Advanced Linear/NonLinearModels) содержит большой набор инструментов для моделирования и прогнозирования, включая возможности автоматического выбора модели и расширенные интерактивные средства визуализации.
- Модуль Многомерные разведочные технологии анализа (Multivariate Exploratory Techniques) служит для применения разведочного анализа различных типов данных в сочетании с интерактивными средствами визуализации.
Помимо общих статистических и графических средств в системе имеются специализированные модули, например, для проведения социологических или биомедицинских исследований, решения технических и промышленных задач, – карты контроля качества, модули анализа процессов и планирования эксперимента.
Разработчики STATISTICA утверждают, что пакет может применяться для решения задач в таких областях, как:
- НИОКР, контроль качества, процесс мониторинга в химической, фармацевтической промышленности и в производстве потребительских товаров;
- гарантийный анализ и приложения для удаленного мониторинга в обрабатывающей промышленности;
- анализ рисков, сегментация потребителей и оценка кредитоспособности заемщиков в банковской сфере, в сфере предоставления финансовых услуг и в страховой деятельности.
Возможны различные варианты установки пакета в зависимости от целей и задач пользователя:
- однопользовательская версия (Single-User);
- сетевая версия (Concurrent Network) для работы в локальных вычислительных сетях;
- Enterprise – версия для применения в вычислительных системах и крупных организациях
- Web-Based – версия для использования в крупных сетях через веббраузер.
Пакет предоставляет пользователям следующие возможности статистического анализа данных:
- исследование корреляций между переменными;
- диаграмма рассеяния, матричная диаграмма рассеяния;
- быстрые основные статистики и блоковые статистики (интерактивные средства, позволяющие одним щелчком мыши вычислять основные статистики и строить графики в любой момент в течение сеанса работы);
- интерактивный калькулятор вероятностных распределений (позволяет интерактивно исследовать структуру распределений, например, зависимость вероятности от параметров);
- анализ многомерных откликов, многомерное шкалирование;
- анализ при помощи временных рядов и прогнозирование временных зависимостей, в том числе анализ сезонных колебаний.
Достоинства STATISTICA:
- реализован обмен данными между STATISTICAи Windows-приложениями;
- результаты анализа в виде графиков, таблиц и текста могут быть сохранены в файле с форматом RTF, который открывается и редактируется в MS Word;
- возможность расширения системы при помощи создания программ на встроенном в STATISTICA языке программирования;
- исходные данные из MS Excel можно легко импортировать в STATISTICA;
- возможность записи макросов для автоматизации выполнения однотипных задач;
- программа способна обрабатывать большие массивы данных – базы данных с числом переменных до 32 000 и практически неограниченным числом наблюдений.
В пакете представлены несколько сотен типов графиков 2D, 3D и 4D, матрицы и пиктограммы; предоставляется возможность разработки собственного дизайна графика. Средства управления графиками позволяют работать одновременно с несколькими графиками, изменять размеры сложных объектов, добавлять художественную перспективу и ряд специальных эффектов, разбивку страниц и быструю перерисовку. Например, 3D-графики можно вращать, накладывать друг на друга, сжимать или увеличивать9Дюк В., Самойленко А. Data Mining: учебный курс (+CD). – СПб: Изд. Питер,
2001..
STATISTICA обладает огромными возможностями для построения графиков непосредственно из таблиц исходных данных и таблиц результатов. Построение графических объектов и анализ данных в пакете тесно интегрированы. После получения результатов статистического анализа их можно с легкостью представить графически посредством команды Быстрые статистические графики. В разных модулях системы имеются свои специальные графики, учитывающие особенности получаемых в них результатов10Борисова С.Ф. Компьютер и Интернет для социолога [электронный ресурс] : учеб. пособие-справочник / С.Ф. Борисова. – Н. Новгород, 2002. – URL: http://www.unn.ru/rus/f14/k2/courses/borisova.htm (29.07.10)..
Начинающие пользователи могут начать работу со специальной версии, разработанной для обучения основам статистических методов – Studеnt Еditiоn оf STATISTICA. Эта версия представляет собой урезанный вариант пакета и позволяет анализировать файлы данных, включающих не более 400 наблюдений.
Внешний вид диалогового окна STATISTICA представлен на рис.11.5.
11.6. Пакет STATGRAPHICS
Пакет STATGRAPHICS (STATistical GRAPHICs System)11Официальный сайт пакета STATGRAPHICS: http://www.statgraphics.com – универсальный статистический пакет компании Manugistics Inc12Официальный сайт компании Manugistics Inc.: www.manugistics.com. Первая версия пакета была выпущена в середине 80-х годов. На сегодняшний день разработана 5-я версия пакета Statgraphics Plus 5.1.
Рис.
11.5.
Диалоговое окно STATISTICA
Достоинства STATGRAPHICS:
- сочетание научных методов обработки разнотипных данных с возможностью создания современной высококачественной интерактивной графики;
- широкие возможности взаимодействия с другими программными продуктами (электронными таблицами, базами данных);
- высококачественная двумерная и трехмерная графика,
- интегрированная графика, предполагающая, что все элементы графических представлений результатов анализа могут быть преобразованы. После завершения процедуры статистического анализа данных можно выбрать графические отображения результатов, релевантные используемой процедуре анализа.
В STATGRAPHICS графика из средства презентации результатов анализа превращается в аналитический инструмент: можно идентифицировать точку на графическом отображении и выяснить ее местонахождение в файле данных или вращать и рассматривать с разных сторон трехмерные изображения, осуществлять разгонку точек на диаграммах рассеяния и т. п.13Обработка данных на ПК в примерах / В. Дюк . – СПб. : Питер, 1997 . – 240 с.1
В STATGRAPHICS существует возможность сохранения результатов работы и создания собственных статистических проектов. После завершения анализа пользователь может сохранить последовательность выбранных методов, параметры статистических процедур, виды графических отображений результатов анализа, табличные формы, комментарии и пр. в отдельном файле. Сохраненную схему анализа можно будет автоматически применять к другому множеству данных.
Внешний вид диалогового окна STATGRAPHICS представлен на рис.11.6
Рис.
11.6.
Диалоговое окно STATGRAPHICS