Stata - Stata

Stata
Stata logo med blue.png
Оригинальный автор (ы)Уильям Гулд[1]
Разработчики)StataCorp
изначальный выпуск1985 (1985)
Стабильный выпуск
16.1 / 18 февраля 2020 г.; 9 месяцев назад (2020-02-18)
Написано вC
Операционная системаWindows, macOS, Linux
Типстатистический анализ
ЛицензияПроприетарный
Интернет сайтwww.stata.com

Stata универсальный статистический программный комплекс, созданный в 1985 году компанией StataCorp. Большинство его пользователей работают в исследование, особенно в областях экономика, социология, политическая наука, биомедицина, и эпидемиология.[2]

Возможности Stata включают управление данными, статистический анализ, графики, моделирование, регрессию и индивидуальное программирование. Он также имеет систему для распространения программ, написанных пользователями, что позволяет ему непрерывно расти.

Название Stata это слоговая аббревиатура слов статистика и данные.[3] В Часто задаваемые вопросы для официального форума Stata настаивает на том, чтобы правильное английское произношение Stata «должно оставаться загадкой»; любые из «Stay-ta», «Sta-ta» или «Stah-ta» (рифмы трех вариантов произношения слова «data») считаются приемлемыми. Более поздние обновления показывают, что сотрудники Stata произносят это слово /ˈsттə/. [3]

Каждая версия Stata состоит из четырех основных сборок:[4]

  • Stata / MP для многопроцессорных компьютеров (включая двухъядерные и многоядерные процессоры)
  • Stata / SE для больших баз данных
  • Stata / IC, стандартная версия
  • Numerics by Stata, поддерживает любой из размеров данных, перечисленных выше, во встроенной среде

Small Stata, которая была уменьшенной студенческой версией только для образовательных целей, больше не доступна.

Пользовательский интерфейс

Stata всегда уделяла особое внимание интерфейсу командной строки, который облегчает воспроизводимый анализ. Однако, начиная с версии 8.0, Stata включает графический интерфейс пользователя на основе Фреймворк Qt который использует меню и диалоговые окна чтобы предоставить доступ почти ко всем встроенным командам. Это генерирует код, который всегда отображается, облегчая переход к Интерфейс командной строки и более гибкий язык сценариев. Набор данных можно просматривать или редактировать в формате электронной таблицы. Начиная с версии 11, другие команды могут выполняться, пока открыт браузер данных или редактор.

Структура и хранение данных

До выхода версии 16[5], Стата мог открыть только один набор данных в любое время. Stata хранит наборы данных в (произвольный доступ или же виртуальный ) память, что ограничивает ее использование чрезвычайно большими наборами данных. Это в некоторой степени смягчается эффективным внутренним хранилищем, поскольку существуют целочисленные типы хранилищ, которые занимают только один или два байта, а не четыре, и одинарная точность (4 байта), а не двойная точность (8 байтов) используется по умолчанию для плавающая точка числа.

Набор данных всегда имеет прямоугольный формат, то есть все переменные содержат одинаковое количество наблюдений (в математических терминах все векторы имеют одинаковую длину, хотя некоторые записи могут быть недостающие значения ).

Совместимость форматов данных

Stata может импортировать данные в различных форматах. Это включает в себя ASCII форматы данных (например, CSV или же банк данных форматы) и форматы электронных таблиц (включая различные Excel форматы).

Собственная форматы файлов со временем изменились, хотя не каждый выпуск Stata включает новый формат набора данных. Каждая версия Stata может читать все старые форматы наборов данных и может записывать как текущий, так и самый последний предыдущий формат набора данных, используя сохранить старый команда.[6] Таким образом, текущая версия Stata всегда может открывать наборы данных, созданные в более старых версиях, но более старые версии не могут читать наборы данных более нового формата.

Stata может читать и записывать наборы данных в формате SAS XPORT изначально, используя fdause и fdasave команды.

Некоторые другие эконометрический приложения, в том числе гретл, может напрямую импортировать форматы файлов Stata.

Расширяемость

Stata позволяет напрямую загружать из Интернета написанные пользователем команды, распространяемые в виде так называемых ado-файлов, которые затем становятся неотличимы для пользователя от встроенных команд. В этом отношении Stata сочетает расширяемость, которая чаще ассоциируется с пакетами с открытым исходным кодом, с функциями, обычно связанными с коммерческими пакетами, такими как проверка программного обеспечения, техническая поддержка и профессиональная документация. Некоторые написанные пользователем команды были позже приняты StataCorp, чтобы стать частью последующего официального выпуска после соответствующей проверки, сертификации и документации.

Сообщество пользователей

У Stata был активный список адресов электронной почты с августа 1994 года («Статалист», более 1000 сообщений в месяц), который был преобразован в веб-форум в марте 2014 года и до сих пор называется «Статалист».[3] Сотрудники StataCorp регулярно вносят свой вклад в Statalist. Его поддерживает Марчелло Пагано из Гарвардской школы общественного здравоохранения, а не сама StataCorp.

Статьи об использовании Stata и новых пользовательских командах публикуются в ежеквартальном рецензируемый Stata Journal. В Stata Journal - это ежеквартальное издание, содержащее статьи о статистике, анализе данных, методах обучения и эффективном использовании языка Stata.

Встречи групп пользователей проводятся ежегодно в США (конференция Stata), Великобритании, Германии и Италии и реже - в некоторых других странах. StataCorp LP принимает только ежегодную конференцию Stata, проводимую в США. Местные дистрибьюторы Stata проводят встречи групп пользователей в своих странах, однако разработчики Stata часто приезжают на эти встречи и присутствуют на них. Сингапурская группа пользователей Stata, созданная в соответствии с Законом об обществах 10 мая 2008 года, является первой в мире группой пользователей, одобренной правительством (регистрационный номер: 2048/2008; уникальный номер юридического лица: T08SS0091A). Его слоган - «Осмысленное формирование данных». Как некоммерческая организация StataUGS не организует регулярных встреч, но предоставляет пользователям в Сингапуре советы по программированию и статистике неформальными средствами. Активные члены StataUGS в основном занимаются биомедицинскими исследованиями.

Пример кода Stata

Выполнить линейный (OLS) регресс из у на Икс:

регресс у х [если]

Необязательная часть если позволяет ограничить выборку, используемую в команде, подмножеством. Например, если команда должна применяться только к женщинам в выборке, можно указать: if female == 1.

Выполнить логистическая регрессия из у на Икс:

 логистика у х

Чтобы отобразить диаграмма рассеяния из у против Икс ограничено ценностями Икс ниже 10:

 разбросать у х если Икс < 10

Чтобы выполнить регрессию OLS у на Икс с белыми стандартные ошибки, согласованные с гетероскедастичностью:

 регресс у х, vce(крепкий)

Чтобы вычислить информационный критерий Акаике (AIC) и байесовский информационный критерий (BIC) для регрессии:[7]

 Estat IC

Кодировать "шипение ":

программа определить fizzbuzzаргументы Иксforvalues я = 1/`х ' {если мод(`я ',15) == 0 {отображать "fizzbuzz"		}иначе если мод(`я ',5) == 0 {отображать "гул"		}иначе если мод(`я ',3) == 0 {отображать "шипучка"		}еще {отображать `я '		}	}конец

Хронология релизов

С 2000 года StataCorp выпускает новый основной выпуск Stata (увеличивающий целую часть номера версии) примерно каждые два года. Пользователи должны заплатить комиссию, если они хотят обновить до последней основной версии. Незначительные выпуски (с увеличением десятичной части номера версии) иногда становятся доступными между основными выпусками. Они доступны в виде бесплатных загружаемых обновлений для тех, у кого есть лицензия на предыдущий основной выпуск. Даты всех релизов доступны на сайте Stata.[8] Stata 16 был выпущен 26 июня 2019 года.

Статы управление версиями система разработана для обеспечения очень высокой степени Обратная совместимость, гарантируя, что код, написанный для предыдущих выпусков, продолжает работать.[9] Однако пользователям следует быть осторожными, когда они сохраняют или открывают данные в разных версиях.

Смотрите также

Рекомендации

  1. ^ "Stata Journal | Статья". www.stata-journal.com.
  2. ^ "Кто использует Stata?". Stata. Получено 2017-06-28.
  3. ^ а б c «Справка - Статалист». www.statalist.org.
  4. ^ "Какой Stata мне подходит?". Stata. Получено 2010-04-04.
  5. ^ «Фреймы данных: несколько наборов данных в памяти». www.stata.com. Получено 2020-08-13.
  6. ^ «Stata 16 помогает сэкономить». www.stata.com.
  7. ^ «Выбор модели регрессии в Stata».
  8. ^ "Stata | FAQ: История Stata". www.stata.com.
  9. ^ "Справка по Stata 16 для версии". www.stata.com.

дальнейшее чтение

внешняя ссылка