Как сделать случайную выборку в excel из списка?

1. ВведениеГенеральная совокупность – множество всех объектов, относительно которых предполагается делать выводы при изучении конкретной задачи.Выборка – часть генеральной совокупности, которая…

Статистическое распределение выборки. Полигон. Гистограмма

Пусть из генеральной совокупности извлечена выборка, причем Генеральная совокупность и выборка, наблюдалось Генеральная совокупностьраз, Генеральная совокупность раз, Генеральная совокупностьраз и Генеральная совокупность объем выборки. Наблюдаемые значения Генеральная совокупность называются вариантами, а последовательность вариант, записанная в возрастающем порядке,— вариационным рядом. Числа наблюдений Генеральная совокупность называют частотами, а их отношения к объему выборки Генеральная совокупностьГенеральная совокупность — относительными частотами. Отметим, что сумма относительных частот равна единице:

Генеральная совокупность

Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот. Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот (непрерывное распределение). В качестве частоты, соответствующей интервалу, принимают сумму частот вариант, попавших в этот интервал.

Заметим, что в теории вероятностей под распределением понимают соответствие между возможными значениями случайной величины и их вероятностями, а в математической статистике — соответствие между наблюдаемыми вариантами и их частотами или относительными частотами.

Пример:

Перейдем от частот к относительным частотам в следующем распределении выборки объема n = 20:

Генеральная совокупность

Найдем относительные частоты:

Генеральная совокупность

Поэтому получаем следующее распределение:

Генеральная совокупность

Для графического изображения статистического распределения используются полигоны и гистограммы.

Для построения полигона в декартовых координатах на оси Ох откладывают значения вариант Генеральная совокупность на оси Оу— значения частот Генеральная совокупность (относительных частот Генеральная совокупность).

Пример:

Рис. 14 представляет собой полигон следующего распределения:

Генеральная совокупность

Полигоном обычно пользуются в случае небольшого количества вариант. В случае большого количества вариант и в случае непрерывного распределения признака чаще строят гистограммы. Для этого интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов шириной h и находят для каждого частичного интервала Генеральная совокупность — сумму частот вариант, попавших в і-й интервал. Затем на этих интервалах как на основаниях строят прямоугольники с высотами Генеральная совокупность (или Генеральная совокупность, где n —объем выборки). Площадь i-го частичного прямоугольника равна Генеральная совокупность

Генеральная совокупностьГенеральная совокупность

(или Генеральная совокупность). Следовательно, площадь гистограммы равна сумме всех частот (или относительных частот), т. е. объему выборки (или единице).

Пример:

Рис. 15 показывает гистограмму непрерывного распределения объема n =100, заданного следующей таблицей:

Генеральная совокупность

Основные определения

Понятие выборки используется, когда надо изучить какие-либо свойства совокупности объектов. Свойства объектов можно разделить на качественные и количественные.

Пример 1

Пусть нам необходимо изучить совокупность партии сметаны. Тогда качественным признаком может служить срок её годности, а количественным процент содержания жиров в данной сметане.

Совокупность или выборка может быть разделена на генеральную и выборочную.

Определение 1

Генеральная совокупность — совокупность случайно отобранных объектов данного вида, над которыми проводят наблюдения с целью получения конкретных значений случайной величины, проводимых в неизменных условиях при изучении одной случайной величины данного вида.

Определение 2

Выборочная совокупность — часть отобранных объектов из генеральной совокупности.

С понятием совокупности также связано понятие объема данной совокупности.

Определение 3

Объем совокупности — число объектов этой совокупности.

Понятие объема совокупности относится и к выборочной, и к генеральной совокупности.

Пример 2

Пусть из партии 100 пачек масла для исследования выбрано 10 пачек. Тогда объем генеральной совокупности $N=100$, а объем выборки $n=10$.

Примечание 1

Исходя из первых двух определений, очевидно, что всегда выполняется неравенство $N>n$

Помимо этих двух совокупностей выделяют также репрезентативную или представительную выборку.

Определение 4

Репрезентативная (представительная) выборка — выборка, в которой все объекты выбраны случайно и генеральной совокупности, то есть каждый объект генеральной совокупности имеет одинаковую вероятность попасть в выборку.

Выборка также может быть повторной и бесповторной.

Определение 5

Повторная выборка — выборка, при которой выбранный объект возвращается обратно в генеральную совокупность перед выбором следующего объекта для исследования.

Определение 6

Бесповторная выборка — выборка, при которой объект не возвращается обратно в генеральную совокупность перед выбором очередного объекта для исследования.

Советы

  • Если на компьютере нет Microsoft Excel, в интернете есть другие аналогичные бесплатные программы (например, Google Таблицы или Outlook Excel), в которых можно создать случайную выборку.
  • Существуют мобильные версии Excel для iPhone и Android-устройств, поэтому создавать электронные таблицы можно «на ходу».

Что такое выборка в Excel и как ее делать

Выборка данных состоит в процедуре отбора из общего массива тех результатов, которые удовлетворяют заданным условиям, с последующим выводом их на листе отдельным списком или в исходном диапазоне.

Случайная выборка из генеральной совокупности в MS EXCEL

Инструмент Пакета анализа MS EXCEL «Выборка» извлекает случайную выборку из входного диапазона, рассматривая его как генеральную совокупность. Также случайную выборку можно извлечь с помощью формул.

Пусть имеется некая совокупность данных, которая слишком велика для обработки или построения диаграммы. Для этих целей можно использовать репрезентативную выборку из данной совокупности.

Данную выборку можно получить с помощью инструмента «Выборка» надстройки Пакет анализа (Analysis ToolPak).

Надстройка доступна из вкладки Данные, группа Анализ.
stat-01.png

СОВЕТ: Подробнее о других инструментах надстройки Пакет анализа и ее подключении – читайте в статье Надстройка Пакет анализа MS EXCEL.

Предупреждения

  • Если не пользоваться случайной выборкой для получения результата (например, при опросе после обновления услуг), он будет предвзятыми и, следовательно, неточными.

Строим ось значимости


rasdel1.gif
                                                 image064.gif


        image066.gif
image068.gif

image069.gif


rasdel2.gif
image071.gif

image073.gif

image075.gif

image077.gif

 

Как сделать выборку в Excel из списка с условным форматированием

Если Вы работаете с большой таблицей и вам необходимо выполнить поиск уникальных значений в Excel, соответствующие определенному запросу, то нужно использовать фильтр. Но иногда нам нужно выделить все строки, которые содержат определенные значения по отношению к другим строкам. В этом случаи следует использовать условное форматирование, которое ссылается на значения ячеек с запросом. Чтобы получить максимально эффективный результат, будем использовать выпадающий список, в качестве запроса. Это очень удобно если нужно часто менять однотипные запросы для экспонирования разных строк таблицы. Ниже детально рассмотрим: как сделать выборку повторяющихся ячеек из выпадающего списка.

Формулы, связанные с понятием выборки

Введем несколько формул:

  1. Генеральная средняя при повторной выборке:

Отметим, что $sum{N_i}=N$

  1. Генеральная средняя при бесповторной выборке:
  1. Выборочная средняя при повторной выборке:

Отметим, что $sum{n_i}=n$

  1. Выборочная средняя при бесповторной выборке:
  1. Ошибка репрезентативности:

Как выбрать случайные строки в Excel

Если ваш рабочий лист содержит более одного столбца данных, вы можете получить набор значений следующим образом: назначить какое-то число каждой строке, отсортировать эти числа и выбрать необходимое количество строк. Подробные инструкции приведены ниже.

  1. Вставьте новый столбец справа или слева от вашей таблицы (столбец D в этом примере).
  2. В первой ячейке вставленного столбца, исключая заголовки столбцов, введите формулу =СЛЧИС()
  3. Дважды щелкните маркер заполнения, чтобы скопировать формулу вниз по столбцу. В результате в каждой строке будет записано случайное число.
  4. Сортировка этих чисел от наибольшего к наименьшему (сортировка в порядке возрастания переместит заголовки столбцов в нижнюю часть таблицы, поэтому обязательно выполняйте сортировку по убыванию). Для этого перейдите на вкладку Данные в группу Сортировка и фильтр и нажмите кнопку Сортировка. Excel автоматически расширит выделение и предложит выбрать столбец и порядок сортировки.

Вы можете для экономии времени использовать кнопки сортировки АЯ или ЯА, но при этом курсор нужно обязательно установить на столбец с формулой СЛЧИС(). Заголовок колонки желательно написать по-русски, иначе он имеет шансы переместиться в конец таблицы.

Теперь осталось нажать ОК, и строки таблицы будут пересортированы и произвольно перемешаны.

Пусть вас не смущает тот факт, что после сортировки по столбцу D вы видите в нем совершенно не упорядоченные числа. Дело в том, что сортировка меняет порядок строк, и тут же вновь происходит пересчёт всех формул СЛЧИС(). Но ведь наша задача не отсортировать, а произвольно перемешать строки,  не так ли?

Если вас не совсем устраивает рандомизация вашей таблицы, нажмите кнопку сортировки еще раз, чтобы вновь перемешать её. 

  1. Наконец, выберите необходимое количество строк для вашей выборки, скопируйте их в буфер обмена и вставьте куда хотите.

Об этой статье

Эту страницу просматривали 21 330 раз.

Как сделать случайную выборку в таблице Excel без повторов

Хотите сделать случайную выборку и являетесь продвинутым пользователем Excel? Можно создать простую функцию на VBA, которая будет выдавать заданное количество случайных чисел из нужного интервала. Откроем редактор Visual Basic (ALT+F11 или в старых версиях Excel через меню Сервис – Макрос – Редактор Visual Basic), вставим новый модуль через меню Insert – Module и скопируем туда текст вот такой функции:

Function Lotto(Bottom As Integer, Top As Integer, Amount As Integer)      Dim iArr As Variant      Dim i As Integer      Dim r As Integer      Dim temp As Integer      Dim Out(1000) As Variant            Application.Volatile            ReDim iArr(Bottom To Top)      For i = Bottom To Top          iArr(i) = i      Next i            For i = Top To Bottom + 1 Step -1          r = Int(Rnd() * (i — Bottom + 1)) + Bottom          temp = iArr(r)          iArr(r) = iArr(i)          iArr(i) = temp      Next i      j = 0      For i = Bottom To Bottom + Amount — 1          Out(j) = iArr(i)          j = j + 1      Next i            Lotto = Application.Transpose(Out)        End Function

У этой функции будет три аргумента для создания будущей выборки:

  • Bottom – нижняя граница интервала случайных чисел выборки Excel.
  • Top – верхняя граница интервала случайных чисел выборки.
  • Amount – количество случайных чисел, которое мы хотим отобрать из интервала для нашей выборки.

Т.е., например, чтобы отобрать для выборки 5 случайных чисел от 10 до 100, нужно будет ввести =Lotto(10;100;5)

Добавим к нашему списку в Excel столбец с нумерацией и будем делать выборку людей по случайным номерам, которые генерирует функция Lotto.

эксперт

Мнение эксперта

Михаил Соловьев, консультант по вопросам работы с продуктами Microsoft

Если у вас возникнут сложности, я помогу разобраться!

Задать вопрос эксперту

Наша функция Lotto должна быть введена как формула массива, т.е. сначала необходимо выделить диапазон ячеек результатов (D2:D6) затем ввести нашу функцио Lotto и, после ввода аргументов функции, нажать Ctrl+Shift+Enter, чтобы ввести эту функцию именно как функцию массива во все выделенные ячейки. Если же что-то непонятно, обращайтесь ко мне, и я помогу разобраться.

Ну, а дальше останется при помощи уже знакомой функции ВПР <font>(VLOOKUP)</font> вытащить имена из списка, соответствующие случайным номерам.

Рейтинг
( 1 оценка, среднее 5 из 5 )
Загрузка ...